生物信息学导论-北大-RNA-Seq数据分析

ref: https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home

本文主要来自本课的讲义+搜索内容。

已不再上课,所以本文只是笔记,恕不能提供讨论与答疑。


junction reads

对转录本进行测序后,将所得reads,map到基因组时,有些reads可能来自"跨越两个不同的基因或exon"的连接区域(可能由于基因剪接事件),导致与基因组只能部分匹配。这些reads就是junction reads。通过分析它们,可以了解基因的剪接变异和不同转录本的生成情况(detect novel splicing isoform),这对理解基因表达调控和功能注释非常重要。

处理方法

  1. join exon策略
    1. 为已知的转录本建立CJL(conceptual junctions library),存放已知的剪接异构体
    2. 将reads同时map到基因组和CJL中,如果可以无剪接地匹配到基因组,说明不是junction reads,否则去匹配CJL
    3. 优点:快速、能识别新的剪接异构体
    4. 缺点:不能发现新的外显子和新基因
  2. split reads策略
    1. 与join exon的区别在于,对于map不到基因组的reads,先按类似滑窗的方式切成若干k-mer seeds,然后拿seeds再去map基因组,最后把map上的seeds合起来
    2. 优点:能识别新的剪接异构体,能发现新的外显子和新基因
    3. 缺点:比join exon要慢

可用工具

  • TopHat

  • Cufflinks

  • Cuffmerge

  • Cuffdiff

    • 计算两个或多个样本的表达水平,并且计算每个变化的统计显著性
    • 重要参数:-u
  • CummeRbund

    • 方便分析Cufflinks结果的R包,可以绘图
    r 复制代码
    > source('http://www.bioconductor.org/biocLite.R')
    > biocLite('cummeRbund')
    • 常用命令:
    r 复制代码
    > csDensity(genes(cuff_data))
    > csScatter(genes(cuff_data), 'C1', 'C2')
    > csVolcano(genes(cuff_data), 'C1', 'C2')
    > expressionBarplot(mygene)
    > expressionBarplot(isoforms(mygene))
相关推荐
键盘上的猫头鹰14 小时前
【从零学MySQL(三)】数据增删改(DML)及 SELECT 查询详解
数据库·mysql·数据分析
键盘上的猫头鹰15 小时前
【从零学MySQL(二)】数据库基础操作、数据类型与约束(附Navicat演示)
数据库·mysql·数据分析·数据可视化
hef28816 小时前
SQL和Python怎么选?数据分析工具实战指南
python·sql·数据分析
AI周红伟17 小时前
数据分析智能体:推荐2026-05-19 17:33字号
数据挖掘·数据分析
码界筑梦坊20 小时前
144-基于Flask的电商超市数据可视化分析系统
开发语言·python·信息可视化·数据分析·flask
Cloud_Shy61821 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十二章 用户定义函数 下篇)
python·plotly·数据分析·excel·numpy·pandas
云和数据.ChenGuang1 天前
基于鲲鹏 HPC 的 AI 对话机器人架构设计与技术实现
人工智能·数据分析·机器人·pandas·数据预处理·数据训练
沅柠-AI营销1 天前
ChatGPT GEO深度拆解:从专业底层逻辑到高阶流量壁垒的完整打法
人工智能·chatgpt·数据分析·品牌营销·ai搜索优化·geo优化
TechWayfarer2 天前
营销反作弊实战:用IP归属地查询平台识别虚假流量
网络·python·网络协议·tcp/ip·数据分析
明志数科2 天前
2026年机器人数据行业趋势预测:5个关键变化与应对策略
机器学习·数据分析