生物信息学导论-北大-RNA-Seq数据分析

ref: https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home

本文主要来自本课的讲义+搜索内容。

已不再上课,所以本文只是笔记,恕不能提供讨论与答疑。


junction reads

对转录本进行测序后,将所得reads,map到基因组时,有些reads可能来自"跨越两个不同的基因或exon"的连接区域(可能由于基因剪接事件),导致与基因组只能部分匹配。这些reads就是junction reads。通过分析它们,可以了解基因的剪接变异和不同转录本的生成情况(detect novel splicing isoform),这对理解基因表达调控和功能注释非常重要。

处理方法

  1. join exon策略
    1. 为已知的转录本建立CJL(conceptual junctions library),存放已知的剪接异构体
    2. 将reads同时map到基因组和CJL中,如果可以无剪接地匹配到基因组,说明不是junction reads,否则去匹配CJL
    3. 优点:快速、能识别新的剪接异构体
    4. 缺点:不能发现新的外显子和新基因
  2. split reads策略
    1. 与join exon的区别在于,对于map不到基因组的reads,先按类似滑窗的方式切成若干k-mer seeds,然后拿seeds再去map基因组,最后把map上的seeds合起来
    2. 优点:能识别新的剪接异构体,能发现新的外显子和新基因
    3. 缺点:比join exon要慢

可用工具

  • TopHat

  • Cufflinks

  • Cuffmerge

  • Cuffdiff

    • 计算两个或多个样本的表达水平,并且计算每个变化的统计显著性
    • 重要参数:-u
  • CummeRbund

    • 方便分析Cufflinks结果的R包,可以绘图
    r 复制代码
    > source('http://www.bioconductor.org/biocLite.R')
    > biocLite('cummeRbund')
    • 常用命令:
    r 复制代码
    > csDensity(genes(cuff_data))
    > csScatter(genes(cuff_data), 'C1', 'C2')
    > csVolcano(genes(cuff_data), 'C1', 'C2')
    > expressionBarplot(mygene)
    > expressionBarplot(isoforms(mygene))
相关推荐
Database_Cool_16 小时前
AnalyticDB MySQL vs ClickHouse:OLAP 数据库选型深度对比——谁更适合企业级分析
数据库·数据仓库·mysql·数据分析
科研小刘带你玩学术18 小时前
【科研快报】AI时代如何高效“组队“?计算社会选择理论带来新思路
数据挖掘·数据分析·計算社會選擇·委員會選舉·參數化複雜性分析
chatexcel19 小时前
ChatExcel Max升级体验:从表格处理到企业级业务数据分析
大数据·人工智能·数据分析
keyanbanyungong1 天前
告别盗版素材!自带版权的科研绘图工具
信息可视化·数据挖掘·数据分析
Highcharts.js1 天前
Highcharts V13更新评价|企业级数据可视化进入智能配置时代
信息可视化·数据分析·highcharts·highcharts 新版本·highcharts 13·企业级数据可视化·javascript 图表库
YangYang9YangYan1 天前
2026产品运营学数据分析能否提升职场竞争力
数据挖掘·数据分析·产品运营
天青色等烟雨..1 天前
基于R语言地理加权回归、主成份分析、判别分析等空间异质性数据分析实践技术应用
数据分析·回归·r语言
KaMeidebaby2 天前
卡梅德生物技术快报|原核表达系统工艺优化:包涵体重折叠 + 分子筛纯化实现功能 RBD 高效制备,附全参数配置
前端·人工智能·算法·数据挖掘·数据分析
左心房的默白,,,2 天前
17:FDC数据采集与数据分析基础(EAP进阶)
运维·数据分析·自动化
小白学大数据2 天前
AI 智能爬虫实战:Selenium+Python 自动绕反爬、一键提取数据
爬虫·python·selenium·数据分析