ATAC-seq基础分析

1. ATAC-seq和chip-seq不一样的地方:

--no-mixed 不允许一个reads比对上,另一个比对不上。要么一对都比对上,要么都比对不上。

--no-discordant允许的插入片段长度的范围内,不要比对的太离谱。比如:两端reads都比对上,但一条比对到1号染色体的起始位置,另一条比对到10M以外的地方,显然不合理;或者一条比对到1号染色体,一条比对到2号染色体;

--maxins默认是500bp,最好设置成1000~2000.

  • Peak Calling

对于ATAC-seq,我们关心的区域可能并不是中间这个区域,因为中间的区域可能是一个核小体、也可能是一个NFR,也可能是多个核小体,也就是插入片段长度可能会在50-600bp之间。

  • 我们想知道的是染色质开放的区域,也就是对酶切敏感的区域,也就是超敏位点,DHS(DNaseI Hypersensitive Sites),Tn5酶切到了什么地方,那个cut site就是超敏位点。
  • ATAC的shift
  • macs2/mac3这个软件在call peak的时候,如果设置BAMPE,那么shiftextsize都失效。被当成chip-seq往右移。
js 复制代码
1. 我们希望peak的峰值在reads的末端,所以要把reads从3'往5'移动,
所以把左端reads的起始位点往左移动,移动多少比较随意,没有固定的值。

2. 比如说移动的shift值是-100,再需要将起始位点往右延申200。shift=-100,extsize=200。

3. shift=-75,extsize=150,也可以,只不过得到的峰更尖一些。

4. 不管是macs2还是macs3,都有这个参数:-f BAM/BAMPE,
只要设置-f BAMPE,那么你设置的shift=-100, extsize=200就会失效,
原因是:macs这个软件最早是为chip-seq设计的,都是往右边移动,只要是双末端测序,
这个软件能自己估算插入片段长度。

5. 解决办法就是设置-f BAM 加上 shift, extsize参数。因为事实上,即使是BAMPE,
它右端reads是不使用的,即使是双端reads,另一端reads只用来计算插入片段长度,
之后右端的reads并不会用来call peak,不用来看峰的大小,峰的位置。
  • 即使设置错误了,影响也不会特别大。虽然说插入片段长度50-600,但更多的是在NFR区域,所以最终插入片段长度就100-200bp左右,peak在基因组前后移动个50或100,对整个影响不大。中间重叠的区域还是在peak内部。
  • broad还是narrow peak的问题,如果研究转录因子,就用narrow;如果还有其他的蛋白或不清楚什么蛋白,就用broad。
相关推荐
Ziky学习记录13 分钟前
从零到实战:React Router 学习与总结
前端·学习·react.js
wuhen_n18 分钟前
JavaScript链表与双向链表实现:理解数组与链表的差异
前端·javascript
wuhen_n22 分钟前
JavaScript数据结构深度解析:栈、队列与树的实现与应用
前端·javascript
狗哥哥43 分钟前
微前端路由设计方案 & 子应用管理保活
前端·架构
前端大卫1 小时前
Vue3 + Element-Plus 自定义虚拟表格滚动实现方案【附源码】
前端
却尘2 小时前
Next.js 请求最佳实践 - vercel 2026一月发布指南
前端·react.js·next.js
ccnocare2 小时前
浅浅看一下设计模式
前端
Lee川2 小时前
🎬 从标签到屏幕:揭秘现代网页构建与适配之道
前端·面试
Ticnix2 小时前
ECharts初始化、销毁、resize 适配组件封装(含完整封装代码)
前端·echarts
纯爱掌门人2 小时前
终焉轮回里,藏着 AI 与人类的答案
前端·人工智能·aigc