ATAC-seq基础分析

1. ATAC-seq和chip-seq不一样的地方:

--no-mixed 不允许一个reads比对上,另一个比对不上。要么一对都比对上,要么都比对不上。

--no-discordant允许的插入片段长度的范围内,不要比对的太离谱。比如:两端reads都比对上,但一条比对到1号染色体的起始位置,另一条比对到10M以外的地方,显然不合理;或者一条比对到1号染色体,一条比对到2号染色体;

--maxins默认是500bp,最好设置成1000~2000.

  • Peak Calling

对于ATAC-seq,我们关心的区域可能并不是中间这个区域,因为中间的区域可能是一个核小体、也可能是一个NFR,也可能是多个核小体,也就是插入片段长度可能会在50-600bp之间。

  • 我们想知道的是染色质开放的区域,也就是对酶切敏感的区域,也就是超敏位点,DHS(DNaseI Hypersensitive Sites),Tn5酶切到了什么地方,那个cut site就是超敏位点。
  • ATAC的shift
  • macs2/mac3这个软件在call peak的时候,如果设置BAMPE,那么shiftextsize都失效。被当成chip-seq往右移。
js 复制代码
1. 我们希望peak的峰值在reads的末端,所以要把reads从3'往5'移动,
所以把左端reads的起始位点往左移动,移动多少比较随意,没有固定的值。

2. 比如说移动的shift值是-100,再需要将起始位点往右延申200。shift=-100,extsize=200。

3. shift=-75,extsize=150,也可以,只不过得到的峰更尖一些。

4. 不管是macs2还是macs3,都有这个参数:-f BAM/BAMPE,
只要设置-f BAMPE,那么你设置的shift=-100, extsize=200就会失效,
原因是:macs这个软件最早是为chip-seq设计的,都是往右边移动,只要是双末端测序,
这个软件能自己估算插入片段长度。

5. 解决办法就是设置-f BAM 加上 shift, extsize参数。因为事实上,即使是BAMPE,
它右端reads是不使用的,即使是双端reads,另一端reads只用来计算插入片段长度,
之后右端的reads并不会用来call peak,不用来看峰的大小,峰的位置。
  • 即使设置错误了,影响也不会特别大。虽然说插入片段长度50-600,但更多的是在NFR区域,所以最终插入片段长度就100-200bp左右,peak在基因组前后移动个50或100,对整个影响不大。中间重叠的区域还是在peak内部。
  • broad还是narrow peak的问题,如果研究转录因子,就用narrow;如果还有其他的蛋白或不清楚什么蛋白,就用broad。
相关推荐
小小小小宇6 分钟前
Chrome 插件在新开页生效
前端
橘子味的冰淇淋~7 分钟前
优化前端性能之从“全局引入”改为“按需引入”
前端·javascript·vue.js
沐灵洛13 分钟前
构建 Mac App Store 应用须知(全)
前端
KaMeidebaby14 分钟前
卡梅德生物技术快报|蛋白修饰调控 NETosis 分子机制及实验研究进展
前端·数据库·人工智能·算法·百度
颜进强19 分钟前
Claude Code -16 文件引用与加载机制完整实践:从 CLAUDE.md 到 Skills 与 Subagents
前端·后端·ai编程
2501_9400417419 分钟前
硬核全栈开发命题,覆盖高并发/实时/微服务
前端
风骏时光牛马27 分钟前
Bash变量未加双引号导致文件名含空格解析异常实战案例
前端
Vennn28 分钟前
Android自动化:使用 Web 方式实现某音未读消息检查与采集
前端·javascript·vue.js
Smilezyl30 分钟前
为了搞懂 AI Agent,我用 6000 行 JS 代码手搓了一个零依赖的 Coding Agent
前端·javascript·github
海鸥-w30 分钟前
前端学习python第三天笔记整理(list 列表,str字符串,tuple元组,set集合,dect,函数,类型注解)
前端·python·学习