1. ATAC-seq和chip-seq不一样的地方:
--no-mixed
不允许一个reads比对上,另一个比对不上。要么一对都比对上,要么都比对不上。
--no-discordant
允许的插入片段长度的范围内,不要比对的太离谱。比如:两端reads都比对上,但一条比对到1号染色体的起始位置,另一条比对到10M以外的地方,显然不合理;或者一条比对到1号染色体,一条比对到2号染色体;
--maxins
默认是500bp,最好设置成1000~2000.
- Peak Calling
对于ATAC-seq,我们关心的区域可能并不是中间这个区域,因为中间的区域可能是一个核小体、也可能是一个NFR,也可能是多个核小体,也就是插入片段长度可能会在50-600bp之间。
- 我们想知道的是染色质开放的区域,也就是对酶切敏感的区域,也就是超敏位点,DHS(DNaseI Hypersensitive Sites),Tn5酶切到了什么地方,那个cut site就是超敏位点。
- ATAC的shift
- macs2/mac3这个软件在call peak的时候,如果设置BAMPE,那么
shift
和extsize
都失效。被当成chip-seq往右移。
js
1. 我们希望peak的峰值在reads的末端,所以要把reads从3'往5'移动,
所以把左端reads的起始位点往左移动,移动多少比较随意,没有固定的值。
2. 比如说移动的shift值是-100,再需要将起始位点往右延申200。shift=-100,extsize=200。
3. shift=-75,extsize=150,也可以,只不过得到的峰更尖一些。
4. 不管是macs2还是macs3,都有这个参数:-f BAM/BAMPE,
只要设置-f BAMPE,那么你设置的shift=-100, extsize=200就会失效,
原因是:macs这个软件最早是为chip-seq设计的,都是往右边移动,只要是双末端测序,
这个软件能自己估算插入片段长度。
5. 解决办法就是设置-f BAM 加上 shift, extsize参数。因为事实上,即使是BAMPE,
它右端reads是不使用的,即使是双端reads,另一端reads只用来计算插入片段长度,
之后右端的reads并不会用来call peak,不用来看峰的大小,峰的位置。
- 即使设置错误了,影响也不会特别大。虽然说插入片段长度50-600,但更多的是在NFR区域,所以最终插入片段长度就100-200bp左右,peak在基因组前后移动个50或100,对整个影响不大。中间重叠的区域还是在peak内部。
- broad还是narrow peak的问题,如果研究转录因子,就用narrow;如果还有其他的蛋白或不清楚什么蛋白,就用broad。