创作日志: 万恶的生信...一个scHiC数据集没有提供处理好的计数文件,需要从.hic转换。Github一个个好长的文档看了好久才定位到 juicer tools 的dump命令,使用起来比想象中简单。
一、下载Juicer tools
注意:使用Juicer tools的前提是你的电脑里装了Java哦!
我不知道有什么具体区别,下载的是第一个。下载之后也不需要有什么操作,直接就可以用。

二、dump命令讲解
1. juicer_tools dump 用法1------提取观测值或期望值
-
参数:
observed/oe \] \[ NONE/VC/VC_SQRT/KR \] \[ hicFile(s) \] \[ chr1 \]\[:x1:x2\] \[ chr2 \]\[:y1:y2\] \[ BP/FRAG \] \[ binsize \] \[ outfile (可选)
-
参数解释:
• observed/oe: 选择提取观测值 (observed) 或 观测/期望值 (oe)。
• NONE/VC/VC_SQRT/KR: 选择归一化选项:NONE:无归一化
VC:Vector Correction 归一化
VC_SQRT:Square Root Vector Correction 归一化
KR:Knight-Ruiz 归一化
• hicFile(s): 输入的 .hic 文件路径。
• chr1:x1:x2: 第一个染色体及其范围(例如 chr1:0:100000)。
• chr2:y1:y2: 第二个染色体及其范围(例如 chr2:0:100000),也可以是相同的染色体。
• BP/FRAG: 选择单位:基对 (BP) 或 酶切片段 (FRAG)。
• binsize: 分辨率,例如 10000 表示 10kb。
• outfile: 输出文件路径(可选)。
2. juicer_tools dump 用法2------提取归一化或期望值
- 参数:
norm/expected \] \[ NONE/VC/VC_SQRT/KR \] \[ hicFile(s) \] \[ chr \] \[ BP/FRAG \] \[ binsize \] \[ outfile (可选)
- 参数解释:
• norm/expected:选择提取归一化值 (norm) 或 期望值 (expected)。
• NONE/VC/VC_SQRT/KR:选择归一化选项(同上)。
• hicFile(s):输入的 .hic 文件路径。
• chr:染色体。
• BP/FRAG:选择单位:基对 (BP) 或 酶切片段 (FRAG)。
• binsize:分辨率。
• outfile:输出文件路径(可选)。
3. juicer_tools dump 用法3------提取染色质环loop或域domain信息
- 参数:
loops/domains \] \[ hicFile URL\] \[ outfile (可选)
- 参数解释:
• loops/domains:选择提取环 (loops) 或 域 (domains) 信息。
• :输入的 .hic 文件 URL。
• outfile:输出文件路径(可选)。
三、使用实例
- 打开Windows cmd
- 输入
java -jar 你的juicer_tools jar包安装路径 dump 以上所需参数即可完成转换
拿我的举个例子:

最后在我的指定路径中生成了extract_matrix.txt文件:

打开内容是这样的:
