怎样使用 Juicer tools 的 dump 命令将.hic文件转换为交互矩阵matrix计数文件 (Windows)

创作日志: 万恶的生信...一个scHiC数据集没有提供处理好的计数文件,需要从.hic转换。Github一个个好长的文档看了好久才定位到 juicer tools 的dump命令,使用起来比想象中简单。


一、下载Juicer tools

注意:使用Juicer tools的前提是你的电脑里装了Java哦!

网址:Juicer tools jar包下载官网

我不知道有什么具体区别,下载的是第一个。下载之后也不需要有什么操作,直接就可以用。

二、dump命令讲解

1. juicer_tools dump 用法1------提取观测值或期望值

  • 参数:

    observed/oe \] \[ NONE/VC/VC_SQRT/KR \] \[ hicFile(s) \] \[ chr1 \]\[:x1:x2\] \[ chr2 \]\[:y1:y2\] \[ BP/FRAG \] \[ binsize \] \[ outfile (可选)

  • 参数解释:
    • [observed/oe]: 选择提取观测值 (observed) 或 观测/期望值 (oe)。
    • [NONE/VC/VC_SQRT/KR]: 选择归一化选项:

    NONE:无归一化

    VC:Vector Correction 归一化

    VC_SQRT:Square Root Vector Correction 归一化

    KR:Knight-Ruiz 归一化
    • [hicFile(s)]: 输入的 .hic 文件路径。
    • [chr1][:x1:x2]: 第一个染色体及其范围(例如 chr1:0:100000)。
    • [chr2][:y1:y2]: 第二个染色体及其范围(例如 chr2:0:100000),也可以是相同的染色体。
    • [BP/FRAG]: 选择单位:基对 (BP) 或 酶切片段 (FRAG)。
    • [binsize]: 分辨率,例如 10000 表示 10kb。
    • [outfile]: 输出文件路径(可选)。

2. juicer_tools dump 用法2------提取归一化或期望值

  • 参数:

    norm/expected \] \[ NONE/VC/VC_SQRT/KR \] \[ hicFile(s) \] \[ chr \] \[ BP/FRAG \] \[ binsize \] \[ outfile (可选)

  • 参数解释:
    • [norm/expected]:选择提取归一化值 (norm) 或 期望值 (expected)。
    • [NONE/VC/VC_SQRT/KR]:选择归一化选项(同上)。
    • [hicFile(s)]:输入的 .hic 文件路径。
    • [chr]:染色体。
    • [BP/FRAG]:选择单位:基对 (BP) 或 酶切片段 (FRAG)。
    • [binsize]:分辨率。
    • [outfile]:输出文件路径(可选)。

3. juicer_tools dump 用法3------提取染色质环loop或域domain信息

  • 参数:

    loops/domains \] \[ hicFile URL\] \[ outfile (可选)

  • 参数解释:
    • [loops/domains]:选择提取环 (loops) 或 域 (domains) 信息。
    • :输入的 .hic 文件 URL。
    • [outfile]:输出文件路径(可选)。

三、使用实例

  1. 打开Windows cmd
  2. 输入java -jar 你的juicer_tools jar包安装路径 dump 以上所需参数 即可完成转换

拿我的举个例子:

最后在我的指定路径中生成了extract_matrix.txt文件:

打开内容是这样的:

相关推荐
高-老师21 天前
python生物信息多组学大数据深度挖掘与论文整理技巧实践技术应用
生物信息
高-老师21 天前
基于R语言生物信息学大数据分析与绘图实践技术应用
开发语言·数据分析·r语言·生物信息
青春不败 177-3266-05201 个月前
python语言生物信息多组学大数据深度挖掘与论文整理技巧
开发语言·python·生物信息·多组学·高通量测序
青春不败 177-3266-05201 个月前
基于R语言生物信息学大数据分析与绘图技术应用
数据分析·r语言·生物信息·生信·高通量
zhangfeng11332 个月前
mednexus.org/ 一个医学学术期刊传播平台 医学英文期刊传播平台中华医学会杂志社与威立(Wiley)合作打造
生物信息·医学
zd2005722 个月前
popEVE:人类疾病遗传学的全蛋白质组模型数据库
生物信息·基因变异
zhangfeng11332 个月前
百度免费大模型API深度解析 大厂llm大模型市场国产大模型API免费全平台对比指南,薅羊毛指南与实战建议 政策深度解析与
人工智能·百度·dubbo·生物信息
梦想的初衷~3 个月前
“科研创新与智能化转型“暨AI智能体(Agent)开发及与大语言模型的本地化部署、优化技术实践
人工智能·语言模型·自然语言处理·生物信息·材料科学
zhangfeng11333 个月前
DrugGPT chatgpt druggen 之间的关系 ,DrugGPT是基于gpt2基础上开发的
chatgpt·生物信息
zhangfeng11333 个月前
医疗智能体(eiHealth) 3.4.0 使用指南(for 华为云Stack 8.5.0) 0. 华为除了这个 还有医疗 和生信方面的 产品
华为·华为云·生物信息