怎样使用 Juicer tools 的 dump 命令将.hic文件转换为交互矩阵matrix计数文件 (Windows)

创作日志: 万恶的生信...一个scHiC数据集没有提供处理好的计数文件,需要从.hic转换。Github一个个好长的文档看了好久才定位到 juicer tools 的dump命令,使用起来比想象中简单。


一、下载Juicer tools

注意:使用Juicer tools的前提是你的电脑里装了Java哦!

网址:Juicer tools jar包下载官网

我不知道有什么具体区别,下载的是第一个。下载之后也不需要有什么操作,直接就可以用。

二、dump命令讲解

1. juicer_tools dump 用法1------提取观测值或期望值

  • 参数:

    observed/oe \] \[ NONE/VC/VC_SQRT/KR \] \[ hicFile(s) \] \[ chr1 \]\[:x1:x2\] \[ chr2 \]\[:y1:y2\] \[ BP/FRAG \] \[ binsize \] \[ outfile (可选)

  • 参数解释:
    • [observed/oe]: 选择提取观测值 (observed) 或 观测/期望值 (oe)。
    • [NONE/VC/VC_SQRT/KR]: 选择归一化选项:

    NONE:无归一化

    VC:Vector Correction 归一化

    VC_SQRT:Square Root Vector Correction 归一化

    KR:Knight-Ruiz 归一化
    • [hicFile(s)]: 输入的 .hic 文件路径。
    • [chr1][:x1:x2]: 第一个染色体及其范围(例如 chr1:0:100000)。
    • [chr2][:y1:y2]: 第二个染色体及其范围(例如 chr2:0:100000),也可以是相同的染色体。
    • [BP/FRAG]: 选择单位:基对 (BP) 或 酶切片段 (FRAG)。
    • [binsize]: 分辨率,例如 10000 表示 10kb。
    • [outfile]: 输出文件路径(可选)。

2. juicer_tools dump 用法2------提取归一化或期望值

  • 参数:

    norm/expected \] \[ NONE/VC/VC_SQRT/KR \] \[ hicFile(s) \] \[ chr \] \[ BP/FRAG \] \[ binsize \] \[ outfile (可选)

  • 参数解释:
    • [norm/expected]:选择提取归一化值 (norm) 或 期望值 (expected)。
    • [NONE/VC/VC_SQRT/KR]:选择归一化选项(同上)。
    • [hicFile(s)]:输入的 .hic 文件路径。
    • [chr]:染色体。
    • [BP/FRAG]:选择单位:基对 (BP) 或 酶切片段 (FRAG)。
    • [binsize]:分辨率。
    • [outfile]:输出文件路径(可选)。

3. juicer_tools dump 用法3------提取染色质环loop或域domain信息

  • 参数:

    loops/domains \] \[ hicFile URL\] \[ outfile (可选)

  • 参数解释:
    • [loops/domains]:选择提取环 (loops) 或 域 (domains) 信息。
    • :输入的 .hic 文件 URL。
    • [outfile]:输出文件路径(可选)。

三、使用实例

  1. 打开Windows cmd
  2. 输入java -jar 你的juicer_tools jar包安装路径 dump 以上所需参数 即可完成转换

拿我的举个例子:

最后在我的指定路径中生成了extract_matrix.txt文件:

打开内容是这样的:

相关推荐
青春不败 177-3266-05202 天前
python语言生物信息多组学大数据深度挖掘与论文整理技巧
开发语言·python·生物信息·多组学·高通量测序
青春不败 177-3266-05203 天前
基于R语言生物信息学大数据分析与绘图技术应用
数据分析·r语言·生物信息·生信·高通量
zhangfeng113319 天前
mednexus.org/ 一个医学学术期刊传播平台 医学英文期刊传播平台中华医学会杂志社与威立(Wiley)合作打造
生物信息·医学
zd2005721 个月前
popEVE:人类疾病遗传学的全蛋白质组模型数据库
生物信息·基因变异
zhangfeng11331 个月前
百度免费大模型API深度解析 大厂llm大模型市场国产大模型API免费全平台对比指南,薅羊毛指南与实战建议 政策深度解析与
人工智能·百度·dubbo·生物信息
梦想的初衷~2 个月前
“科研创新与智能化转型“暨AI智能体(Agent)开发及与大语言模型的本地化部署、优化技术实践
人工智能·语言模型·自然语言处理·生物信息·材料科学
zhangfeng11332 个月前
DrugGPT chatgpt druggen 之间的关系 ,DrugGPT是基于gpt2基础上开发的
chatgpt·生物信息
zhangfeng11332 个月前
医疗智能体(eiHealth) 3.4.0 使用指南(for 华为云Stack 8.5.0) 0. 华为除了这个 还有医疗 和生信方面的 产品
华为·华为云·生物信息
zhangfeng11332 个月前
亲测有效的mem 流行病预测,时间序列预测,r语言做移动流行区间法,MEM流行病阈值设置指南
开发语言·r语言·生物信息
zhangfeng11332 个月前
R和python 哪个更适合生物信息分析,或者更擅长做什么工作
开发语言·python·r语言·生物信息