STAR 命令参数解释

以这个为例子解释STAR参数含义

STAR 命令参数解释

bash 复制代码
STAR \
--outFilterType BySJout \
--runThreadN 8 \
--outFilterMismatchNmax 2 \
--genomeDir <hg19_STARindex> \
--readFilesIn <un_aligned.fastq> \
--outFileNamePrefix <HEK293> \
--outSAMtype BAM SortedByCoordinate \
--quantMode TranscriptomeSAM GeneCounts \
--outFilterMultimapNmax 1 \
--outFilterMatchNmin 16 \
--alignEndsType EndToEnd
  1. --outFilterType BySJout:

    • 过滤类型,BySJout 表示只输出通过Splice Junction过滤的reads。这对于检测新的剪接位点非常有用。
  2. --runThreadN 8:

    • 使用8个线程进行计算。多线程可以加速处理速度,特别是在多核处理器上。
  3. --outFilterMismatchNmax 2:

    • 每个read允许的最大错配数。如果一个read有超过2个错配,则不会被输出。这个参数控制比对的精确度。
  4. --genomeDir <hg19_STARindex>:

    • 指定参考基因组索引的目录。这里假设是hg19基因组的STAR索引。
  5. --readFilesIn <un_aligned.fastq>:

    • 输入的FASTQ文件,包含待比对的reads。
  6. --outFileNamePrefix <HEK293>:

    • 输出文件的前缀。所有输出文件的名称都会以这个前缀开始。
  7. --outSAMtype BAM SortedByCoordinate:

    • 指定输出文件类型和排序方式。这里输出的文件格式为BAM,并按坐标排序。
  8. --quantMode TranscriptomeSAM GeneCounts:

    • TranscriptomeSAM:输出转录组的比对结果(适用于下游转录组分析工具)。
    • GeneCounts:生成基因计数文件。
  9. --outFilterMultimapNmax 1:

    • 每个read允许的最大多比对数(multimapping)。设为1意味着只保留唯一比对的reads。如果一个read比对到多个位置,则不会被输出。
  10. --outFilterMatchNmin 16:

    • 每个read的最小比对长度。如果一个read比对的长度小于16bp,则不会被输出。这个参数控制比对的质量。
  11. --alignEndsType EndToEnd:

    • 比对模式,EndToEnd 表示全长比对,要求read的两端都比对到参考基因组。

是否保留多比对(multimapping)

根据参数 --outFilterMultimapNmax 1,该设置表明只保留唯一比对的reads。如果一个read比对到多个位置,则不会被输出。因此,该命令配置没有保留多比对的reads,只有唯一比对的reads会被保留和输出。

总结

  • --outFilterMultimapNmax 1 参数设定为1,意味着不保留多比对的reads,只保留唯一比对的reads。
  • 其他参数控制比对的精确度、输出格式和质量过滤标准。

通过这些设置,STAR将只输出那些唯一比对到参考基因组的位置、且质量符合要求的reads。

相关推荐
AlfredZhao9 小时前
vi 删除指定范围的行,不用再反复按 dd
linux·vi
用户97183563346615 小时前
银河麒麟 KY10 申威(SW64) 安装 nginx-1.16.1-2.p01.ky10.sw_64.rpm 详细步骤
linux
猪脚踏浪16 小时前
linux 拷贝文件或目录到指定的位置
linux
摇滚侠1 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
bush41 天前
嵌入式linux学习记录十四、术语
linux·嵌入式
载数而行5201 天前
Linux 11 动态监控指令top
linux
不会C语言的男孩1 天前
Linux 系统编程 · 第 8 章:进程基础
linux·c语言
古城小栈1 天前
Unix 与 Linux 异同小叙
linux·服务器·unix
凡人叶枫1 天前
Effective C++ 条款42:了解 typename 的双重意义
java·linux·服务器·c++
2601_961875241 天前
决战申论100题2026|最新|范文
linux·容器·centos·debian·ssh·fabric·vagrant