10.windows ubuntu 组装软件:spades,megahit

Spades 是一种用于组装测序数据的软件,特别适用于处理 Illumina 测序平台产生的数据。它的全称是 "St. Petersburg genome assembler",是一款广泛使用的基因组组装工具。

第一种:wget https://cab.spbu.ru/files/release3.15.3/SPAdes-3.15.3-Linux.tar.gz #下载SPAdes

tar -zxvf SPAdes-3.15.3-Linux.tar.gz

添加环境变量到~/.bashrc

第二种方法:conda install -c bioconda spades -y

#spades.py基础应用

spades.py -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz -o out -t 20 --isolate #需要把输出目录清空,否则会报错

#一些参数的含义。

-1, --pe1-1: 包含第一对端(pair-end)测序数据的文件。

-2, --pe1-2: 包含第二对端(pair-end)测序数据的文件。

--s1: 包含单端测序数据的文件。

-o, --output: 指定输出目录的路径。

-t, --threads: 指定要使用的线程数。

--meta: 指示 Spades 使用元基因组学模式进行组装。

--plasmid: 指示 Spades 寻找和组装质粒DNA序列。

--careful: 启用谨慎模式,以提高组装的准确性。

--only-assembler: 只运行组装步骤,而不运行错误矫正。

--cov-cutoff: 根据覆盖度进行组装的最低值。

-k :kmer数,一次可以输入多个,用逗号分隔,数值从小到大排列,kmer最大为127,数值必须是奇数,一般自动选择即可,--sc 参数,则默认值为 21,33,55 。若没有 --sc 参数,则程序会根据 reads 长度自动选择 k-mer 参数

--plasmid:从WGS数据集组装质粒

--metaplasmid:从宏基因组组装体中提取染色体外元素,如质粒

#megahit安装

conda install -c bioconda megahit -y

#基础使用

sudo /home/guozihan/miniconda3/envs/spades_env/bin/python /home/guozihan/miniconda3/envs/spades_env/bin/megahit -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz --num-cpu-threads 20 --out-dir megahit_out --tmp-dir /tmp --out-prefix A1

#使用中遇到三个问题,1.--out-dir 输出路径需要目录不存在任何内容。2.--tmp-dir 临时文件保留路径在ubuntu中好像只能设/tmp路径,设置其它路径,否则会报错没有操作权限。3.要指定python程序的路径,要用根用户权限,即sudo /home/guozihan/miniconda3/envs/spades_env/bin/python。

#命令行各参数的作用

sudo: 在Linux系统中,sudo命令用于以超级用户或其他用户的身份运行命令。以超级用户权限运行命令可能需要输入密码进行确认。

/home/guozihan/miniconda3/envs/spades_env/bin/python: 指定要使用的 Python 解释器的路径,用于执行 Megahit 软件。

/home/guozihan/miniconda3/envs/spades_env/bin/megahit: 指定要执行的 Megahit 可执行文件的路径。

-1 read_hont_removed_1.fastq.gz: 指定包含第一端测序数据的 fastq 文件。

-2 read_hont_removed_2.fastq.gz: 指定包含第二端测序数据的 fastq 文件。

--num-cpu-threads 20: 指定要使用的CPU线程数,这里设置为 20 个线程,用于加速程序运行。

--out-dir megahit_out: 指定输出结果的目录,Megahit 运行后生成的结果文件将保存在该目录中。

--tmp-dir /tmp: 指定临时文件存储的目录,Megahit 运行过程中生成的临时文件将保存在该目录中。

--out-prefix A1: 指定输出文件的前缀,生成的汇总文件和结果文件会以该前缀开头命名。

相关推荐
qq_297574672 分钟前
Linux 服务器 Java 开发环境搭建保姆级教程
java·linux·服务器
神筆&『馬良』27 分钟前
Foundation_pose在自己的物体上复现指南:实现任意物体6D位姿检测(利用realsense_D435i和iphone_16pro手机)
目标检测·ubuntu·机器人·视觉检测
70asunflower27 分钟前
Emulation,Simulation,Virtualization,Imitation 的区别?
linux·docker
神梦流1 小时前
GE 引擎的内存优化终局:静态生命周期分析指导下的内存分配与复用策略
linux·运维·服务器
凡人叶枫1 小时前
C++中输入、输出和文件操作详解(Linux实战版)| 从基础到项目落地,避坑指南
linux·服务器·c语言·开发语言·c++
wdfk_prog1 小时前
[Linux]学习笔记系列 -- [drivers][input]serio
linux·笔记·学习
xuhe22 小时前
[全流程详细教程]Docker部署ClawBot, 使用GLM4.7, 接入TG Bot实现私人助理. 解决Docker Openclaw Permission Denied问题
linux·docker·ai·github·tldr
Lsir10110_2 小时前
【Linux】进程信号(下半)
linux·运维·服务器
liuniu08182 小时前
VMware虚拟机安装ubuntu2022
ubuntu·ros
酉鬼女又兒2 小时前
零基础入门Linux指南:每天一个Linux命令_pwd
linux·运维·服务器