10.windows ubuntu 组装软件:spades,megahit

Spades 是一种用于组装测序数据的软件,特别适用于处理 Illumina 测序平台产生的数据。它的全称是 "St. Petersburg genome assembler",是一款广泛使用的基因组组装工具。

第一种:wget https://cab.spbu.ru/files/release3.15.3/SPAdes-3.15.3-Linux.tar.gz #下载SPAdes

tar -zxvf SPAdes-3.15.3-Linux.tar.gz

添加环境变量到~/.bashrc

第二种方法:conda install -c bioconda spades -y

#spades.py基础应用

spades.py -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz -o out -t 20 --isolate #需要把输出目录清空,否则会报错

#一些参数的含义。

-1, --pe1-1: 包含第一对端(pair-end)测序数据的文件。

-2, --pe1-2: 包含第二对端(pair-end)测序数据的文件。

--s1: 包含单端测序数据的文件。

-o, --output: 指定输出目录的路径。

-t, --threads: 指定要使用的线程数。

--meta: 指示 Spades 使用元基因组学模式进行组装。

--plasmid: 指示 Spades 寻找和组装质粒DNA序列。

--careful: 启用谨慎模式,以提高组装的准确性。

--only-assembler: 只运行组装步骤,而不运行错误矫正。

--cov-cutoff: 根据覆盖度进行组装的最低值。

-k :kmer数,一次可以输入多个,用逗号分隔,数值从小到大排列,kmer最大为127,数值必须是奇数,一般自动选择即可,--sc 参数,则默认值为 21,33,55 。若没有 --sc 参数,则程序会根据 reads 长度自动选择 k-mer 参数

--plasmid:从WGS数据集组装质粒

--metaplasmid:从宏基因组组装体中提取染色体外元素,如质粒

#megahit安装

conda install -c bioconda megahit -y

#基础使用

sudo /home/guozihan/miniconda3/envs/spades_env/bin/python /home/guozihan/miniconda3/envs/spades_env/bin/megahit -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz --num-cpu-threads 20 --out-dir megahit_out --tmp-dir /tmp --out-prefix A1

#使用中遇到三个问题,1.--out-dir 输出路径需要目录不存在任何内容。2.--tmp-dir 临时文件保留路径在ubuntu中好像只能设/tmp路径,设置其它路径,否则会报错没有操作权限。3.要指定python程序的路径,要用根用户权限,即sudo /home/guozihan/miniconda3/envs/spades_env/bin/python。

#命令行各参数的作用

sudo: 在Linux系统中,sudo命令用于以超级用户或其他用户的身份运行命令。以超级用户权限运行命令可能需要输入密码进行确认。

/home/guozihan/miniconda3/envs/spades_env/bin/python: 指定要使用的 Python 解释器的路径,用于执行 Megahit 软件。

/home/guozihan/miniconda3/envs/spades_env/bin/megahit: 指定要执行的 Megahit 可执行文件的路径。

-1 read_hont_removed_1.fastq.gz: 指定包含第一端测序数据的 fastq 文件。

-2 read_hont_removed_2.fastq.gz: 指定包含第二端测序数据的 fastq 文件。

--num-cpu-threads 20: 指定要使用的CPU线程数,这里设置为 20 个线程,用于加速程序运行。

--out-dir megahit_out: 指定输出结果的目录,Megahit 运行后生成的结果文件将保存在该目录中。

--tmp-dir /tmp: 指定临时文件存储的目录,Megahit 运行过程中生成的临时文件将保存在该目录中。

--out-prefix A1: 指定输出文件的前缀,生成的汇总文件和结果文件会以该前缀开头命名。

相关推荐
心灵宝贝几秒前
CentOS 7 安装 bzip2-libs-1.0.6-13.el7.x86_64.rpm 的详细步骤
linux·运维·centos
mjx65301 小时前
windows查看端口使用情况,以及结束任务释放端口
linux
九皇叔叔2 小时前
Linux Shell 函数:从定义到实战,让脚本更高效
linux·运维·chrome·shell
璞致电子5 小时前
fpga开发板ZYNQ 璞致 PZ7010/7020 邮票孔核心板简介-ZYNQ7000系列小系统学习板
linux·嵌入式硬件·学习·fpga开发·fpga·fpga开发板·xilinx开发板
第四维度45 小时前
【全志V821_FoxPi】9-2 Linux IIC驱动MPU6050
linux·传感器·tina·mpu6050·v821
mjx65305 小时前
PyTorch快速入门
linux
DeeplyMind7 小时前
AMD KFD的BO设计分析系列6-1: VRAM BO的显存分配分析
linux·驱动开发·amdgpu·rocm·kfd
我言秋日胜春朝★7 小时前
【Linux网络编程】多路转接reactor——ET模式的epoll
linux·服务器·网络
Hell_Yrz8 小时前
Golang信号处理实战
linux
四桑.8 小时前
uniapp运行微信小程序uni为什么是undefined
linux