10.windows ubuntu 组装软件:spades,megahit

Spades 是一种用于组装测序数据的软件,特别适用于处理 Illumina 测序平台产生的数据。它的全称是 "St. Petersburg genome assembler",是一款广泛使用的基因组组装工具。

第一种:wget https://cab.spbu.ru/files/release3.15.3/SPAdes-3.15.3-Linux.tar.gz #下载SPAdes

tar -zxvf SPAdes-3.15.3-Linux.tar.gz

添加环境变量到~/.bashrc

第二种方法:conda install -c bioconda spades -y

#spades.py基础应用

spades.py -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz -o out -t 20 --isolate #需要把输出目录清空,否则会报错

#一些参数的含义。

-1, --pe1-1: 包含第一对端(pair-end)测序数据的文件。

-2, --pe1-2: 包含第二对端(pair-end)测序数据的文件。

--s1: 包含单端测序数据的文件。

-o, --output: 指定输出目录的路径。

-t, --threads: 指定要使用的线程数。

--meta: 指示 Spades 使用元基因组学模式进行组装。

--plasmid: 指示 Spades 寻找和组装质粒DNA序列。

--careful: 启用谨慎模式,以提高组装的准确性。

--only-assembler: 只运行组装步骤,而不运行错误矫正。

--cov-cutoff: 根据覆盖度进行组装的最低值。

-k :kmer数,一次可以输入多个,用逗号分隔,数值从小到大排列,kmer最大为127,数值必须是奇数,一般自动选择即可,--sc 参数,则默认值为 21,33,55 。若没有 --sc 参数,则程序会根据 reads 长度自动选择 k-mer 参数

--plasmid:从WGS数据集组装质粒

--metaplasmid:从宏基因组组装体中提取染色体外元素,如质粒

#megahit安装

conda install -c bioconda megahit -y

#基础使用

sudo /home/guozihan/miniconda3/envs/spades_env/bin/python /home/guozihan/miniconda3/envs/spades_env/bin/megahit -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz --num-cpu-threads 20 --out-dir megahit_out --tmp-dir /tmp --out-prefix A1

#使用中遇到三个问题,1.--out-dir 输出路径需要目录不存在任何内容。2.--tmp-dir 临时文件保留路径在ubuntu中好像只能设/tmp路径,设置其它路径,否则会报错没有操作权限。3.要指定python程序的路径,要用根用户权限,即sudo /home/guozihan/miniconda3/envs/spades_env/bin/python。

#命令行各参数的作用

sudo: 在Linux系统中,sudo命令用于以超级用户或其他用户的身份运行命令。以超级用户权限运行命令可能需要输入密码进行确认。

/home/guozihan/miniconda3/envs/spades_env/bin/python: 指定要使用的 Python 解释器的路径,用于执行 Megahit 软件。

/home/guozihan/miniconda3/envs/spades_env/bin/megahit: 指定要执行的 Megahit 可执行文件的路径。

-1 read_hont_removed_1.fastq.gz: 指定包含第一端测序数据的 fastq 文件。

-2 read_hont_removed_2.fastq.gz: 指定包含第二端测序数据的 fastq 文件。

--num-cpu-threads 20: 指定要使用的CPU线程数,这里设置为 20 个线程,用于加速程序运行。

--out-dir megahit_out: 指定输出结果的目录,Megahit 运行后生成的结果文件将保存在该目录中。

--tmp-dir /tmp: 指定临时文件存储的目录,Megahit 运行过程中生成的临时文件将保存在该目录中。

--out-prefix A1: 指定输出文件的前缀,生成的汇总文件和结果文件会以该前缀开头命名。

相关推荐
lThE ANDE35 分钟前
最完整版Linux安装Redis(保姆教程)
linux·运维·redis
郝亚军4 小时前
ubuntu通过samba,让win11可以访问其共享文件夹
linux·服务器·ubuntu
一个人旅程~4 小时前
旧电脑的“拯救者”?Linux Mint20.3是怎样适配软件硬件以及兼顾兼容与性能的平衡的?
linux·经验分享·电脑
小夏子_riotous5 小时前
Docker学习路径——3、常用命令
linux·运维·服务器·学习·docker·容器·centos
其实防守也摸鱼5 小时前
无线网络安全---WLAN相关安全工具--kali(理论附题目)
linux·安全·web安全·学习笔记·kali·命令模式·wlan
uesowys7 小时前
CentOS Linux安装部署OpenClaw
linux·centos·安装部署openclaw
IMPYLH7 小时前
Linux 的 rm 命令
linux·运维·服务器·网络·bash
YIN_尹7 小时前
【Linux系统编程】进程地址空间
linux·c++
代码中介商8 小时前
手把手教你Linux 打包压缩与 gcc 编译详解
linux·运维·服务器·编译·打包·压缩
longerxin20208 小时前
阿里云AlmaLinux操作系统允许root登录配置步骤
linux·服务器·阿里云