目录
- [1. 安装](#1. 安装)
- [2. 用法](#2. 用法)
-
- [2.1 命令行方式(linux)](#2.1 命令行方式(linux))
- [2.2 GUI方式(windows)](#2.2 GUI方式(windows))
-
- 1) 完整参数介绍 完整参数介绍)
-
- Andromeda配置/Configuration(2)
- [数据上传/Raw files (14)](#数据上传/Raw files (14))
- [组特异参数/Group-specific parameters(17)](#组特异参数/Group-specific parameters(17))
- [全局参数/Global parameters (36)](#全局参数/Global parameters (36))
- Performance(82)
- 处理器数量(80)
- 2) minimal workflow minimal workflow)
- [3. Troubleshooting](#3. Troubleshooting)
- 参考
MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。
1. 安装
MaxQuant
下载方式:
- 通过官网 下载,包括
andromeda
(搜索引擎)+viewer
(检查原始数据、鉴定和定量结果)。 - 通过conda下载,详见下面代码。(linux安装时推荐使用该方法)
bash
conda create -n maxquant
conda activate maxquant
conda install -c bioconda maxquant
maxquant --help # 查看命令行参数
#maxquant mqpar.xml
#报错如下:.NET Core 3.1 needs to be installed. Please visit https://dotnet.microsoft.com/download/dotnet-core/3.1 and install the SDK x64.
#mkdir -p dotnet; cd dotnet
#wget ...
#tar xzvf dotnet-sdk-3.1.426-linux-x64.tar.gz
#export DOTNET_ROOT=/path/software/dotnet
#export PATH=$PATH:/path/software/dotnet
此外,官网还提供了Perseus
软件,用于对MaxQuant
输出进行统计分析。
2. 用法
2.1 命令行方式(linux)
通过以下任一方法生成配置文件。其中方法1需要人工修改较多地方,方法2仅需修改文件位置,更加方便,但需要注意使用相同版本GUI来产生配置文件。
bash
# 方法1. 生成配置文件mqpar.xml
maxquant --create mqpar.xml
#maxquant mqpar.xml --changeFolder=mqpar_new.xml /fasta /raw
vi mqpar.xml
# 方法2. 相同版本GUI保存参数文件,传输到linux
基于配置文件运行软件。
bash
maxquant mqpar.xml
2.2 GUI方式(windows)
双击MaxQuant.exe
,打开以下界面。红框为参数配置模块。
1) 完整参数介绍
大部分参数通常并不需要改变,一般使用官方protocol中提供的mini工作流就可以,具体见2)。 另外,下面的一些参数随着版本更新位置已经发生改变或者移除。
Andromeda配置/Configuration(2)
Modifications
(3-10):修饰的增、改。Proteases
(11)Sequence databases
(12-13):v2.0.3.0
中没有发现该参数。
数据上传/Raw files (14)
- Load data(15):通过以下任一方法导入原始数据,如.raw等。
Load
:导入原始数据。Load folder
: 导入选中文件夹中所有原始数据。
- Experimental design(16):通过以下任一方法设置元数据。
Set*
:选中行后,①通过Set experiment
设置实验(分组/样本),相同实验的数据后续会被合并;②通过Set paramter group
设置参数组,不同参数组可以应用不同的参数设置,具体设置见(17);③通过Set fraction
设置fraction;Write*
:当数据项较多时,可以通过Write template
导出包含数据的模板文件,然后在直接编辑模板文件,最后将编辑好的模板文件通过Read from file
导入软件。
组特异参数/Group-specific parameters(17)
Type
(19)- Type(19):指定LC-MS run的类型。①label-free和MS1-labeled样本选择Standard;②传统的同位素标记标记样本选择Reporter ion MS2;③同位素标记的MS3质谱选择Reporter ion MS3。
- Multiplicity(19):指定MS1标签数。如果没有使用标签,设置为1。下方复选框选择使用的标签。
Digestion
(20)- Digestion mode(21):
- Enzyme(22):因为准确的裂解特异性等优点,胰蛋白酶在多数自下而上的蛋白质组学实验中都被用作蛋白酶。因此Enzyme 默认值为Trypsin/P。胰蛋白酶能裂解精氨酸和赖氨酸C末端的肽段,除非其后有脯氨酸。MaxQuant使用该规则对蛋白质数据库进行in silico裂解。
- Max. missed cleavages(23):蛋白酶消化并不总是完全的,通过将参数设为2,in silico裂解的序列中也包括含有额外精氨酸或赖氨酸的肽段。
Modifications
(24):根据in silico生成的多肽数据库计算出多肽的质量,并与测量的质量相匹配,从而对其进行识别。肽的质量会因肽的修饰而改变,例如在不同定量策略中应用的化学标记或生物学翻译后修饰。因此,在in silico生成的肽质量列表中还必须包括可能的肽修饰。- Variable modifications(25):Variable modifications 是指并非每个氨基酸都会发生的修饰,如蛋氨酸氧化(Oxidation (M))可能只发生在某些蛋氨酸上。再比如,只有少数肽的 N 端会发生乙酰化(Acetyl (Prorein N-term))。需要注意的是可变修饰会增加in silico肽数据库的容量,进而增加分析时间。
- Fixed modifications(39):Fixed modifications 是指特定氨基酸每次出现时都会发生的修饰。这些修饰通常是人为引入的,如蛋白质组学样品制备中防止二硫键重新形成的半胱氨酸的氨基甲酰甲基化,也是该参数的默认值Carbamidomethyl (C)。
- Max. number of modifications allowed per peptide(26);
Label-free quantification
(27):- Label-free quantification(27):选择是否应用LFQ算法。
- min. ratio count(28)
- Fast LFQ(29)
- Skip normalization(30)
- Label-free quantification(27):选择是否应用LFQ算法。
Instrument
(31)First search
: (32)Misc.
(33): Re-quantify(34); Match type(35)???
全局参数/Global parameters (36)
Sequences
(37)- Add(37):添加数据库。此外,还可以通过Identifier 和Description定义的正则,从fasta头提取ID和描述。
- Include contaminants(38): 将conf/contaminants.fasta中的蛋白添加到搜索数据库。
- Fixed modifications(39):v2.0.3.0中该参数已移动至页面(24)下,详见上文。
- Min. peptide length & Max. peptide mass (40):设置用于蛋白鉴定和定量肽段的最短长度(典型值7-9,长度<7的肽段不是唯一的。注:甚至更长的肽段也不是唯一的,比如源于同一结构域的肽段可能被同源蛋白共有,可以通过设置min unique peptides处理该情况)和最大质量。
- (Min|Max). peptide lengths for unspecific(41):设置非特异性搜索(即不使用消化酶)情况下的最小和最大肽段长度;
Identification
(42)- PSM FDR(43);
- Protein FDR(44);
- Site decoy fraction(45);
- Min. (|razor+unique|unique) peptides(46):肽会以统计的方式组合成相应的蛋白质,因此主要应根据唯一肽进行判断。可以将min unique pepetides设为1,即输出表中只报告至少有一个唯一肽的蛋白质。
- Min. (delta)? score thresholds for (un)?modified peptides(47);
- ...
Adv. Identification???
(51)Protein quantification
(55)Tables
(66)Folder locations
(67)Advanced
(72)Number of threads
(80)Start
(81)
Performance(82)
处理器数量(80)
2) minimal workflow
多数项目并不需要调整1)中的所有步骤和参数。此外,很少需要多个参数组。在对一组样本进行量化的同质实验设计中,只需执行以下步骤即可。
-
16.说明实验设计。
Parameter group能够设置不同的Group-specific parameters
。Experiment说明LC-MS runs 属于哪个样本。 -
19.设置
Type
参数。 -
22.选择消化酶(默认:Trypsin)
-
25.选择
Variable modifications
-
27.启用LFQ(如适用)
-
37.选择.fasta文件
-
39.选择
Fixed modifications
(默认Carbamidomethyl ©) -
80.设置
Number of threads
参数 -
81.点击
Start
3. Troubleshooting
https://groups.google.com/g/maxquant-list
参考
2018年,作者发布了MaxQuant的linux版本(1.6.1.0)。该版本主要依赖mono
。
官方文档链接。
一篇MaxQuant的中文实践。
Label-free data analysis using MaxQuant
文章介绍了如何Galaxy平台中使用MaxQuant,本文翻译了其中对参数的解释。