MaxQuant的安装和使用(linux OR windows)

目录

  • [1. 安装](#1. 安装)
  • [2. 用法](#2. 用法)
  • [3. Troubleshooting](#3. Troubleshooting)
  • 参考

MaxQuant 是一款定量蛋白质组学软件包,支持多种标记定量和无标定量的质谱数据。

1. 安装

MaxQuant下载方式:

  • 通过官网 下载,包括andromeda(搜索引擎)+viewer(检查原始数据、鉴定和定量结果)。
  • 通过conda下载,详见下面代码。(linux安装时推荐使用该方法)
bash 复制代码
conda create -n maxquant
conda activate maxquant
conda install -c bioconda maxquant

maxquant --help    # 查看命令行参数

#maxquant mqpar.xml
  #报错如下:.NET Core 3.1 needs to be installed. Please visit https://dotnet.microsoft.com/download/dotnet-core/3.1 and install the SDK x64.
    #mkdir -p dotnet; cd dotnet
    #wget ...
    #tar xzvf dotnet-sdk-3.1.426-linux-x64.tar.gz
    #export DOTNET_ROOT=/path/software/dotnet
    #export PATH=$PATH:/path/software/dotnet

此外,官网还提供了Perseus软件,用于对MaxQuant输出进行统计分析。

2. 用法

2.1 命令行方式(linux)

通过以下任一方法生成配置文件。其中方法1需要人工修改较多地方,方法2仅需修改文件位置,更加方便,但需要注意使用相同版本GUI来产生配置文件。

bash 复制代码
# 方法1. 生成配置文件mqpar.xml
maxquant --create mqpar.xml
#maxquant mqpar.xml --changeFolder=mqpar_new.xml /fasta /raw
vi mqpar.xml

# 方法2. 相同版本GUI保存参数文件,传输到linux

基于配置文件运行软件。

bash 复制代码
maxquant mqpar.xml

2.2 GUI方式(windows)

双击MaxQuant.exe,打开以下界面。红框为参数配置模块。

1) 完整参数介绍

大部分参数通常并不需要改变,一般使用官方protocol中提供的mini工作流就可以,具体见2)。 另外,下面的一些参数随着版本更新位置已经发生改变或者移除。

Andromeda配置/Configuration(2)
  • Modifications(3-10):修饰的增、改。
  • Proteases(11)
  • Sequence databases(12-13):v2.0.3.0中没有发现该参数。
数据上传/Raw files (14)
  • Load data(15):通过以下任一方法导入原始数据,如.raw等。
    • Load:导入原始数据。
    • Load folder: 导入选中文件夹中所有原始数据。
  • Experimental design(16):通过以下任一方法设置元数据。
    • Set*:选中行后,①通过Set experiment设置实验(分组/样本),相同实验的数据后续会被合并;②通过Set paramter group设置参数组,不同参数组可以应用不同的参数设置,具体设置见(17);③通过Set fraction设置fraction;
    • Write*:当数据项较多时,可以通过Write template导出包含数据的模板文件,然后在直接编辑模板文件,最后将编辑好的模板文件通过Read from file导入软件。
组特异参数/Group-specific parameters(17)
  • Type(19)
    • Type(19):指定LC-MS run的类型。①label-free和MS1-labeled样本选择Standard;②传统的同位素标记标记样本选择Reporter ion MS2;③同位素标记的MS3质谱选择Reporter ion MS3。
    • Multiplicity(19):指定MS1标签数。如果没有使用标签,设置为1。下方复选框选择使用的标签。
  • Digestion(20)
    • Digestion mode(21):
    • Enzyme(22):因为准确的裂解特异性等优点,胰蛋白酶在多数自下而上的蛋白质组学实验中都被用作蛋白酶。因此Enzyme 默认值为Trypsin/P。胰蛋白酶能裂解精氨酸和赖氨酸C末端的肽段,除非其后有脯氨酸。MaxQuant使用该规则对蛋白质数据库进行in silico裂解。
    • Max. missed cleavages(23):蛋白酶消化并不总是完全的,通过将参数设为2,in silico裂解的序列中也包括含有额外精氨酸或赖氨酸的肽段。
  • Modifications(24):根据in silico生成的多肽数据库计算出多肽的质量,并与测量的质量相匹配,从而对其进行识别。肽的质量会因肽的修饰而改变,例如在不同定量策略中应用的化学标记或生物学翻译后修饰。因此,在in silico生成的肽质量列表中还必须包括可能的肽修饰。
    • Variable modifications(25):Variable modifications 是指并非每个氨基酸都会发生的修饰,如蛋氨酸氧化(Oxidation (M))可能只发生在某些蛋氨酸上。再比如,只有少数肽的 N 端会发生乙酰化(Acetyl (Prorein N-term))。需要注意的是可变修饰会增加in silico肽数据库的容量,进而增加分析时间。
    • Fixed modifications(39):Fixed modifications 是指特定氨基酸每次出现时都会发生的修饰。这些修饰通常是人为引入的,如蛋白质组学样品制备中防止二硫键重新形成的半胱氨酸的氨基甲酰甲基化,也是该参数的默认值Carbamidomethyl (C)。
    • Max. number of modifications allowed per peptide(26);
  • Label-free quantification(27):
    • Label-free quantification(27):选择是否应用LFQ算法。
      • min. ratio count(28)
      • Fast LFQ(29)
      • Skip normalization(30)
  • Instrument (31)
  • First search: (32)
  • Misc.(33): Re-quantify(34); Match type(35)???
全局参数/Global parameters (36)
  • Sequences(37)
    • Add(37):添加数据库。此外,还可以通过IdentifierDescription定义的正则,从fasta头提取ID和描述。
    • Include contaminants(38): 将conf/contaminants.fasta中的蛋白添加到搜索数据库。
    • Fixed modifications(39):v2.0.3.0中该参数已移动至页面(24)下,详见上文。
    • Min. peptide length & Max. peptide mass (40):设置用于蛋白鉴定和定量肽段的最短长度(典型值7-9,长度<7的肽段不是唯一的。注:甚至更长的肽段也不是唯一的,比如源于同一结构域的肽段可能被同源蛋白共有,可以通过设置min unique peptides处理该情况)和最大质量。
    • (Min|Max). peptide lengths for unspecific(41):设置非特异性搜索(即不使用消化酶)情况下的最小和最大肽段长度;
  • Identification(42)
    • PSM FDR(43);
    • Protein FDR(44);
    • Site decoy fraction(45);
    • Min. (|razor+unique|unique) peptides(46):肽会以统计的方式组合成相应的蛋白质,因此主要应根据唯一肽进行判断。可以将min unique pepetides设为1,即输出表中只报告至少有一个唯一肽的蛋白质。
    • Min. (delta)? score thresholds for (un)?modified peptides(47);
    • ...
  • Adv. Identification???(51)
  • Protein quantification(55)
  • Tables(66)
  • Folder locations(67)
  • Advanced(72)
  • Number of threads(80)
  • Start(81)
Performance(82)
处理器数量(80)

2) minimal workflow

多数项目并不需要调整1)中的所有步骤和参数。此外,很少需要多个参数组。在对一组样本进行量化的同质实验设计中,只需执行以下步骤即可。

  • 16.说明实验设计。

    Parameter group能够设置不同的Group-specific parameters。Experiment说明LC-MS runs 属于哪个样本。

  • 19.设置Type参数。

  • 22.选择消化酶(默认:Trypsin)

  • 25.选择Variable modifications

  • 27.启用LFQ(如适用)

  • 37.选择.fasta文件

  • 39.选择Fixed modifications(默认Carbamidomethyl ©)

  • 80.设置Number of threads参数

  • 81.点击Start

3. Troubleshooting

https://groups.google.com/g/maxquant-list

参考

MaxQuant goes Linux

2018年,作者发布了MaxQuant的linux版本(1.6.1.0)。该版本主要依赖mono

MaxQuant Doc

官方文档链接。

【6】蛋白质组学鉴定定量软件之MaxQuant

一篇MaxQuant的中文实践。

Label-free data analysis using MaxQuant

文章介绍了如何Galaxy平台中使用MaxQuant,本文翻译了其中对参数的解释。

相关推荐
GIS数据转换器3 小时前
“一张图”背景下的地质灾害监测预警与防治能力建设
大数据·人工智能·数据分析·无人机·智慧城市
看海的四叔4 小时前
【SQL】SQL-管好你的字符串
大数据·数据库·hive·sql·数据分析·字符串
Mr数据杨4 小时前
飞船乘客状态预测与金融风控建模启发
大数据·机器学习·数据分析·kaggle
eqwaak06 小时前
4月30号(科技信息差)
python·科技·信息可视化·数据挖掘·数据分析
Mr数据杨6 小时前
花卉图像分类在植物识别与生态监测中的应用
人工智能·机器学习·分类·数据挖掘·数据分析·kaggle
Mr数据杨6 小时前
埃姆斯住宅房价预测与自动化估值建模
运维·机器学习·数据分析·自动化·kaggle
帅次7 小时前
Android AI 面试速刷版
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·数据分析
生物信息与育种7 小时前
全基因组重测序及群体遗传与进化分析技术服务指南
人工智能·深度学习·算法·数据分析·r语言
PaperData7 小时前
2012-2022年农业产业结构高级化
数据库·人工智能·数据分析·经管
PaperData8 小时前
2014-2026.3应届生网络招聘大数据
大数据·数据库·人工智能·数据分析·经管