作者,Evil Genius
现在高精度的空间转录组已经发展到覆盖到全基因了,大家觉得能跟上么?


而且开始推完全定制的版本,确实厉害

当然了,这种产品研发离我们很远,我们都只是个普通人,并不掌握生产资料。
今天我们补充一个内容,那就是分子动力学的力场。
分子动力学中的力场,本质上是一套用于计算原子间相互作用力和势能的经验数学模型。
在分子动力学模拟中,力场直接决定了模拟的准确性。它把原子看作由"弹簧"(化学键)连接的球体,通过一系列数学公式来描述体系的能量,原子受力则源于能量对位置的梯度。
1. 力场的构成:能量的数学分解
力场将复杂的分子总能量分解为几个独立的、物理意义明确的贡献项之和。这套思路被称为"力的经验力场",其总能量的标准形式如下:
-
键合相互作用 (Intramolecular):描述分子内通过化学键连接的原子间的相互作用,主要包括:
-
键伸缩能 (Bond Stretching) :描述两个原子间化学键的伸缩,通常用谐振子模型(类似胡克定律)来描述。
-
键角弯曲能 (Angle Bending):描述三个原子形成化学键角度的变化。
-
二面角扭曲能 (Torsion/Dihedral):描述分子中四个原子形成的二面角旋转,是决定分子构象变化(如蛋白质折叠)的关键。
-
-
非键合相互作用 (Non-bonded):描述原子间没有通过化学键连接时(或属于不同分子)的作用,主要包括:
-
范德华力 (van der Waals) :表现为原子间的短程排斥和长程吸引,通常用Lennard-Jones (L-J) 势函数来描述。
-
静电相互作用 (Electrostatic) :由原子的部分电荷(由力场参数指定)产生,遵循库仑定律,在生物分子和离子体系中至关重要。
-
2. 力场的主要分类与特点
力场发展至今,已衍生出众多类型,针对不同的研究体系和精度要求。主流分类如下:
| 类别 | 特点与函数形式 | 典型代表 | 主要应用场景 |
|---|---|---|---|
| Class I (传统力场) | 函数形式简单,仅包含基础的键合项(键、角、二面角)和简单的非键项。计算速度快,通用性强。 | AMBER , CHARMM , OPLS-AA , GAFF , DREIDING | 生物大分子(蛋白质、DNA)、有机小分子、聚合物。 |
| Class II (第二代力场) | 在Class I基础上增加了更多交叉项(如键-键耦合),能更精确地描述分子内振动耦合,适合需要精确力学性质的研究。 | CFF , PCFF , COMPASS , MMFF94 | 材料科学、高分子、有机-无机界面,预测热力学和力学性能。 |
| Class III (极化力场) | 考虑原子的电荷会随周围环境变化而"极化",精度更高但计算量显著增加。 | AMOEBA | 需精确描述极化效应的体系,如离子溶液、电荷转移体系。 |
| Reactive (反应力场) | 能够模拟化学反应过程中化学键的形成与断裂。 | ReaxFF | 燃烧、催化反应、化学气相沉积等涉及化学反应的过程。 |
| ML-FFs (机器学习力场) | 用量子化学计算(如密度泛函理论)的高精度数据训练神经网络等模型,精度接近量子力学,速度远超传统量子化学方法。 | DeepMD , MACE , MatterSim | 追求高精度的复杂材料模拟,如相变、热导率计算。 |
3. 如何选择合适的力场?
选择合适的力场是成功模拟的关键,主要考虑以下两点:
-
体系匹配度 :不同的力场是基于特定"训练集"开发的。例如,模拟蛋白质必须优先选择AMBER 或CHARMM ,而模拟高分子材料则COMPASS 或PCFF更具优势。
-
精度与效率的权衡:Class I力场计算速度快,适合长时间(微秒级)或大体系(数十万原子)的模拟。如果需要研究材料的精细力学性质,则需牺牲部分效率选择Class II力场。若追求最高精度,且体系不大,则可考虑机器学习力场。
我们来简单罗列一下
GROMOS:烷烃、蛋白、核酸、糖、有机小分子
OPLS:蛋白、糖、有机小分子
AMBER:蛋白、核酸、部分有机小分子
GAFF:各种有机小分子(AMBER兼容)
GLYCAM:糖、磷脂(AMBER兼容)
Lipid:磷脂、胆固醇(AMBER兼容)
CHARMM:磷脂、核酸、蛋白、糖、部分有机小分子
CGenFF:各种有机小分子(CHARMM兼容)
Dreiding、UFF:各种类型分子和材料
COMPASS:有机和一些无机分子、高分子,常用于材料领域的各种性质计算。MS私有,不公开
MM系列、MMFF94:准确计算各种有机小分子
ReaxFF:最流行的反应力场
MARTINI:粗粒化。磷脂、蛋白质、聚合物、糖、胆固醇
===================================
每个我们都来看看:首先是AMBER力场
AMBER是最著名、使用最广泛、被动力学程序支持最多的用于蛋白质和核酸模拟的力场,且是AMBER程序中御用的力场。版本繁多,至今一直在不断发展、完善。
适用范围:蛋白、核酸的凝聚相模拟,以及少量有机小分子
开发年代:1984至今
模型:全原子。仅84、03UA版为联合原子
程序支持:Amber(版本支持得最完整).GROMACS.NAMD、Gaussian.MacroModel. Tinker. MOE. NWChem. Hyperchem. Yasara. ACEMD.Desmond
函数形式:一般简单形式。仅84、86版有氢键项,仅02、02EP有可极化项
原子电荷:RESP
扩展一下:RESP电荷
全称:Restrained Electrostatic Potential,即约束静电势电荷。
基本思路:先用高精度量子化学方法(如HF/6-31G*)计算分子周围空间各点的静电势,然后调整每个原子的电荷,使这些原子电荷在分子外部产生的静电势,与量子力学算出的静电势尽可能接近。
关键约束:引入一个"惩罚项",避免不同等效原子(如甲基上的三个氢)在拟合后产生微小差异,强制它们保持电荷等价,使模型更符合化学直觉。
AMBER力场的历史版本
AMBER84:最早的AMBER力场版本,用于模拟核酸和蛋白质,是联合原子力场
AMBER86:将AMBER84扩展为全原子力场。
AMBER94:去掉了之前版本的氢键项,原子电荷改用RESP方法在HF/6-31G*级别下获得。重新拟合了成键和范德华参数。比之前版本明显更适合凝聚相模拟。
AMBER96:修改了AMBER94的扭转项参数,使算出来的构象能量差更接近量化计算结果,但应用不广泛,有偏向于产生折叠构象的问题。
AMBER98: 对AMBER94改进了核酸中糖苷的扭转角参数.
AMBER99:大部分参数来自AMBER94力场,修改了许多扭转角的参数,扩展了原子类型使之能更多地用在蛋白和核酸以外的体系,算有机分子构象能量差比之前更准。
虽然AMBER99被使用广泛,但AMBER99问题也明显:甘氨酸的骨架参数有问题。α构象出现倾向过高(AMBER94也有此问题)。对于DNA,AMBER99长时间模拟中亚稳态构象占统治地位(虽然在RNA中也有这问题,但不那么严重)。强烈不建议用原始的AMBER99.
AMBER99之后官方在蛋白质模拟方面的改进
AMBER03:官方对AMBER99进行改进的版本。基于MP2/cc-pVTZ级别下计算的二肽模型能量曲线重新拟合了蛋白质骨架参数,解决了a螺旋的过度出现倾向。原子电荷还是用RESP方法拟合,但是从真空下HF/6-3IG*改为了B3LYP/cc-pVTZ结合IEFPCM隐式溶剂模型(介电常数为4)来实现。
AMBERO3UA:AMBER03的联合原子版本。氨基酸侧链上与碳相连的氢原子与碳合并为联合原子,骨架上的氢原子和芳香环上的氢原子仍被保留。由于骨架还是全原子故骨架势参数没变,侧链上的参数因用了联合原子模型故重新拟合。核酸参数完全没变,且还是全原子模型。
之前AMBER力场的主要开发者Kollman去世后,由Stony Brook(SB)大学的Carlos Simmerling等继续开发。为了考虑与以往参数的兼容性,原子电荷仍使用HF/6-31G*下拟合的RESP电荷。
AMBER99SB-LIDN:对AMBER99的蛋白质骨架二面角参数进行修正,二级结构间分布的比例得到了改善。也解决了甘氨酸骨架参数问题。
AMBER14SB: 是在AMBER99SB-ILDN基础上对骨架参数进行略微修正,并且把氨基酸侧链参数完全进行了重新拟合,从而使得计算结果更符合实验数据。是GROMACS目前可以用的AMBER力场里最佳的。
==================================================
GAFF力场:General AMBER Force Field
GAFF是与AMBER力场完全兼容的用来描述由H,C,N.O,S.P.卤素构成的各种有机小分子。范德华参数和AMBER99相同。尽管力场形式更简单,结构描述精度甚至比复杂力场MMFF94更好,和TripOs力场持平。Amber程序还支持尚未公开发表的GAFF2.x力场。
由于是普适型力场,用于AMBER力场专门描述的体系时精度必定比不上AMBER
适用范围:各种有机小分子,聚合物亦可
开发年代:2004至今
模型:全原子
程 序 支持:AMBER、 Avogadro. Molden
函数形式:一般简单形式
原子电荷:RESP或AMI-BCC
======================================================
GLYCAM力场:Glycans and glycoconjugates in AMBER与AMBER力场完全兼容的糖、磷脂力场,可以和AMBER联用研究糖蛋白等问题。
适用范围:糖、磷脂、糖复合物
开发年代:1993至今
模型:全原子
程序支持:AMBER
函数形式:一般简单形式
原子电荷:RESP(后期版本对MD过程中均匀取的I00个构象分别计算RESP电荷并做系综平均)
GLYCAM93:GLYCAM力场最早版本,只支持糖。
GLYCAM2000 (也称2000A) :对GLYCAM93参数进行了一些修改。
LYCAM06:将GLYCAM93参数进行了广义化,使之日后有可能用于更多体系而非仅限于糖。对脂肪氢的原子电荷不直接计算而当成0。水合层特征、扩散速率计算结果比之前更合理。适用范围在Mol.Simul,34,349(2008)中被扩展到磷脂和糖脂GLYCAM06的参数一直在不断更新,用英文字母作后缀表示版本,如06a,06b...
GLYCAMO6-LP (也称04EP 或06EP) :在 GLYCAM06 基础上用额外的点电荷描述氧的孤对电子,精度有所提升。
q4md-CD力场基于GLYCAM构建,可以模拟取代的环糊精以及与氨基酸相连的环糊精。
===========================================
OPLS力场:Optimized Potentials for Liquid Simulations
耶鲁大学的Jorgensen等人开发的专门强调凝聚相模拟的力场。使用非常广泛。原子电荷和L参数通过令结果尽可能重现实验热力学数据和气相结构参数获得。
适用范围:蛋白质、糖、有机小分子凝聚相模拟,聚合物亦可
开发年代:1987至今
模型:除OPLS-UA为联合原子外都是全原子
程序支持:GROMACS.Tinker、NAMD、MacroModel.Hyperchem. ACEMD. Desmond
函数形式:一般简单形式
OPLS-UA:联合原子力场,对25种氨基酸残基定义了原子类型并给出了参数。成键参数基于AMBER84获得
OPLS-AA:从此变成了全原子力场,定义了用于一批有机小分子和氨基酸的参数。键伸缩和键角参数基于AMBER86,而扭转项参数向HF/6-31G*数据拟合获得。JCC,18,1955(1997)给OPLS-AA添加了一些扭转项使之能用于糖的模拟
OPLS-AA/L (也称OPLS-AA-2005): 主要是对OPLS-AA的蛋白质涉及的扭转参数重新在更高精度LMP2/cc-pVTZ(-f)下进行了拟合
OPLS-AAM:改进了OPLS-AAL的氮基酸残基的骨架和侧链扭转参数,改进了OPLS-AAL的RNA的扭转势参数
测试表明OPLS-AA/儿力场模拟蛋白质明显不如其它力场
=================================================
GROMOS力场
GROMOS87(也叫GROMOS37C4):未公开发表,1987内置于GROMOS程序中,包含蛋白、核酸、烷烃的参数。
GROMOS96:未公开发表,从1996内置于GROMOS程序,力场形式相较GROMOS87有所变化并改进了部分参数。
此后开发者不断对GROMOS96的参数进行改进,大多都公开发表,版本名A前边的数字代表所含原子类型数目,后面的是版本号。
GROMACS支持的力场(自带). GROMOS:43AI,43A2, 45A3,53A5,53A6, 54A7. AMBER:94, 96, 99, 99SB, 99SB-ILDN, GS,03. OPLS-AA/L.CHARMM27(支持CMAP项,较老,少用)
GROMACS使用的单位
·长度:nm
·时间:pS
·电荷:e (Elementary charge)
·温度:K
·质量:原子单位质量
·能量:k/mol·力:k/(molnm)
·压力:bar
·速度:nm/ps