作者,Evil Genius
5月最后一天了,我们来完成分子对接的最后一块拼图,3维构象定量关系。
3D-QSAR核心目的是研究分子的三维结构与其生物活性之间的定量关系,从而预测新化合物的活性,指导药物改造。
首先看定性与定量
定性
分子结构和构象的变化与生物活性的有无及强弱之间的关系来推测药物的作用方式和机理。
定量
组化合物的生物活性与其结构特征之间的相互关系,结构特征以理化参数、分子拓扑参数、量子化学指数和结构碎片指数来表示,用数理统计的方法进行数据回归分析,并以数学模型表达和概括出量变的规律。
特点
采用数理统计方法研究和揭示化合物活性与分子结构或理化特性之间的定量变化规律,以及利用寻找到的活性与分子性质间的定量变化规则,预测新的化合物的活性。
定量构效关系
定量构效关系(QSAR,Quantitative Structure-ActivityRelationship)分析是指利用理论计算和统计分析工具来研究系列化合物结构(包括二维分子结构、三维分子结构和电子结构)与其生物效应(如药物的活性、毒性、药效学性质、药代动力学参数和生物利用度等)之间的定量关系。它是药物研究中的一个重要理论计算方法和常用手段。
定量构效关系QSAR一-揭示一组化合物的生物活性与其分子结构特征之间的相互关系,以数学模型表达和概括出量变规律,以此设计新的化合物。

构效关系分类

传统QSAR(2D):用分子的二维参数(如疏水性、电性、取代基大小)来建模。就像只用文字描述一个人的外貌。
3D-QSAR:明确考虑分子的三维形状、构象以及分子周围各种力场(立体场、静电场等)的分布。就像用3D扫描和全身照来刻画一个人。
主流方法:
目前最常用的3D-QSAR技术是 CoMFA(比较分子场分析)和 CoMSIA(比较分子相似性指数分析)。
CoMFA:通过计算分子周围网格点上的立体场(分子形状、体积)和静电场(电荷分布),并与活性关联。
CoMSIA:在CoMFA基础上改进,引入疏水场和氢键场,结果更平滑、稳定。

4DQSAR:在3DQSAR的基础上,将影响空间作用的所有因素,如分子全部可能的构象、空间取向、分子的质子化状态以及环境因素如结合部位的柔性、溶剂效应等作为药物分子结构的第四维,通过数学模型描述分子结构和分子的某种生物活性之间的关系。
3D-QSAR优缺点
√不必知道靶点结构
√不必输入实验测定或理论计算的理化参数值给出可视图易于解释OSAR结果
√不限于研究相似分子结构,只须有相同的药效团以相似的方式与靶点作用
√可预测新分子的活性,而不必先合成
X预测仅限于由训练集包终的空间之内
X不能可靠地预测出原模型范围之外的
X分析的准确性取决于采用的空间结构
一般步骤

第一步

数据库:在3DQSAR模型中是由多个化合物分子结构组成的一组数据的集合
选择目标化合物,构建数据库,分析生物活性
3D-QSAR分析中的生物活性:产生预定的生物效应时所需要的浓度或剂量
生物活性通常包括:
最小抑菌浓度(MIC):指在体外培养细菌18-24小时后能抑制培养基内病原菌生长的最低药物浓度。
半数抑制浓度(IC50):活性被抑制50%时抑制剂的浓度
半数致死浓度(LC50):能使一群动物在接触外源化学物一定时间(一般固定为2-4h)后并在一定观察期限内(一般为14h)死亡50%所害的浓度
半数有效浓度(EC50):产生最大生物效应一半时的剂量
半数致死量(LD50):一半死亡时的剂量。
半数有效量(ED50):能引起50%的实验动物出现阳性反应时的药物剂量

研究中,一般不直接使用浓度作为因变量生物活性的单位,而是使用它的负对数pIC50(-lglC50).
测试集+训练集
训练集(20-25%):每个活性范围内随机选一个+活性最优化合物测试集(75-80%):其余化合物+活性最优化合物
构建数据库的过程:
结构优化(minimize)
为了确定分子低能构象,需求解与相应的分子势能面上的极小值,称为能量优化
分子叠合(align)基于药效团的叠合、基于能量包括基于复合物结构的叠合、场的叠合、基于公共骨架的叠合

结构参数
>CoMFA参数(分子场分析法):假定配基于受体的结合是非共价的,两者的亲和力或配基的生物活性与配基分子周围的空间立体场或静电场有关
>CoMSIA参数(比较分子相似性指数分析法):与CoMFA模型方法类似,分析立体场(steric,S)、静电场(electrostatic,E)氢键供体和受体场(hydrogen bonddonor/acceptor,HBD/HBA)疏水场 (hydrophobic,H)



参考文献


其中化合物数据库的设计

以及参数

用到的软件:SYBYL-X

建立化合物表单


导入全部的化合物

能量最小化




预测测试集化合物活性



