每日文献阅读-复现|2026 Nature Communications:从百万化合物到膜蛋白选择性抑制剂,虚拟筛选如何被冷冻电镜“验货”

本文不止复述论文结果,而是进一步拆解证据链,并基于作者公开的复合物模型完成结构解析、口袋接触计算与重新制图。真正值得关注的不是某个漂亮的 docking score,而是一个计算假说如何被细胞、冷冻电镜、突变和动物实验逐级检验。

选题背景:膜蛋白、虚拟筛选与药物结合

这篇文章把蛋白质、膜和药物结合三个方向连在一起:靶点是跨膜尿素通道 UT-A2,起点是结构基础虚拟筛选,终点则是可以被结构和功能实验继续检验的选择性抑制剂。

论文信息:

  • 题目:Hotspot pocket-based discovery of urea transporter selective inhibitors
  • 期刊:Nature Communications
  • 正式发表:2026 年 4 月 20 日
  • DOI:10.1038/s41467-026-71834-w
  • 核心方法:DoGSiteScorer、Glide HTVS/SP/XP、LigPrep、Prime MM-GBSA、细胞功能实验和冷冻电镜

综合全文证据可以判断:这是一项完成度较高的化学探针发现工作,但尚未完成候选药物所需的系统验证。

从五个层级拆解论文证据链

图 1|论文证据链梳理:依据方法与结果部分整理,每一级分别标出"能说明什么"和"不能说明什么"。

这条证据链并非单向推进。第一轮筛选只得到一个命中物,作者随后利用首个复合物结构刷新口袋,再进行第二轮筛选。这种"预测---实验---结构反馈---再预测"的闭环,比一次性对接排名更接近真实的药物发现过程。

下文仅保留一张论文原图,用于呈现原作者的整体研究设计;其余核心解释图均由我们依据论文数据或作者公开结构重新计算、重新绘制。

图 2|论文 Fig. 1 原图,未修改内容,仅缩放展示。来源:Liu et al., Nature Communications (2026),DOI:10.1038/s41467-026-71834-w,依据 CC BY 4.0 使用。

第一轮筛选:所谓"筛了一百万个",需要拆开看

作者的 ChemDiv 来源库约有 100 万个化合物,但并不是 100 万个分子都完整跑完最昂贵的 XP 对接。Methods 给出的漏斗是:

  1. 先用 Lipinski、PAINS、反应性/毒性基团和口袋特征过滤到约 4.5 万个;
  2. 再按 Bemis--Murcko 骨架和 Tanimoto 相似度聚类,得到约 1 万个代表分子;
  3. 在 pH 7.0 ± 0.5 下枚举离子化、互变异构和立体状态;
  4. 依次进行 Glide HTVS、SP 和 XP 分层对接;
  5. 对前 1000 个结果聚类并目视检查,最终购买/测试 30 个。

图 3|两轮筛选数字漏斗:数据来自论文 Results 与 Methods,用于区分"来源库规模"和"真正进入高精度计算或实验的规模"。

第一轮 30 个候选中,E822-1968 的 UT-A2 抑制 IC₅₀ 为 0.44 ± 0.03 μM,相当于 1/30 的实验命中。3.3% 看起来不耀眼,但这个分子提供了更重要的东西:一套可以解析的蛋白---配体复合物。

由此可以看到:首轮命中物的价值不只体现在活性数字,还取决于它能否产生可用于下一轮决策的结构信息。

结构反馈:第一轮命中为什么没有被当成终点

E822-1968--UT-A2 的 2.9 Å 冷冻电镜结构显示,配体进入了一个此前未充分利用的 ATC 亚口袋(ATCP),却没有足够深入胞外尿素结合口袋(EUBP)。作者据此把 ATCP 与 EUBP 合并成新的热点口袋,再用约 1 万个代表化合物做第二轮 SP/XP 对接。

第二轮只挑 5 个做实验,其中 2 个显示活性:M353-0039 的 IC₅₀ 为 0.35 ± 0.03 μM,D400-1574 为 3.42 ± 0.96 μM。

"2/5 比 1/30 好很多"可以作为直观描述,却不能当作严格的命中率提升统计:样本太小,而且第二轮候选已经受到首轮结构和人工判断的强烈富集。更准确的说法是:结构反馈提高了下一轮决策的针对性。

对作者公开的复合物模型进行独立结构复核

本次复核没有直接截取论文结构图,而是使用作者在 Figshare v3 公布的 UTA2-M353-coot-16.pdb,以链 A 的 M353-0039 为代表重新进行结构解析和制图。模型包含 3 条蛋白链和 3 个配体副本。

图 4|UT-A2 三聚体与 M353-0039 的空间位置:基于作者 Figshare v3 的复合物模型重新渲染。蓝色为链 A,灰色为其余链,洋红色为 M353-0039。

M353-0039--UT-A2 的冷冻电镜分辨率为 2.7 Å。论文指出,它比 E822-1968 向尿素通道深处延伸约 6 Å,进入 EUBP,并在 C285、G322 等不保守残基附近形成选择性识别环境。

图 5|M353-0039 结合口袋:基于作者公开模型重新选取 4.5 Å 邻域。C285 为青色,G322 为金色,Q231 为蓝色,A323 为橙色,M353-0039 为洋红色;虚线仅表示指定原子间的几何距离。

独立复核:为什么"19 个接触"不能脱离定义理解

我们采用可复核的统一规则重新计算:选取链 A、配体 LIG 401,并将蛋白与配体重原子的最短距离阈值设为 4.5 Å。按照这一标准,共得到 22 个接触残基。

图 6|M353-0039 口袋接触距离:按照 4.5 Å 重原子阈值重新计算,每条横线表示相应残基与配体的最短距离。

论文报告 M353-0039 与 19 个残基接触,而本次独立复核得到 22 个。这并不必然矛盾:接触数会随距离阈值、是否计入氢原子、残基/原子定义和人工判读而变化。比接触数完全一致更重要的是,关键空间关系能否被重复观察到。

在本次计算中,C285 的 SG 与配体 N06 相距 3.48 Å,G322 主链 C 与配体 S08 的最近距离为 3.60 Å。这些结果与论文描述的选择性区域在空间上相容,但需要强调:重原子接近只是几何观察,不能自动证明氢键,也不等同于结合能分解。

论文对 C285 的功能证据更直接:C285A 使 M353-0039 的 IC₅₀ 变为 1.35 ± 0.34 μM,C285W 条件下未检测到抑制。也就是说,结构给出解释,突变实验才进一步支持因果关系。

对接到底有多可靠

作者做了三层验证:

  • 用 11 个已知活性分子和 300 个性质匹配的 decoy 做回顾性测试,ROC-AUC 为 0.82;
  • 对已知配体 HQA2 重对接,预测与实验构象 RMSD 为 1.9 Å;
  • E822-1968 和 M353-0039 的预测构象随后接受了独立冷冻电镜结构检验。

其中第三层验证最有说服力,因为实验结构不是用于生成对接姿势的同一份答案,而是对预测结果的前瞻性检验。不过,AUC 基准只包含 11 个活性分子,规模仍然偏小,只能说明当前参数具有一定可用性,不能证明其对所有新骨架都能稳定排序。

Prime MM-GBSA 在这里也只能作为辅助排序。它采用 OPLS3、VSGB 和局部柔性最小化,不等于严格的绝对/相对结合自由能,更不能替代实验亲和力。

证据边界:为什么目前仍不能称为"新药"

图 7|证据边界示意:结构、功能和体内结果分别回答不同问题,现有证据仍不足以支持候选药物或临床药效结论。

作者在低蛋白饮食并禁水的小鼠模型中,以 80 mg/kg 腹腔注射 M353-0039;4 小时后,肾髓质和尿液中的尿素浓度及渗透压下降。HepG2 细胞中也观察到胞内尿素增加、上清尿素降低,方向上符合尿素外排受抑制。

这些结果支持"该分子能在体内外影响 UT-A2 相关功能",但离药效结论仍有明显距离:动物样本量只有 n=4 或 n=5,剂量较高,给药方式是腹腔注射,效应主要出现在低蛋白加脱水的特定应激条件;文章也没有建立口服疗效、疾病模型获益、长期安全性和充分的暴露---效应关系。

因此,更准确的定位是:M353-0039 是一种具有研究价值的 UT-A2 选择性化学探针,现有证据尚不足以将其定义为候选利尿药。

在原论文基础上,我们额外完成了哪些复核

  1. 逐项核验论文页码、图号、方法描述及图片授权,区分论文原图与重新绘制内容;
  2. 解析作者公开的复合物模型,确认蛋白链、配体副本和代表性分析对象;
  3. 按明确的 4.5 Å 重原子阈值重新计算口袋接触,并公开关键距离和解释边界;
  4. 从原始结构模型重新选择口袋、着色和渲染,替代直接截取论文结构图;
  5. 将"结合姿势""选择性抑制"和"候选药物"拆分为不同证据层级,避免结论越界。

若要继续推进至候选药物阶段,仍需补充更大规模的外部验证、蛋白构象集合对接、姿势物理合理性检查、更严格的自由能计算,以及口服暴露、脱靶与系统安全性研究。

今日阅读小结

这篇论文最值得借鉴的,不是某个 Glide 参数,而是一种研究策略:让未达到预期的筛选结果继续产生结构信息,并让预测持续接受独立证据的校正。

第一轮 1/30 的命中率并不漂亮,但 E822-1968 暴露了 ATCP;ATCP 与 EUBP 随后被合并成更有功能意义的新口袋,第二轮才找到更深入通道、选择性更好的 M353-0039。虚拟筛选因此不是一次性的排行榜,而是可以被实验不断更新的模型。

原文与数据入口

图片来源声明:本文共使用 1 张论文原图(图 2,已逐项标明作者、期刊、DOI、许可和"未修改"状态);其余 6 张正文图均为我们依据论文数据或作者公开结构重新计算、重新绘制,不是论文原图。

本文涉及的文献检索、深度精读、证据核验、科研制图与博客整理,**智澈乐尚网络工作平台**均可协助完成;如有类似需求,欢迎联系我们。