每日文献阅读-复现｜2026 Nature Communications：从百万化合物到膜蛋白选择性抑制剂，虚拟筛选如何被冷冻电镜“验货”

本文不止复述论文结果，而是进一步拆解证据链，并基于作者公开的复合物模型完成结构解析、口袋接触计算与重新制图。真正值得关注的不是某个漂亮的 docking score，而是一个计算假说如何被细胞、冷冻电镜、突变和动物实验逐级检验。

选题背景：膜蛋白、虚拟筛选与药物结合

这篇文章把蛋白质、膜和药物结合三个方向连在一起：靶点是跨膜尿素通道 UT-A2，起点是结构基础虚拟筛选，终点则是可以被结构和功能实验继续检验的选择性抑制剂。

论文信息：

题目：Hotspot pocket-based discovery of urea transporter selective inhibitors
期刊：Nature Communications
正式发表：2026 年 4 月 20 日
DOI：10.1038/s41467-026-71834-w
核心方法：DoGSiteScorer、Glide HTVS/SP/XP、LigPrep、Prime MM-GBSA、细胞功能实验和冷冻电镜

综合全文证据可以判断：这是一项完成度较高的化学探针发现工作，但尚未完成候选药物所需的系统验证。

从五个层级拆解论文证据链

图 1｜论文证据链梳理：依据方法与结果部分整理，每一级分别标出"能说明什么"和"不能说明什么"。

这条证据链并非单向推进。第一轮筛选只得到一个命中物，作者随后利用首个复合物结构刷新口袋，再进行第二轮筛选。这种"预测---实验---结构反馈---再预测"的闭环，比一次性对接排名更接近真实的药物发现过程。

下文仅保留一张论文原图，用于呈现原作者的整体研究设计；其余核心解释图均由我们依据论文数据或作者公开结构重新计算、重新绘制。

图 2｜论文 Fig. 1 原图，未修改内容，仅缩放展示。来源：Liu et al., Nature Communications (2026)，DOI：10.1038/s41467-026-71834-w，依据 CC BY 4.0 使用。

第一轮筛选：所谓"筛了一百万个"，需要拆开看

作者的 ChemDiv 来源库约有 100 万个化合物，但并不是 100 万个分子都完整跑完最昂贵的 XP 对接。Methods 给出的漏斗是：

先用 Lipinski、PAINS、反应性/毒性基团和口袋特征过滤到约 4.5 万个；
再按 Bemis--Murcko 骨架和 Tanimoto 相似度聚类，得到约 1 万个代表分子；
在 pH 7.0 ± 0.5 下枚举离子化、互变异构和立体状态；
依次进行 Glide HTVS、SP 和 XP 分层对接；
对前 1000 个结果聚类并目视检查，最终购买/测试 30 个。

图 3｜两轮筛选数字漏斗：数据来自论文 Results 与 Methods，用于区分"来源库规模"和"真正进入高精度计算或实验的规模"。

第一轮 30 个候选中，E822-1968 的 UT-A2 抑制 IC₅₀ 为 0.44 ± 0.03 μM，相当于 1/30 的实验命中。3.3% 看起来不耀眼，但这个分子提供了更重要的东西：一套可以解析的蛋白---配体复合物。

由此可以看到：首轮命中物的价值不只体现在活性数字，还取决于它能否产生可用于下一轮决策的结构信息。

结构反馈：第一轮命中为什么没有被当成终点

E822-1968--UT-A2 的 2.9 Å 冷冻电镜结构显示，配体进入了一个此前未充分利用的 ATC 亚口袋（ATCP），却没有足够深入胞外尿素结合口袋（EUBP）。作者据此把 ATCP 与 EUBP 合并成新的热点口袋，再用约 1 万个代表化合物做第二轮 SP/XP 对接。

第二轮只挑 5 个做实验，其中 2 个显示活性：M353-0039 的 IC₅₀ 为 0.35 ± 0.03 μM，D400-1574 为 3.42 ± 0.96 μM。

"2/5 比 1/30 好很多"可以作为直观描述，却不能当作严格的命中率提升统计：样本太小，而且第二轮候选已经受到首轮结构和人工判断的强烈富集。更准确的说法是：结构反馈提高了下一轮决策的针对性。

对作者公开的复合物模型进行独立结构复核

本次复核没有直接截取论文结构图，而是使用作者在 Figshare v3 公布的 UTA2-M353-coot-16.pdb，以链 A 的 M353-0039 为代表重新进行结构解析和制图。模型包含 3 条蛋白链和 3 个配体副本。

图 4｜UT-A2 三聚体与 M353-0039 的空间位置：基于作者 Figshare v3 的复合物模型重新渲染。蓝色为链 A，灰色为其余链，洋红色为 M353-0039。

M353-0039--UT-A2 的冷冻电镜分辨率为 2.7 Å。论文指出，它比 E822-1968 向尿素通道深处延伸约 6 Å，进入 EUBP，并在 C285、G322 等不保守残基附近形成选择性识别环境。

图 5｜M353-0039 结合口袋：基于作者公开模型重新选取 4.5 Å 邻域。C285 为青色，G322 为金色，Q231 为蓝色，A323 为橙色，M353-0039 为洋红色；虚线仅表示指定原子间的几何距离。

独立复核：为什么"19 个接触"不能脱离定义理解

我们采用可复核的统一规则重新计算：选取链 A、配体 LIG 401，并将蛋白与配体重原子的最短距离阈值设为 4.5 Å。按照这一标准，共得到 22 个接触残基。

图 6｜M353-0039 口袋接触距离：按照 4.5 Å 重原子阈值重新计算，每条横线表示相应残基与配体的最短距离。

论文报告 M353-0039 与 19 个残基接触，而本次独立复核得到 22 个。这并不必然矛盾：接触数会随距离阈值、是否计入氢原子、残基/原子定义和人工判读而变化。比接触数完全一致更重要的是，关键空间关系能否被重复观察到。

在本次计算中，C285 的 SG 与配体 N06 相距 3.48 Å，G322 主链 C 与配体 S08 的最近距离为 3.60 Å。这些结果与论文描述的选择性区域在空间上相容，但需要强调：重原子接近只是几何观察，不能自动证明氢键，也不等同于结合能分解。

论文对 C285 的功能证据更直接：C285A 使 M353-0039 的 IC₅₀ 变为 1.35 ± 0.34 μM，C285W 条件下未检测到抑制。也就是说，结构给出解释，突变实验才进一步支持因果关系。

对接到底有多可靠

作者做了三层验证：

用 11 个已知活性分子和 300 个性质匹配的 decoy 做回顾性测试，ROC-AUC 为 0.82；
对已知配体 HQA2 重对接，预测与实验构象 RMSD 为 1.9 Å；
E822-1968 和 M353-0039 的预测构象随后接受了独立冷冻电镜结构检验。

其中第三层验证最有说服力，因为实验结构不是用于生成对接姿势的同一份答案，而是对预测结果的前瞻性检验。不过，AUC 基准只包含 11 个活性分子，规模仍然偏小，只能说明当前参数具有一定可用性，不能证明其对所有新骨架都能稳定排序。

Prime MM-GBSA 在这里也只能作为辅助排序。它采用 OPLS3、VSGB 和局部柔性最小化，不等于严格的绝对/相对结合自由能，更不能替代实验亲和力。

证据边界：为什么目前仍不能称为"新药"

图 7｜证据边界示意：结构、功能和体内结果分别回答不同问题，现有证据仍不足以支持候选药物或临床药效结论。

作者在低蛋白饮食并禁水的小鼠模型中，以 80 mg/kg 腹腔注射 M353-0039；4 小时后，肾髓质和尿液中的尿素浓度及渗透压下降。HepG2 细胞中也观察到胞内尿素增加、上清尿素降低，方向上符合尿素外排受抑制。

这些结果支持"该分子能在体内外影响 UT-A2 相关功能"，但离药效结论仍有明显距离：动物样本量只有 n=4 或 n=5，剂量较高，给药方式是腹腔注射，效应主要出现在低蛋白加脱水的特定应激条件；文章也没有建立口服疗效、疾病模型获益、长期安全性和充分的暴露---效应关系。

因此，更准确的定位是：M353-0039 是一种具有研究价值的 UT-A2 选择性化学探针，现有证据尚不足以将其定义为候选利尿药。

在原论文基础上，我们额外完成了哪些复核

逐项核验论文页码、图号、方法描述及图片授权，区分论文原图与重新绘制内容；
解析作者公开的复合物模型，确认蛋白链、配体副本和代表性分析对象；
按明确的 4.5 Å 重原子阈值重新计算口袋接触，并公开关键距离和解释边界；
从原始结构模型重新选择口袋、着色和渲染，替代直接截取论文结构图；
将"结合姿势""选择性抑制"和"候选药物"拆分为不同证据层级，避免结论越界。

若要继续推进至候选药物阶段，仍需补充更大规模的外部验证、蛋白构象集合对接、姿势物理合理性检查、更严格的自由能计算，以及口服暴露、脱靶与系统安全性研究。

今日阅读小结

这篇论文最值得借鉴的，不是某个 Glide 参数，而是一种研究策略：让未达到预期的筛选结果继续产生结构信息，并让预测持续接受独立证据的校正。

第一轮 1/30 的命中率并不漂亮，但 E822-1968 暴露了 ATCP；ATCP 与 EUBP 随后被合并成更有功能意义的新口袋，第二轮才找到更深入通道、选择性更好的 M353-0039。虚拟筛选因此不是一次性的排行榜，而是可以被实验不断更新的模型。

原文与数据入口

图片来源声明：本文共使用 1 张论文原图（图 2，已逐项标明作者、期刊、DOI、许可和"未修改"状态）；其余 6 张正文图均为我们依据论文数据或作者公开结构重新计算、重新绘制，不是论文原图。

本文涉及的文献检索、深度精读、证据核验、科研制图与博客整理，**智澈乐尚网络工作平台**均可协助完成；如有类似需求，欢迎联系我们。