2400 万个未培养病毒重新定义病毒多样性

病毒是地球上最丰富的生物实体,深刻影响着宿主的代谢、进化和生态。然而,由于绝大多数病毒无法通过传统方法培养,我们对病毒世界的认知一直局限在冰山一角。随着宏基因组学技术的爆发,未培养病毒基因组(UViGs)的数量呈指数级增长,如何整合这些数据为病毒学研究提供帮助?

《Nucleic Acids Research》发布数据库文章,整合2400万个未培养病毒基因组,重新定义了病毒多样性研究的边界,推出MetaVR数据库,提供最大的UViGs集合。免费访问地址:https://www.meta-virome.org/.

图1 图形摘要

1.MetaVR显著扩展了病毒多样性

MetaVR整合了来自全球37,961个宏基因组、8,694个宏转录组以及超过10万个微生物分离株、单细胞扩增基因组和宏基因组组装基因组的数据,病毒基因组总数达到24,435,662条,较前一版本增长57.6%。

2.地理覆盖范围扩展

MetaVR揭示了病毒资源的全球分布状况。所有大陆的vOTU数量均有显著增长,其中欧洲和亚洲的vOTU增长最为显著。

3.分类与宿主预测系统全面升级

MetaVR采用国际病毒分类委员会(ICTV)第39版分类系统,为2366万条UViGs(占总数的97%)提供了分类学标注。数据库首次引入了巴尔的摩分类系统,按病毒核酸类型对基因组进行分类,为研究病毒进化历程提供了新视角。

4.蛋白结构与功能研究的新纪元

创新性的整合了蛋白聚类和结构预测功能。研究人员对所有预测蛋白进行了聚类分析,获得了4239万个蛋白簇,并对包含15个以上独特成员的簇进行了AlphaFold3结构预测。获得74.9万个预测结构,使MetaVR成为目前最大的病毒蛋白结构资源库。

5.用户友好的访问界面

支持对UViGs、vOTUs、蛋白簇和预测结构的全方位检索。提供了完整的API接口,支持程序化数据访问和筛选,便于用户将这一资源整合到自己的分析流程中。

参考文献

Meta-virus resource (MetaVR): expanding the frontiers of viral diversity with 24 million uncultivated virus genomes.Nucleic Acids Research, 2025.

原文链接

Doi.org/10.1093/nar/gkaf1283

相关推荐
倔强的石头_7 小时前
《Kingbase护城河》——猎捕慢查询:执行计划的微观解析与索引调优实战
数据库
SelectDB9 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
jiayou641 天前
KingbaseES 表级与列级加密完全指南
数据库·后端
GBASE2 天前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
xiezhr3 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
吃糖的小孩4 天前
给 QQ AI 机器人设计“可控记忆”:会话摘要、手动长期记忆与角色卡边界
数据库
笃行3504 天前
金仓数据库数据安全双防线:静态存储加密与传输加密实战
数据库
笃行3504 天前
金仓数据库物理备份实战:sys_rman 全流程演练与误覆盖抢救
数据库
笃行3504 天前
金仓数据库逻辑备份实战:从全库导出到 Schema 替换的完整闭环
数据库