病毒是地球上最丰富的生物实体,深刻影响着宿主的代谢、进化和生态。然而,由于绝大多数病毒无法通过传统方法培养,我们对病毒世界的认知一直局限在冰山一角。随着宏基因组学技术的爆发,未培养病毒基因组(UViGs)的数量呈指数级增长,如何整合这些数据为病毒学研究提供帮助?
《Nucleic Acids Research》发布数据库文章,整合2400万个未培养病毒基因组,重新定义了病毒多样性研究的边界,推出MetaVR数据库,提供最大的UViGs集合。免费访问地址:https://www.meta-virome.org/.

图1 图形摘要
1.MetaVR显著扩展了病毒多样性
MetaVR整合了来自全球37,961个宏基因组、8,694个宏转录组以及超过10万个微生物分离株、单细胞扩增基因组和宏基因组组装基因组的数据,病毒基因组总数达到24,435,662条,较前一版本增长57.6%。
2.地理覆盖范围扩展
MetaVR揭示了病毒资源的全球分布状况。所有大陆的vOTU数量均有显著增长,其中欧洲和亚洲的vOTU增长最为显著。
3.分类与宿主预测系统全面升级
MetaVR采用国际病毒分类委员会(ICTV)第39版分类系统,为2366万条UViGs(占总数的97%)提供了分类学标注。数据库首次引入了巴尔的摩分类系统,按病毒核酸类型对基因组进行分类,为研究病毒进化历程提供了新视角。
4.蛋白结构与功能研究的新纪元
创新性的整合了蛋白聚类和结构预测功能。研究人员对所有预测蛋白进行了聚类分析,获得了4239万个蛋白簇,并对包含15个以上独特成员的簇进行了AlphaFold3结构预测。获得74.9万个预测结构,使MetaVR成为目前最大的病毒蛋白结构资源库。
5.用户友好的访问界面
支持对UViGs、vOTUs、蛋白簇和预测结构的全方位检索。提供了完整的API接口,支持程序化数据访问和筛选,便于用户将这一资源整合到自己的分析流程中。

参考文献
Meta-virus resource (MetaVR): expanding the frontiers of viral diversity with 24 million uncultivated virus genomes.Nucleic Acids Research, 2025.
原文链接