2400 万个未培养病毒重新定义病毒多样性

病毒是地球上最丰富的生物实体,深刻影响着宿主的代谢、进化和生态。然而,由于绝大多数病毒无法通过传统方法培养,我们对病毒世界的认知一直局限在冰山一角。随着宏基因组学技术的爆发,未培养病毒基因组(UViGs)的数量呈指数级增长,如何整合这些数据为病毒学研究提供帮助?

《Nucleic Acids Research》发布数据库文章,整合2400万个未培养病毒基因组,重新定义了病毒多样性研究的边界,推出MetaVR数据库,提供最大的UViGs集合。免费访问地址:https://www.meta-virome.org/.

图1 图形摘要

1.MetaVR显著扩展了病毒多样性

MetaVR整合了来自全球37,961个宏基因组、8,694个宏转录组以及超过10万个微生物分离株、单细胞扩增基因组和宏基因组组装基因组的数据,病毒基因组总数达到24,435,662条,较前一版本增长57.6%。

2.地理覆盖范围扩展

MetaVR揭示了病毒资源的全球分布状况。所有大陆的vOTU数量均有显著增长,其中欧洲和亚洲的vOTU增长最为显著。

3.分类与宿主预测系统全面升级

MetaVR采用国际病毒分类委员会(ICTV)第39版分类系统,为2366万条UViGs(占总数的97%)提供了分类学标注。数据库首次引入了巴尔的摩分类系统,按病毒核酸类型对基因组进行分类,为研究病毒进化历程提供了新视角。

4.蛋白结构与功能研究的新纪元

创新性的整合了蛋白聚类和结构预测功能。研究人员对所有预测蛋白进行了聚类分析,获得了4239万个蛋白簇,并对包含15个以上独特成员的簇进行了AlphaFold3结构预测。获得74.9万个预测结构,使MetaVR成为目前最大的病毒蛋白结构资源库。

5.用户友好的访问界面

支持对UViGs、vOTUs、蛋白簇和预测结构的全方位检索。提供了完整的API接口,支持程序化数据访问和筛选,便于用户将这一资源整合到自己的分析流程中。

参考文献

Meta-virus resource (MetaVR): expanding the frontiers of viral diversity with 24 million uncultivated virus genomes.Nucleic Acids Research, 2025.

原文链接

Doi.org/10.1093/nar/gkaf1283

相关推荐
zuYM4g7Dp17 小时前
NoSql数据库设计心得
数据库·nosql
睡不醒男孩03082318 小时前
第七篇:揭秘 PostgreSQL 数据库内核级管控:CLup 深度架构设计与高可用底座技术白皮书
数据库·postgresql·clup
cmes_love19 小时前
Level 2逐笔成交历史数据下载方法笔记
数据库·笔记·oracle
swordbob19 小时前
MySQL字符集陷阱:从Oracle迁移踩坑到utf8mb4强制规范
数据库·sql
牛油果子哥q20 小时前
【C++ STL string 】C++ STL string 终极精讲:底层原理、内存机制、全套API、深浅拷贝、易错坑点与工程实战规范
数据库·c++
十五年专注C++开发20 小时前
MySql中各种功能用sql语句实现总结
数据库·sql·mysql
数据库小学妹20 小时前
AI时代数据库怎么选?多模融合、数据统一存储与选型实战指南
数据库·人工智能·经验分享·ai
Albert Edison20 小时前
【Redis】Centos7.9 安装 Redis 5 教程
数据库·redis·缓存
云计算磊哥@20 小时前
运维开发宝典026-MySQL02数据库表操作
运维·数据库·运维开发
小二·21 小时前
Redis 内存溢出(OOM)排查与恢复实战
数据库·redis·bootstrap