超过1000种工具揭示了单细胞RNA数据分析的趋势

文章:Over 1000 tools reveal trends in the single-cell RNA-seq analysis landscape

杂志:Genome Biology

年份:2021

从 2016 年开始,scRNA-tools 数据库(https://www.scrna-tools.org/)不断收集单细胞转录组数据分析软件。截止2021年,已经收集了超过 1000 个工具,从这些工具中,能够感受到单细胞转录组测序技术的可用性和兴趣的增长趋势。

单细胞转录组分析工具的现状

图1 scRNA-tools数据库概述

  1. 新工具的加入增长迅速。

  2. 约 70% 的工具正式发表了文单,22%的有预印本,8%的工具未发表。

  3. 编程语言方面,R语言占据首要位置,其次是 Python,再其后是 C++、MATLAB 以及其他语言。

  4. 工具按其功能的分类,有数据获取、数据清洗、细胞分类、基因鉴定、多功能以及其他。可以看到,在这些类别中,定量、整合、聚类和数据可视化工具占的比例较大。

单细胞转录组分析工具的趋势

图2 scRNA-seq分析工具的趋势

  1. 越来越多的工具使用 Python 开发。从 2017 至 2021,Python 开发的工具在数据库中所占的比例处于稳步上升当中,而 R 开发的工具所占比例逐年下降,其他语言开发的工具所占比例变化不大。由此可以看出,在数据科学领域,Python 和 R 两者互为最大的竞争对手。

  2. 预计到 2025 年年中,Python 将取代 R 成为最常见的 scRNA-seq 分析工具平台;然而,R将继续充当重要的角色。

  3. 但是要注意的是,这种趋势反应了开发人员的偏好,可能无法反映分析师使用这些平台的频率。

  4. 在所有工具中,超过 40%的工具是用于作图的。

单细胞转录组工具开发的开放科学

图3 scRNA-seq工具开发的开放科学

  1. scRNA-tools 数据库中绝大多数(超过90%)的工具都存储在 GitHub网站上。

  2. 在 GitHub 上,社区可以提出问题、增强建议以及贡献新的功能。

  3. 超过一半的工具有预印本,并且预印本与正式出版之间相隔平均天数为 250 天。

  4. 预印本有助于快速开发 scRNA-seq 新方法。

  5. 开放科学实践还有助于增加工具的引用。

关于简说基因

生信平台

Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。
*

生信培训

简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信

生信分析

我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

相关推荐
小森77672 小时前
(六)机器学习---聚类与K-means
人工智能·机器学习·数据挖掘·scikit-learn·kmeans·聚类
杜子腾dd4 小时前
8.Excel:数据验证和下拉列表
数据分析·excel
databook4 小时前
『Plotly实战指南』--交互功能进阶篇
python·数据分析·数据可视化
Dovis(誓平步青云)5 小时前
AI遇见端动态神经网络:Cephalon(联邦学习+多模态编码)认知框架构建
图像处理·人工智能·机器学习·微服务·语言模型·数据挖掘·交互
郭不耐11 小时前
DeepSeek智能时空数据分析(六):大模型NL2SQL绘制城市之间连线
人工智能·数据分析·时序数据库·数据可视化·deepseek
Olafur_zbj13 小时前
【EDA】EDA中聚类(Clustering)和划分(Partitioning)的应用场景
机器学习·数据挖掘·聚类
郭不耐17 小时前
PostgreSQL与MySQL哪个适合做时空数据分析?
mysql·postgresql·数据分析
IT从业者张某某17 小时前
机器学习-08-时序数据分析预测
人工智能·机器学习·数据分析
!chen18 小时前
Hadoop和Spark大数据挖掘与实战
hadoop·数据挖掘·spark
杜子腾dd18 小时前
10.Excel:快速定位目标值
数据分析·excel