文献解读-基准与方法研究-第十六期|《GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试》

关键词:基准与方法研究;基因测序;变异检测;


文献简介

  • 标题(英文):Accuracy benchmark of the GeneMind GenoLab M sequencing platform for WGS and WES analysis
  • 标题(中文):GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试
  • 发表期刊:BMC Genomics
  • 作者单位:深圳真迈生物科技有限公司
  • 发表年份:2022
  • 文章地址https://doi.org/10.1186/s12864-022-08775-3

图1 文献介绍

GenoLab M是GeneMind Biosciences最近开发的下一代测序(NGS)平台。为了确定GenoLab M的性能,研究者提出了一份报告,以对GenoLab M测序仪的WGS和WES测序数据进行基准测试,并将GenoLab M测序仪与NovaSeq 6000和NextSeq 550平台在各种类型的分析中进行比较。对于WGS,来自Illumina NovaSeq平台并由GATK管道处理的30×测序目前被认为是黄金标准。该数据集是作为本研究的基准数据的。

2014年,瓶中基因组(GIAB)发布了金标准基因型数据集(包括参考样本NA12878),为比较变异检测流程的差异提供了资源。最近,一些研究使用GIAB变异数据集来比较不同变异检测工具或测序平台。一般来说,WGS和WES的数据深度分别在30倍和100倍以上。本研究获得了从多个测序平台生成的NA12878标准样品的WES和WGS数据集,包括NextSeq 550,NovaSeq 6000和GenoLab M。

在分析部分,选择了两个管道:

Sentieon DNAscope管道,基于 机器学习 (ML)的变体调用工作流(++https://github.com/Sentieon/sentieon-dnascope-ml++)和DNAseq工作流,这是一个加速的GATK重新实现。


测序流程

图2 三个平台、两个分析流程比较流程图

图3 GenoLab M 和 NovaSeq 6000 在 NA12878 样本 33X 和 22X 覆盖率下的变异调用性能比较。A SNP 和 B InDel 在全基因组上的表现,C SNP 和 D InDel F-score 在分层区域上的表现。精确度(阳性预测值)是检索到的实例中相关实例的比例,召回率(灵敏度)是检索到的相关实例的比例。F-score 是精确度和召回率的调和平均值,chr 20 表示 20 号染色体,NIADR 表示不在所有困难区域,SDR 表示片段重复区域。

在该研究中,GenoLab M的平均Q20比NovaSeq 6000略低,但在相同的测序深度下,GenoLab M重复率比Novaseq 6000低一半,并且22×的WGS的准确度高于22×NovaSeq准确度,并达到了33×NovaSeq相似的性能。

图4 Sentieon的作用

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。 截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。


文献讨论

图5 文献结论


总结

综上所述,对于WGS,GeneMind测序平台中的22X与Illumina NovaSeq 6000 33X深度相似,这提供了一种有效的替代方案。而GenoLab M的100X WES在相同深度下表现出与Illumina平台相似或优越的性能,在WES中也具有应用前景。

相关推荐
毅硕科技1 个月前
文献解读-DNAscope: High accuracy small variant calling using machine learning
机器学习·基因数据分析·sentieon·变异检测·生信服务·基因测序
毅硕科技5 个月前
Sentieon Arm版本:进一步降低基因组计算成本
arm开发·生信服务
毅硕科技7 个月前
文献解读-群体基因组第一期|《对BMI的影响:探究BMI的基因型-环境效应》
基因数据分析·sentieon·变异检测·生信服务·文献解读
人工智能学术前沿(真)1 年前
GEO生信数据挖掘(九)肺结核数据-差异分析-WGCNA分析(900行代码整理注释更新版本)
人工智能·数据挖掘·生信分析·r·geo数据挖掘·基因数据分析
人工智能学术前沿(真)1 年前
GEO生信数据挖掘(八)富集分析(GO 、KEGG、 GSEA 打包带走)
数据挖掘·生信分析·r·geo数据挖掘·基因数据分析
人工智能学术前沿(真)1 年前
GEO生信数据挖掘(九)WGCNA分析
机器学习·数据挖掘·生信分析·r·geo数据挖掘·基因数据分析
人工智能学术前沿(真)1 年前
GEO生信数据挖掘(七)差异基因分析
人工智能·数据挖掘·生信分析·r·geo数据挖掘·基因数据分析
人工智能学术前沿(真)1 年前
GEO生信数据挖掘(六)实践案例——四分类结核病基因数据预处理分析
人工智能·数据挖掘·生信分析·r·geo数据挖掘·基因数据分析
人工智能学术前沿(真)1 年前
GEO生信数据挖掘(一)数据集下载和初步观察
生信分析·geo数据挖掘·基因数据分析