通过血清拉曼光谱进行COVID-19的高效初步筛查

原创小王搬运工时序课堂 2024-06-04 20:04 四川

论文地址：https://analyticalsciencejournals.onlinelibrary.wiley.com/doi/full/10.1002/jrs.6080

论文源码：无

期刊：JOURNAL OF RAMAN SPECTROSCOPY

但是在小类中光谱学属于2区。

2019年底爆发的COVID-19大流行病由于其高度非特异性的临床表现和现有检测技术的局限性，迫切需要一种新的筛查方法。本研究提出了一种基于血清拉曼光谱技术的高效初步筛查方法，通过对177份血清样本的分析，包括确诊的COVID-19患者、疑似病例和健康对照组，利用拉曼光谱检测和机器学习支持向量机方法，建立了一个诊断算法，该算法在区分COVID-19病例与疑似病例、以及健康对照组方面显示出了高准确率，分类准确率分别达到了0.87和0.90，表明拉曼光谱技术是一个安全、高效的COVID-19筛查工具，具有重要的临床应用潜力。

在这篇论文中，支持向量机（Support-vector machine, SVM）方法被用作一种监督学习模型，其目的是从血清拉曼光谱数据中学习并构建一个能够区分COVID-19患者和非COVID-19个体（包括疑似病例和健康对照组）的诊断算法。以下是SVM方法的主要概念和在本研究中的应用：

SVM基本概念：

间隔（Margin）：SVM试图在不同类别的数据点之间找到一个间隔最大化的决策边界。间隔是数据点到决策边界的最短距离。

支持向量（Support Vectors）：位于决策边界最近的数据点，它们决定了边界的位置和方向。

核函数（Kernel Function）：SVM通过核函数将数据映射到更高维的空间，以便于在高维空间中更容易找到线性可分的决策边界。常用的核函数包括线性核、多项式核、径向基函数（RBF）核等。

SVM在本研究中的应用：

特征提取：首先，研究者使用ANOVA（方差分析）统计分析方法从拉曼光谱数据中选择出有助于区分不同组别的特征波点。
模型训练：选定的特征波点被用作输入，训练SVM模型。在训练过程中，SVM学习如何根据拉曼光谱数据的特征将样本正确分类为COVID-19患者、疑似病例或健康个体。
分类器性能：SVM模型的性能通过灵敏度（真阳性率）、特异性（真阴性率）和准确率来评估。这些性能指标反映了模型在训练数据上的表现。
交叉验证：为了评估模型的稳健性，研究者采用了交叉验证方法。这意味着数据集被分为训练集和测试集，模型在训练集上进行训练，并在测试集上进行验证。
独立测试集验证：最后，研究者使用了一个独立的测试数据集，包括无症状和有症状的COVID-19患者、疑似患者和健康对照，来进一步验证SVM模型的分类能力。

在这项研究中，SVM模型的建立和训练是为了能够准确地从血清拉曼光谱数据中识别和区分COVID-19患者，从而提供了一种潜在的高效筛查工具。通过这种方法，研究者能够实现较高的分类准确率，并为COVID-19的初步筛查提供了科学依据。

表2展示了使用支持向量机（SVM）模型对COVID-19患者、疑似病例和健康对照组进行分类的性能参数。这些参数包括灵敏度（Sensitivity）、特异性（Specificity）和准确率（Accuracy），每个分类任务都给出了相应的值和95%置信区间（Confidence Interval, CI）。

表2描述：

COVID-19与疑似病例的分类：

灵敏度：模型识别COVID-19患者的能力，值为0.89（±0.08），95% CI为0.87--0.91。这意味着模型正确识别了87%至91%的COVID-19患者。

特异性：模型正确识别非COVID-19（即疑似病例）的能力，值为0.86（±0.09），95% CI为0.83--0.88。这表明模型正确识别了83%至88%的非COVID-19患者。

准确率：整体分类任务的正确率，值为0.87（±0.05），95% CI为0.86--0.89。这表示模型在COVID-19与疑似病例分类任务中的整体准确度为86%至89%。

COVID-19与健康对照组的分类：

灵敏度：同样指模型识别COVID-19患者的能力，值为0.89（±0.07），95% CI为0.90--0.92。

特异性：模型正确识别健康对照组的能力，值为0.93（±0.06），95% CI为0.91--0.94。

准确率：整体分类任务的正确率，值为0.91（±0.04），95% CI为0.90--0.92。

疑似病例与健康对照组的分类：

灵敏度：模型识别疑似病例的能力，值为0.70（±0.09），95% CI为0.68--0.73。

特异性：模型正确识别健康对照组的能力，值为0.66（±0.09），95% CI为0.64--0.69。

准确率：整体分类任务的正确率，值为0.69（±0.05），95% CI为0.68--0.73。

表2中的数据还特别指出了血清样本级别的分类结果，这些结果显示了对每个血清样本的分类预测的准确性。括号内的数值提供了血清样本级别的分类结果，这与单个光谱级别的分类结果进行了对比。

总结来说，表2提供了SVM模型在区分COVID-19患者与疑似病例、以及健康对照组方面的详细性能评估，显示出该模型在分类任务中具有较高的灵敏度、特异性和准确率，这强调了SVM作为COVID-19筛查工具的潜力。

研究结果表明，拉曼光谱技术结合SVM算法是一种安全、高效的COVID-19筛查技术。与RT-PCR相比，该方法具有低成本、快速和低人力需求的优势，为医生提供了更多的检测手段。此外，该方法对于无症状和有症状的COVID-19患者都表现出较高的敏感性，有助于疫情的防控。