目录
[1 概述](#1 概述)
[2 评估内容](#2 评估内容)
[2.1 波形测量](#2.1 波形测量)
[2.2 诊断结果](#2.2 诊断结果)
[3 评估维度](#3 评估维度)
原文链接:https://mp.weixin.qq.com/s/OPjIlOGTFmSPvdf-gDB80w
1 概述
心电图自自动分析已经有40多年的历史,其目的也从最初的辅助临床专家审阅逐渐过渡到可以自行诊断,这一过程中也说明心电分析算法的性能在逐步提升,准确性可以得到专家的认可。但是心电分析毕竟异常复杂,当下最好的心电分析算法也无法保证不会出错,且研究表明,大约有10%~15%的心电解读结果在被心脏病专家接受前需要修改或编辑。所以,心电分析算法的评估很重要,这里就总结一下算法评估的方法。
2 评估内容
2.1 波形测量
心电算法第一步就是分析心电图波形的幅度、持续时间、形态以及相关节律。这里需要测量的数据包括 P 波、QRS 复合波、ST 段、T 波的振幅、持续时间、面积和形状。

在得到波形各部分参数值数据后,还要进行一致性和稳定性评估。
一致性即算法在同一波形上测量结果要保持一致。例如某段波形时长在多次测量过程中的平均误差、标准偏差(SD)是否在可接受范围内。

稳定性即算法在加入噪声等外界干扰时能保持测量结果的稳定。例如在加入高频、工频(50Hz/60Hz)干扰的情况下平均误差、标准偏差是否在可接收范围内。

2.2 诊断结果
在波形测量之后便结合波形测量结果、种族、年龄、性别等进行心电诊断。诊断结果的准确性评估有人工数据、解剖学、专家审核三种方式。评估维度依据统计学指标。
人工数据
人工数据即使用数据库的方式,通过比较算法在数据库上的运行得到的结果与标准结果,可以评估出算法诊断的准确性。IEC 60601-2-51标准将这种方法列为主要的验证技术之一,同时该标准给出了具体的规定要求。
人工数据评估需要权威的数据库,目前多引用的是国外较为权威的心电数据库,如CSE心电数据库、MIT-BIH心律失常心电数据库、AHA心电数据库等,多数企业也会自建数据库用以测试,如Glasgow验证数据库、Philips的非起搏心电数据库。
国内也有体现中国人特性的数据库,例如中国北方成年人标准12 导联心电数据库。
解剖学
解剖学评估即通过直接观察心脏异常情况来验证算法的准确性,对比真实生理状态与诊断结果才最直接,生理状态可以通过影像学(超声波、核磁共振成像)等方法来。但是某些心电诊断结果并没有明确的解剖学依据作为支撑(如右束支传导阻滞),此时该方法就无法发挥作用。
专家审核
心电的自动诊断本质上就是在模仿专家的工作,因此使用专家来评估是最常见的方法。以上两种方法最终的诊断离不开专家的审核结果。
当然也有会有一些问题,比如,不同专家之间的意见分歧、专家对自己诊断结果的异议或专家诊断的模糊性。
案例如下:

3 评估维度
诊断结果的评估较为复杂,这里的准确性及一致性评价,包括准确率、敏感性、特异性、阳性预测值、阴性预测值等。
| 预测有病 | 预测无病 | 合计 | |
|---|---|---|---|
| 阳性 | TP | FP | TP+FP |
| 阴性 | FN | TN | FN+TN |
| 合计 | TP+FN | FP+TN | TP+FP+FP+FN |
-
TP:真阳性,预测为阳性、真实为阳性
-
TN:真阴性,预测为阴性,真实为阴性
-
FP:假阳性,预测为阴性,真实为阳性
-
FN:假阴性,预测为阳性,真实为阴性
敏感度(Sensitivity):也称真阳性率,在所有真正患病的人群中,检测方法能正确判为阳性的比例(1-漏诊率),反映检测方法发现病人的能力
SENS = \\frac{TP}{TP+FN}
特异度(Specificity):也叫真阴性率,在所有真正健康的人群中,检测方法能正确判为阴性的比例(1-误诊率),反映检测方法排除非病人的能力
SPEC = \\frac{TN}{TN+FP}
约登指数(Youden's index)=灵敏度+特异度-1
阳性预测值(Positive Predictive Value,PPV):即检测结果为阳性的受检者中,真正患病的比例,反映阳性结果的可靠性
PPV = \\frac{TP}{TP+FP}
阴性预测值(Negative predictive value, NPV):指检测结果为阴性的受检者中,真正健康的比例,反映阴性结果的可靠性
NPV = \\frac{TN}{TN+FN}
准确率(Accuracy):指预测正确的人群占受检所有人群的比例
Accuracy = \\frac{TP+TN}{TP+TN+FP+FN}
【往期回顾】