人工智能+牙科:临床应用中的几个问题

牙科领域的AI产品已经为数不少。《自然》杂志旗下的《英国牙科杂志》近期刊登了一篇文章[1],文章中列举了多家企业的牙科AI产品:

Pearl公司

出现在以上列表中的Pearl公司,是一家美国的AI公司[2],其AI产品能够从牙科的X光片中识别出多种牙科病症。

上图出自于Pearl公司的产品宣传资料[3]。

根据Pearl公司的宣传资料:

  • 该公司拥有世界上规模最大的牙科X光片标注数据集,数据标注团队由牙医和放射科医生组成;
  • 该公司的AI产品基于机器学习和计算机视觉算法,能够在牙科X光片中快速发现牙齿错位、牙齿裂纹、牙结石、牙齿变色等病症,有助于将更多的标准化、客观性、一致性、准确性、高效性、以及透明性引入到诊断过程中,有助于简化诊断的复杂性,增强患者的信任,鼓励患者参与必要的治疗;
  • 通过直观的视觉界面,该公司的AI产品有助于医生与患者之间进行更有效的沟通。

Fryback和Thornbury的分析方法

牙科AI产品的有效性,存在比较客观的评估吗?

Dennis G. Fryback和John R. Thornbury曾于1991年针对医学诊断影像的有效性发表过一篇文章[4],文章中将评估医学诊断影像有效性的专业文献划分为六个层次,第一(最低)层次的文献涉及技术性能,第六(最高)层次的文献涉及社会影响;通过收集、分析已有的评估文献,可以有依据地分析出医学诊断影像的有效性。

这个分析方法后续经过他人的调整,被用于分析放射医学中100款AI软件的有效性[5]。调整后的划分文献的各个层次从低到高分别为:

  • 第一层次(Technical Efficacy),文献涉及AI软件技术的可行性和可复制性、与其它软件的衔接程度、AI软件的差错率、临床应用的可行性------包括与其它临床方法的相关程度、预测方面的价值等;
  • 第二层次(Diagnostic Accuracy Efficacy),文献涉及AI软件独立运行时的性能,包括敏感性、特异性、接受者操作特征(ROC)曲线下面积、Dice分数(Dice Score)等;
  • 第三层次(Diagnostic Thinking Efficacy),文献涉及采用AI软件与否,对诊断是否有提升作用,是否会改变对影像的判断;
  • 第四层次(Therapeutic Efficacy),文献涉及AI软件对患者管理决策的影响、以及对治疗或复查的影响;
  • 第五层次(Patient Outcome Efficacy),文献涉及AI软件对治疗效果的影响,包括对患者的生活质量、发病率、生存的影响;
  • 第六层次(Societal Efficacy),文献从经济方面分析AI软件对社会的影响,包括AI软件对于成本、按质量调整后的患者寿命、增量成本的影响。

牙科AI产品的有效性

Fryback和Thornbury的层次分析方法在上述《英国牙科杂志》刊登的文章中被再次运用,通过收集、分析牙科AI产品的评估文献,来发现牙科AI产品有效性的依据。分析的主要结果包括:

  • 大多数牙科AI产品的评估文献达到了层次分析中的第一层次和第二层次,意味着大多数对于牙科AI产品的评估属于验证性质,较少涉及真实医疗场景中的复杂情况,从而使得相关AI产品的实际作用难以确定;
  • 少量评估文献达到了层次分析中的较高层次,也就是评估了有关AI产品在真实场景中对临床决策、疗效、社会效益所产生的影响;
  • 部分牙科AI产品没有任何评估文献;对于这些AI产品,严谨的科学评估是不可或缺的。

其它问题

上述《英国牙科杂志》刊登的文章还从牙医的角度出发,进一步描述了AI在牙科应用中存在的一些问题,主要包括:

  • 采用精确率---召回率(Precision-Recall)曲线下面积、接受者操作特征(ROC)曲线下面积、敏感性、特异性等指标来评估AI产品固然重要,然而仅仅依靠这些指标,还不足以评估AI产品的临床效果,如何将AI产品融入临床流程之中、以及AI产品如何影响治疗成效,都是这些指标所难以评估的;
  • AI误诊的可能性------以蛀牙识别这一任务为例,就是AI根据牙科X光片所识别出的蛀牙,经过进一步的医疗检查、以及对患者病史的分析,有可能发现并不是蛀牙;仅仅依靠AI,可能会导致不必要的医疗干预;此外,AI的误判需要转化成清晰详细的信息,以便于牙医做出临床决策;
  • 一款AI产品获得FDA(美国食品药品监督管理局)的许可,仅仅是评估有关技术的安全性、有效性和可靠性的一个重要步骤,不代表其临床应用会取得成功;
  • 部分医疗人员对于在临床中采用AI持保留态度,原因包括对AI产品可靠性的担心、AI产品在部署和评估时缺乏透明性等。

封面图来自美国Pearl公司的宣传资料[3]。

参考资料

1\] Concerns Regarding Deployment of AI-based Applications in Dentistry -- a Review. [www.nature.com/articles/s4...](https://link.juejin.cn?target=https%3A%2F%2Fwww.nature.com%2Farticles%2Fs41405-025-00319-7 "https://www.nature.com/articles/s41405-025-00319-7") \[2\] [www.hellopearl.com](https://link.juejin.cn?target=https%3A%2F%2Fwww.hellopearl.com "https://www.hellopearl.com") \[3\] [zeroheight.com/6a5b46ab5/p...](https://link.juejin.cn?target=https%3A%2F%2Fzeroheight.com%2F6a5b46ab5%2Fp%2F270b05-pearl-brand-guidelines "https://zeroheight.com/6a5b46ab5/p/270b05-pearl-brand-guidelines") \[4\] The Efficacy of Diagnostic Imaging. [doi.org/10.1177/027...](https://link.juejin.cn?target=https%3A%2F%2Fdoi.org%2F10.1177%2F0272989x9101100203 "https://doi.org/10.1177/0272989x9101100203") \[5\] Artificial Intelligence in Radiology: 100 Commercially Available Products and Their Scientific Evidence. [link.springer.com/article/10....](https://link.juejin.cn?target=https%3A%2F%2Flink.springer.com%2Farticle%2F10.1007%2Fs00330-021-07892-z "https://link.springer.com/article/10.1007/s00330-021-07892-z")

相关推荐
阿坡RPA13 小时前
手搓MCP客户端&服务端:从零到实战极速了解MCP是什么?
人工智能·aigc
用户277844910499313 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
机器之心13 小时前
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
人工智能
凯子坚持 c16 小时前
基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战
人工智能·paddlepaddle
你觉得20517 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
8K超高清17 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
hyshhhh17 小时前
【算法岗面试题】深度学习中如何防止过拟合?
网络·人工智能·深度学习·神经网络·算法·计算机视觉
薛定谔的猫-菜鸟程序员17 小时前
零基础玩转深度神经网络大模型:从Hello World到AI炼金术-详解版(含:Conda 全面使用指南)
人工智能·神经网络·dnn
币之互联万物17 小时前
2025 AI智能数字农业研讨会在苏州启幕,科技助农与数据兴业成焦点
人工智能·科技