丹娜---法伯癌症研究所和威尔康奈尔医学院的科学家开发并测试了针对数字病理学的新型人工智能工具。数字病理学是一个相对较新的领域,它使用由组织样本创建的高分辨率数字图像来诊断疾病并为治疗决策提供参考。
他们的论文于 2024 年 7 月 9 日发表在《柳叶刀数字健康》上,表明 ChatGPT 是一种为理解和生成文本而开发的人工智能语言模型,可以使用一种称为检索增强生成的人工智能技术进行定制,以对有关数字病理学的问题提供准确的答案并汇编详细的结果。
作者还发现,ChatGPT 可以帮助没有丰富编码经验的病理学家使用分析组织样本的复杂软件,有效地帮助弥合病理学技能和数字病理学技能之间的差距。
ChatGPT 是一个大型语言模型 (LLM),这意味着它使用大量数据生成有关广泛主题的文本。"LLM 适合于一般任务,但它们并不是获取专业领域有用信息的最佳工具,"该研究的主要作者、病理学和实验室医学研究助理教授、威尔康奈尔医学院计算和系统病理学部门成员、丹娜---法伯癌症研究所首席科学家 Mohamed Omar 医学博士说。
为了创建能够提高数字病理学效率和精确度的人工智能工具,通讯作者、丹娜---法伯癌症研究所信息学与分析系人工智能运营与数据科学服务主任 Renato Umeton 博士带头致力于为此特定目的定制和增强 ChatGPT 功能。
提高病理学人工智能的准确性
"一般的法学硕士有两个主要问题。首先,它们通常提供冗长的通用答案,虽然正确,但信息不够详细,"奥马尔说。"其次,这些模型会产生幻觉,无中生有,包括文献引用。这在数字病理学和癌症生物学等专业领域尤其糟糕。"
为了解决这些问题,Umeton 开始使用 Dana-Farber 运营的安全、私密且有保障的 ChatGPT 变体 (GPT4DFCI)。他们增强了 GPT4DFCI,使其能够访问数字病理学最新发展的全面且精选的数据库,该数据库包含 2022 年以后的 650 篇出版物,总计超过 10,000 页文献。
"我们可以要求这个新系统让我们了解数字病理学中的许多特定主题或技术,并在几秒钟内获得结果,其详细程度、深度和总结程度是当前科学文献工具或搜索引擎所不具备的。这有效地增强了研究人员的能力,"Umeton 指出。
他们使用了一种称为检索增强生成 (RAG) 的技术,使 GPT4DFCI 能够从这个专门的数据库访问相关文档或信息,并对用户关于数字病理学的提示生成准确的响应,但不会产生超出该范围的任何内容。
Omar 和他的同事向 GPT4DFCI 询问了有关数字病理学的具体问题,并将答案与 ChatGPT 4 提供的答案进行了比较。通过要求 GPT4DFCI 提供用于生成答案的特定出版物的链接,他们确定答案是准确且有根据的。
与 ChatGPT 4 相比,经过改进的模型提供了更精确、更相关的答案,而且没有产生幻觉------一次也没有。"我希望这将成为其他医学或医学研究领域更多领域特定工具的催化剂,"奥马尔说。
人工智能为编码提供帮助
该团队开发的第二个 AI 程序可帮助病理学家使用 PathML,这是一个专门的软件库,需要熟悉编程语言 Python 才能分析庞大而复杂的病理图像数据集。"没有编码经验的病理学家或科学家可能会发现 PathML 很难用于图像分析任务,"Omar 说。
研究人员将 PathML 与 ChatGPT 集成,让用户能够通过聊天功能与 PathML 文档进行交互。用户只需输入有关使用 PathML 分析组织病理学图像(例如多重图像、组织微阵列或生物标志物定量评估)的问题,该工具就会提供分步、准确的分析编码说明。
Umeton 说:"事实证明,生成式人工智能在提供结构化指导方面很有用,它可以指导人们查阅哪些材料以及如何组织新主题的学习历程。"
"我们的研究表明,当与适当的信息检索技术相结合时,ChatGPT 和受保护的 AI 工具(如 GPT4DFCI)可以非常有效地支持基础研究人员。这些工具甚至在需要极其精确答案的非常复杂的主题(如数字病理学)中也很有用。"
更多信息可以参考原文:Mohamed Omar 等人,ChatGPT 用于数字病理学研究,柳叶刀数字健康(2024)。DOI :10.1016/S2589-7500(24)00114-6由丹娜---法伯癌症研究所 提供