柳叶刀｜参考文献不存在

Omics Pro2026-05-13 10:58

伪造引文：涵盖250万篇生物医学论文的核查研究

学术文献的可靠性依赖引文完整性。伪造引文（指向不存在的出版物）源于论文工厂、故意学术不端或对人工智能写作工具的不当使用；大语言模型生成的生物医学引文中，30%~69%为伪造。本研究采用自动化引文验证系统，核查了2023---2026年的250万篇生物医学论文、9,710万条带PubMed识别号的引文，在2,810篇论文中检出4,046条伪造引文。受大语言模型普及与论文工厂活动驱动，伪造率飙升12倍以上，从2023年每万篇约4条升至2026年初每万篇56.9条。伪造引文格式规范、难以检测，98.4%的涉事论文未获处理，已破坏临床指南的证据基础。本研究提出４项机构层面的整改措施以遏制伪造引文问题。

mt3315@cumc.columbia.edu

#伪造引文 #生物医学文献 #学术不端 #大语言模型幻觉 #论文工厂 #引文完整性 #自动化核查

图 2023年1月---2026年2月PubMed Central数据库中每万篇论文的季度伪造引文率

2023年全年伪造引文率稳定在每万篇约4条（蓝线）；2024年中期开始，伪造率急剧上升，至2026年初达到每万篇约57条。每个数据点代表1个自然季度；空心符号代表不完整季度（2026年1月1日---2月18日），实心符号代表完整自然季度。

详细总结

思维导图

伪造引文规模（关键数据）

参考

Fabricated citations: an audit across 2·5 million biomedical papers

The Lancet, 407, 1779-1781

260509Fabricated.pdf

注：AI辅助创作，如有错误欢迎指出。内容仅供参考，不构成任何建议。