柳叶刀|参考文献不存在

伪造引文:涵盖250万篇生物医学论文的核查研究

学术文献的可靠性依赖引文完整性。伪造引文(指向不存在的出版物)源于论文工厂、故意学术不端或对人工智能写作工具的不当使用;大语言模型生成的生物医学引文中,30%~69%为伪造。本研究采用自动化引文验证系统,核查了2023---2026年的250万篇生物医学论文、9,710万条带PubMed识别号的引文,在2,810篇论文中检出4,046条伪造引文。受大语言模型普及与论文工厂活动驱动,伪造率飙升12倍以上,从2023年每万篇约4条升至2026年初每万篇56.9条。伪造引文格式规范、难以检测,98.4%的涉事论文未获处理,已破坏临床指南的证据基础。本研究提出4项机构层面的整改措施以遏制伪造引文问题。

mt3315@cumc.columbia.edu

#伪造引文 #生物医学文献 #学术不端 #大语言模型幻觉 #论文工厂 #引文完整性 #自动化核查

图 2023年1月---2026年2月PubMed Central数据库中每万篇论文的季度伪造引文率

2023年全年伪造引文率稳定在每万篇约4条(蓝线);2024年中期开始,伪造率急剧上升,至2026年初达到每万篇约57条。每个数据点代表1个自然季度;空心符号代表不完整季度(2026年1月1日---2月18日),实心符号代表完整自然季度。

详细总结

思维导图

伪造引文规模(关键数据)

参考

Fabricated citations: an audit across 2·5 million biomedical papers

The Lancet, 407, 1779-1781

260509Fabricated.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

相关推荐
IT_陈寒4 分钟前
Python搞不定字符串编码?这破玩意坑我两小时!
前端·人工智能·后端
To_OC8 分钟前
LC 1 两数之和:面试第一道必考题,暴力解法直接被面试官 pass
javascript·算法·leetcode
大模型真好玩2 小时前
什么是Loop Engineering?最通俗易懂的Loop Engineering核心概念
人工智能·agent·deepseek
叁两2 小时前
前端转型AI Agent该如何学习?(前置篇)
前端·人工智能·node.js
LaiYoung_2 小时前
🎁 送你一套超好用超实用的 FE AI-Coding Skills
前端·人工智能·开源
ZzT5 小时前
怎么做才不会被 AI 替代?
人工智能·程序员
鱼鱼不愚与5 小时前
《原来如此 | 第01期:为什么导航软件能预测红绿灯倒计时?》
算法
道友可好5 小时前
从今天开始:你的第一个 Harness Engineering 实践
前端·人工智能·后端
小姜前线技术6 小时前
AI回答代码块高亮加一键复制
人工智能
洛阳泰山6 小时前
从 0 到 1.6K Star:一个 Java 开源项目的增长复盘
人工智能·后端·开源