柳叶刀|参考文献不存在

伪造引文:涵盖250万篇生物医学论文的核查研究

学术文献的可靠性依赖引文完整性。伪造引文(指向不存在的出版物)源于论文工厂、故意学术不端或对人工智能写作工具的不当使用;大语言模型生成的生物医学引文中,30%~69%为伪造。本研究采用自动化引文验证系统,核查了2023---2026年的250万篇生物医学论文、9,710万条带PubMed识别号的引文,在2,810篇论文中检出4,046条伪造引文。受大语言模型普及与论文工厂活动驱动,伪造率飙升12倍以上,从2023年每万篇约4条升至2026年初每万篇56.9条。伪造引文格式规范、难以检测,98.4%的涉事论文未获处理,已破坏临床指南的证据基础。本研究提出4项机构层面的整改措施以遏制伪造引文问题。

mt3315@cumc.columbia.edu

#伪造引文 #生物医学文献 #学术不端 #大语言模型幻觉 #论文工厂 #引文完整性 #自动化核查

图 2023年1月---2026年2月PubMed Central数据库中每万篇论文的季度伪造引文率

2023年全年伪造引文率稳定在每万篇约4条(蓝线);2024年中期开始,伪造率急剧上升,至2026年初达到每万篇约57条。每个数据点代表1个自然季度;空心符号代表不完整季度(2026年1月1日---2月18日),实心符号代表完整自然季度。

详细总结

思维导图

伪造引文规模(关键数据)

参考

Fabricated citations: an audit across 2·5 million biomedical papers

The Lancet, 407, 1779-1781

260509Fabricated.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

相关推荐
wlsh1513 小时前
Go 迭代器
算法
winlife_13 小时前
在 Unity 里用 AI 做游戏:funplay-unity-mcp 从安装到第一次让 AI 改场景
人工智能·游戏·unity·ai编程·claude·mcp
虫无涯13 小时前
大模型工程实现全解:5大落地路径从入门到实战
人工智能
语戚13 小时前
力扣 3161. 块放置查询:线段树解法(Java 实现)
java·算法·leetcode·面试·线段树·力扣·
cxr82813 小时前
高分子复合材料 AI 逆向设计合——工业交付、系统自重构与范式演进
人工智能·重构·材料逆向设计合成
冬奇Lab13 小时前
每日一个开源项目(第119篇):Darwin Skill - 受 Karpathy 启发,让 AI 技能无限进化的“棘轮”系统
人工智能·开源
Black蜡笔小新13 小时前
企业私有化AI训练推理一体工作站DLTM重构企业AI模型训练的全流程模式
人工智能·机器学习·重构
冬奇Lab13 小时前
Agent 系列(10):MCP 协议——工具生态的标准化接入
人工智能·agent·mcp
极客老王说Agent14 小时前
屏幕理解能力是下一代自动化的关键吗?2026年自动化范式演进深度解析
运维·人工智能·ai·chatgpt·自动化
CS创新实验室14 小时前
从顺序表到动态数组:数据结构的永恒基石与现代语言的优雅封装
数据结构·算法