科技·商业·财经

医学论文虚假参考文献激增成系统性问题,AI普及或为主要诱因

   时间:2026-05-27 08:02 作者:格隆汇

一项覆盖247万篇生物医学论文的引文核查发现,学术出版领域正面临前所未有的参考文献造假危机。研究团队在分析2023年1月至2026年2月期间发表的论文时,从9710万条参考文献中识别出4046条伪造文献,涉及2810篇学术论文。这些虚假文献的标注特征表现为:在PubMed、Crossref等四大权威数据库中均无法检索到对应文献记录。

数据显示,参考文献造假现象呈现指数级增长态势。2023年每万篇论文中仅有4条伪造文献,但到2025年底这一数值已飙升至51.3条,2026年前七周更达到56.9条,较基准值增长超过十二倍。研究指出,这种异常增长与生成式人工智能的广泛应用存在显著时间关联——ChatGPT等工具自2022年末开始普及,而论文发表周期通常需要100至200天,导致AI生成内容从2024年年中开始大量涌入学术数据库。

造假手段呈现高度专业化特征。某泌尿外科论文抽检显示,30条参考文献中竟有18条为伪造,且全部精准对应细分研究方向。更令人震惊的是,研究团队在11篇外科期刊论文中发现两名相同作者重复出现,这些涉及CRISPR诊断、肠道微生物组等前沿领域的论文累计包含15条虚假文献,显现出代写产业链的规模化操作痕迹。

学术出版机构的应对滞后加剧了危机。核查发现,98.4%的问题论文出版商尚未采取任何处理措施。综述类论文成为重灾区,其参考文献造假率比普通论文高出57%。鉴于这类论文常被用作临床诊疗指南的依据,研究人员警告称,虚假参考文献可能通过证据链传导,最终影响医疗决策的科学性。

现有检测手段面临严峻挑战。虽然预印本平台arXiv已对AI生成虚假内容实施禁发一年的惩处措施,但顶尖学术会议仍难以有效识别伪造引文。开源工具CiteAudit的测试结果显示,商用大语言模型存在"自我识别盲区",难以检测自身生成的虚假文献。2025年神经信息处理系统大会的论文分析证实,即便顶级学术会议也未能建立有效的甄别机制。

针对这一系统性风险,研究团队提出四项改进方案:建立投稿前自动化参考文献核验机制、在论文数据库中添加科研诚信元数据、对已发表文献开展回溯筛查,以及在学术诚信数据库中增设"虚假参考文献"专项分类。值得注意的是,该研究团队在数据分析过程中也使用了Claude模型辅助代码编写与语法校对,凸显出技术工具在学术研究中的双刃剑效应。

 
 
更多>同类内容
全站最新
热门内容