近日,朱自清的经典散文《荷塘月色》因被某AI检测工具判定为“AI疑似生成率超过60%”而登上热搜,引发网友广泛讨论。有网友戏称:“我的论文AI率80%,难道也合理?”还有人质疑检测结果的随机性,甚至爆料同一篇文章在不同平台查出的AI率相差30%。这一现象让公众对AI检测工具的可靠性产生疑问。
针对这一争议,西湖大学文本智能实验室博士、Fast-DetectGPT研发者之一鲍光胜表示,公众对“AI率”存在普遍误解。他解释道:“检测出的AI率60%,并非指文章中60%的内容由AI生成,而是指该文章有60%的概率整体由AI创作。检测工具无法定位具体哪些字句出自AI,因为人类与AI在微观层面的差异极小。”
鲍光胜进一步说明,AI检测工具通过宏观统计特征进行判断,例如用词偏好、词频分布等。例如,某些冷门词汇在AI生成文本中的出现频率显著高于人类平均水平,这类特征会被作为判断依据。他举例称,大模型在撰写英语学术论文时,单词“delve”(深入研究)的使用频率异常升高,这一现象可作为检测信号。然而,这种统计方法需要足够长的文本样本支持,“100字以下的短文难以准确判断,500字以上的结果相对可信”。
谈及《荷塘月色》被误判的原因,鲍光胜指出,经典文本因被大量用于训练大模型,反而容易被误判。他解释:“AI检测的原理是对比文章用词、结构与模型预测的分布一致性。若文章是AI训练时接触过的经典文本,这种一致性会显著提高,导致误判。”
对于网友反映的“同一文章不同平台AI率差异大”的现象,鲍光胜认为这再正常不过。“不同工具的算法侧重点不同,有的依赖词频,有的分析语法,有的解读语义,结果差异30%并不奇怪。”他同时提到,部分平台“既卖AI生成论文,又提供降AI率服务”的现象,本质是检测与反检测的技术博弈。降AI率的原理是通过替换高频特征词(如用同义词替换),使检测工具无法识别,但文章核心意思不变。
鲍光胜建议,保持个人写作风格是降低误判的有效方式。“AI模仿的是人类写作的共性,而独特风格难以被复制。”他举例称,某些作者因习惯非常规表达,其文章AI率往往较低;反之,依赖模板或AI润色的文本则容易被误判。
鲍光胜所在的团队自2022年底ChatGPT问世后便专注于AI生成文本检测研究,并开发了Fast-DetectGPT工具。该成果已发表于国际会议ICLR 2024。他坦言,AI检测与生成技术的对抗将是长期过程:“大模型不断升级,检测工具也需持续优化,未来将是一场技术拉锯战。”
对于学生论文被误判高AI率的现象,鲍光胜提出三种可能:一是论文非完全原创,二是写作中不自觉借鉴了AI模板,三是检测工具本身存在误差。他强调:“任何AI检测工具给出的都是概率结果,而非绝对结论,这一观念需被公众正确理解。”






