科技·商业·财经

毕业季论文遇AI检测难题:技术瓶颈致误判,“人机共判”或成新方向

   时间:2026-06-25 03:32 作者:快讯

毕业季来临,高校毕业生们正忙着完成毕业论文。然而,今年除了传统的查重、盲审、答辩等环节,又新增了一项挑战——AIGC检测,即人工智能生成内容检测。不少学生发现,自己的论文在AI检测中“AI率”过高,成为了新的难题。

有毕业生反映,自己的论文AI率高达62%,远超学校规定的15%红线。为了降低AI率,他们尝试使用大模型对论文进行修改,结果却令人意外——AI率不降反升,甚至达到了94%。这种情况并非个例,不少毕业生都遇到了类似的困扰。

针对这一现象,首都师范大学教育学院副院长蔡海龙解释了AI检测的原理。他表示,查重是通过对比论文与语料库的语句重复性来做出确定性判断,而AI检测则是运用AI系统分析文本在语意和语言表达风格上是否与AI写作存在重叠。这种检测本质上是一种基于概率的分类,而非基于证据的确定性判断。

当前,AI检测面临的技术瓶颈在于,我们是在用AI去检测AI,导致无法明确判定文字是人类作者所写还是AI所写。这种不确定性使得AI检测在准确性和解释性上都存在局限,是技术发展的关键挑战。

中文语言的丰富性也给AI检测带来了困难。中文语意和表达方式多样,使得人工智能系统在检测人类文本时容易产生歧义,进一步降低了检测的准确率,这也是导致误判的重要原因。

由于AI率检测目前尚无法做到完全精准,有教师建议,在论文审核中应建立透明可回溯的AI使用标注制度,而非简单地划定AI率红线。他们认为,应确立以人工评议为主、AI检测为辅的“人机共判”模式,以提高审核的公正性和准确性。

目前,主流高校多采用知网、维普、万方等系统的AIGC检测模块。这些系统如何判断一篇文章中有多少内容由AI生成?央视记者向多个大模型提出了这一问题。大模型的回答显示,检测主要依据文本的“困惑度”和“突发性”等特征。AI文本通常更“平滑”,而人类文本则波动更大。

困惑度指的是文本的“可预测性”。人类特有的、意外的、跳出常规的表达会使文本困惑度增加,从而更像人类写作。突发性则是指文本节奏的波动。人类写作如心电图般起伏,而AI输出则相对平稳。然而,专家指出,除了这些指标外,AI文本生成是基于概率统计的原理,因此目前检测AI生成内容的准确性都无法达到100%,误判现象时有发生。

 
 
更多>同类内容
全站最新
热门内容