AIGC 检测 ≠ 查重。二者检测目标、技术原理、报告形式、适用场景都不一样,只是经常被同时提及,容易混淆。
先说查重。它的任务是回答“这篇文字里有多少内容跟别人已经发表过的一模一样”。系统会把你的论文拆成无数小片段,去比对庞大的期刊库、学位论文库以及互联网页面,只要连续十几个字符相同,就标红。查重报告最后给出的是一个百分比,比如 8.3%,意思是全文有 8.3% 的字句在数据库里找到了“孪生兄弟”。查重只关心字面重合,不关心句子是谁写的,也不管是不是 AI 写的。
再谈 AIGC 检测。它的任务不是找“和别人一样”,而是找“像 AI 写的”。系统会分析文本的困惑度、突发性、词汇分布、句法复杂度等特征,然后用专门训练过的模型给出一个概率值,比如 0.87,代表这段文字有 87% 的可能性出自 AI 之手。它不需要去翻外部数据库,而是像验钞机一样,用“语言指纹”来识别机器痕迹。因此,即使一段文字是原创的,只要它太“顺滑”、太“平均”,AIGC 检测也可能亮起红灯。
简单来说,查重是在问“你和别人有多像”,AIGC 检测是在问“你和 AI 有多像”。前者防抄袭,后者防代写,两者互补,不能互相替代。