網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

論文 AI 檢測(cè)，正在逼瘋這屆大學(xué)生

2026-05-26 14:45:59　來源: 刺猬公社

北京舉報(bào)

分享至

盡管 AI 提高了寫作的底線，但人類不必與工具對(duì)抗，而應(yīng)在理解它、駕馭它之后，繼續(xù)追求屬于人的表達(dá)上限。

文章來源｜APPSO（ID：appsolution）

瑕疵「天臨七年」，今年畢業(yè)論文除了查重之外又多了一道關(guān)卡—— AIGC 檢測(cè)。

今年以來，國內(nèi)多所高校相繼發(fā)布通知，要求本科畢業(yè)論文須進(jìn)行 AIGC 檢測(cè)，并對(duì)論文的 AIGC 率給出明確規(guī)定，把檢測(cè)結(jié)果作為論文能否通過的指標(biāo)。

四川大學(xué)要求文科類畢業(yè)論文AI生成內(nèi)容占比不超過20%，理工醫(yī)科類不超過15%；

南京工業(yè)大學(xué)要求全校畢業(yè)論文均須進(jìn)行檢測(cè)，標(biāo)準(zhǔn)由各學(xué)院自行制定；

廣西師范大學(xué)、河北工程大學(xué)、南京航空航天大學(xué)則規(guī)定AIGC比例不得高于40%。

作為剛經(jīng)歷答辯的畢業(yè)生，那段時(shí)間可是和 AIGC 檢測(cè)周旋了許久。經(jīng)歷了「檢測(cè)—修改—再檢測(cè)—再改」的痛苦循環(huán)后，終于從 61.7% 降到 0%。

這個(gè)過程之所以這么讓人崩潰，是因?yàn)?AIGC 檢測(cè)真的不講武德：

有些明明是自己一個(gè)字一個(gè)字敲下的，也會(huì)被整段標(biāo)紅，判定為 AI 生成；在這一個(gè)平臺(tái)上測(cè)出的 10%，換個(gè)平臺(tái)又可能測(cè)出 100%；而哪怕是在同一個(gè)平臺(tái)，同一個(gè)段落這次測(cè)是 0%，下次可能就變成 100%。

這還不是最離譜的，有網(wǎng)友把朱自清的散文《荷塘月色》扔給多款高校論文 AI檢測(cè)工具，居然被判定為「62.88%由 AI 生成」。

這不禁讓我深深懷疑，當(dāng)前的 AIGC 檢測(cè)和它最初的目的是否已經(jīng)偏離？從更大的層面來講，它會(huì)對(duì)我們的寫作和思考方式造成怎么樣的影響？

在「降 AI」的過程中，為了降低那個(gè)數(shù)字，內(nèi)容好壞變成了次要的事。論文被改得七零八落、面目全非只為了證明「我不是 AI」。與此同時(shí)，我還額外支付了不少 AIGC 檢測(cè)費(fèi)用。

證明自己沒用 AI，成為學(xué)生新的噩夢(mèng)

上網(wǎng)一搜，發(fā)現(xiàn)一樣被 AIGC 檢測(cè)折磨的畢業(yè)生不在少數(shù)，大家都叫苦不迭。

有大學(xué)生純手搓的論文，上傳檢測(cè)后 AI 率竟高達(dá)80%。而同一篇文章，不同平臺(tái)查重結(jié)果竟能相差 30%。

為通過審核，學(xué)生被迫故意制造瑕疵，比如刪減邏輯連接詞、刻意制造語病錯(cuò)別字、口語化表達(dá)，為了降重不惜降低論文質(zhì)量，諷刺拉滿。

國外也不遑多讓，23 歲的美國大學(xué)生 Burrel，在一門寫作必修課的期末測(cè)試中得了 0 分，教授給出的理由，是懷疑她這篇作文是由 AI 代筆的。

「我的心跳都快停了。」 Burrel 認(rèn)為，這個(gè)指控既荒謬又可怕。

Burrel 稱這份模擬求職信的作業(yè)完全沒依賴 AI ，她給《紐約時(shí)報(bào)》展示了 Google 文檔的編輯歷史記錄，她表示花了整整兩天時(shí)間來起草和修改這份作業(yè)。

不過全球知名查重公司 Turnitin 所提供的 AI 檢測(cè)結(jié)果顯示，這篇文章有 AI 寫作的痕跡。

為了證明自己的清白，Burrel 向英語系主任提交了一份長(zhǎng)達(dá) 15 頁的 PDF 文件，里面包含了她寫作過程中所有帶時(shí)間戳的屏幕截圖和筆記。最終，她的成績(jī)被恢復(fù)了。

最終，她的成績(jī)被恢復(fù)了。但這次經(jīng)歷給 Burrel 留下了不小的陰影。

在那次被指控后，當(dāng) Burrel 再次提交作業(yè)時(shí)，她上傳了一段長(zhǎng)達(dá) 93 分鐘的 YouTube 視頻，完整記錄了她的寫作全過程。

「我很害怕會(huì)因?yàn)橐患约簺]做過的事而影響成績(jī)。」

Turnitin 尚未回應(yīng)這一報(bào)道，但其首席產(chǎn)品官 Annie Chechitelli 曾在 2023 年的一篇博客文章中指出，AI 檢測(cè)分?jǐn)?shù)不應(yīng)被用作判斷學(xué)生是否濫用 AI 的唯一決定性因素。

去年開始，美國已經(jīng)有一些高校學(xué)生在網(wǎng)上發(fā)起請(qǐng)?jiān)福笏麄兯诘拇髮W(xué)停止使用類似的 AI 檢測(cè)工具，隨著 AI 工具的滲透，可以預(yù)見這樣的矛盾將在學(xué)生和老師之間愈發(fā)頻繁出現(xiàn)。

但實(shí)際上，現(xiàn)在大學(xué)生在論文和作業(yè)中使用 AI 的比例已經(jīng)非常高，但這未必是一種「作弊」。

圖片來自：小紅書@Darer

在就業(yè)市場(chǎng)都要求這些應(yīng)屆生要掌握 AI 技能的當(dāng)下，合理地使用 AI 反而應(yīng)該是大學(xué)教育里要給出引導(dǎo)，而非與 AI 徹底切割。

搞懂 AIGC 檢測(cè)的基本邏輯

AIGC 檢測(cè)結(jié)果為什么總像是隨機(jī)生成的？它的檢測(cè)邏輯究竟是什么？畢竟只有理解它的原理，才能在「降 AI」時(shí)對(duì)癥下藥。

傳統(tǒng)的論文查重主要是與已有文獻(xiàn)數(shù)據(jù)庫進(jìn)行比對(duì)，查重報(bào)告會(huì)明確告訴你是哪些段落和哪篇文獻(xiàn)重復(fù)了。

所以對(duì)于傳統(tǒng)「降重」，前人已經(jīng)摸索出一套有效的「打法」，比如改寫句子結(jié)構(gòu)、同義詞替換、翻譯成小語種再翻譯回中文……總之，只要能避開與已存在文獻(xiàn)的重復(fù)，就能過關(guān)。

但到了「降 AI 」這里，這些已有的經(jīng)驗(yàn)似乎都失靈了：

AIGC 檢測(cè)更像一個(gè)黑箱，標(biāo)準(zhǔn)不明。目前任何一種檢測(cè)手段都無法保證 100% 判定哪個(gè)是 AI 寫的，哪個(gè)是人類寫的。因此，檢測(cè)系統(tǒng)通常都會(huì)給出一個(gè) AIGC 疑似值。

雖然說這只是「疑似度范圍」，系統(tǒng)也聲明「檢測(cè)結(jié)果與論文質(zhì)量無關(guān)」，但一旦超過某個(gè)數(shù)值，論文就會(huì)實(shí)打?qū)嵉夭煌ㄟ^啊，讓人有種無處申訴的無力感。

去年人大新聞學(xué)院副教授董晨宇也要在 AIGC 檢測(cè)中被迫「自證清白」：他的研究團(tuán)隊(duì)的一篇耗時(shí)三年、基于真實(shí)案例撰寫的關(guān)于直播產(chǎn)業(yè)的研究論文，卻被某論文檢測(cè)平臺(tái)標(biāo)注為「高度疑似AI生成」。

https://www.bilibili.com/video/BV1WK7fzNEa5/?spm\_id\_from=333.337.search-card.all.click&vd\_source=2304bb3a0ff80390775707914f5ee0ed

所以，AIGC 檢測(cè)真的就是「黑箱」嗎？它的基本邏輯究竟是什么？

基于知網(wǎng)在 2023 和 2024 年發(fā)布的兩個(gè)專利，我們也可以總結(jié)目前知網(wǎng) AIGC 檢測(cè)的底層邏輯和流程：

第一階段：信息量差值檢測(cè)（基于 2023 年專利）

輸入文章，按學(xué)科分類

用大語言模型改寫文章，計(jì)算原文與改寫版的信息量

差值差值小 → 可能 AI 生成；差值大 → 可能人類寫作

第二階段：多特征分析（基于 2024 年專利）

使用文本分類模型計(jì)算 AI 生成概率

分析邏輯偏離度、詞匯擴(kuò)散度、句子長(zhǎng)度、字詞分布等特征

綜合多個(gè)特征判斷 AI 生成可能性

第三階段：最終判定

結(jié)合兩階段結(jié)果

兩階段均指向 AI → 判定 AI 生成

否則 → 判定人類寫作

既然如此，似乎有標(biāo)準(zhǔn)可循。那依據(jù)這個(gè)標(biāo)準(zhǔn)，讓 AI 擬人化改寫文章，以此增加「人味」、降「AI 味」，豈不是可以用魔法打敗魔法？

用 AI 降 AI ？真的有用嗎？

我試過市面上流傳的兩類「用 AI 降 AI」的方法：

輸入 prompt，讓大模型對(duì)原文本進(jìn)行改寫

使用專門的「一鍵降 AI」工具（多為付費(fèi)服務(wù)）

拿我的論文當(dāng)小白鼠，將幾段文字（人工撰寫+ Chat GPT 潤色共 972 字）丟進(jìn)一個(gè)大學(xué)生常用的免費(fèi) AI 查重平臺(tái)「PaperYY」平臺(tái)進(jìn)行 AIGC 檢測(cè)，檢測(cè)結(jié)果 AIGC 疑似率為 61.7%。

接下來依次使用下面表格中的幾種「用 AI 降 AI」的方法分別改寫這段文本，并再次放入同一檢測(cè)平臺(tái) PaperYY 上進(jìn)行檢測(cè)。

同時(shí)，作為對(duì)照，將購買檢測(cè)平臺(tái) PaperYY 上自帶的「降 AI」服務(wù)進(jìn)行測(cè)試。

筆棧： https://biee.net/；

SpeedAI： https://speedai.fun/；

PaperYY： https://www.paperyy.com/

方法一：人工指令

分別喂給 GPT、DeepSeek 和 Grok 一段相同的「降 AI」指令：

但結(jié)果仿佛養(yǎng)蠱，三個(gè) AI 各自一頓操作之后，AIGC 率全都成功從61.7% 升到100%……

不過，接收同樣的 prompt，GPT 和 Grok 改寫的文本風(fēng)格比較相似，語言較平實(shí)，但 DeepSeek 卻出現(xiàn)了明顯的「AI 幻覺」，開始變得不像人話……

如原文在描寫攝影技法的時(shí)候，僅僅提到「色彩反轉(zhuǎn)、低角度構(gòu)圖、光源的超現(xiàn)實(shí)處理」等，但 DeepSeek 卻自行發(fā)明了「放射性構(gòu)圖」、「異色溫處理」、「鎢絲燈頻閃」等，并存在堆砌復(fù)雜詞匯的現(xiàn)象，使得與原文有較大偏離。

方法二：「一鍵降 AI」工具

我選取了兩款市面上專門的論文寫作與查重網(wǎng)站中的「降 AI」工具——「筆棧」和「SpeedAI」進(jìn)行測(cè)試。

筆棧改寫后 AIGC 率飆升至91.5%，似乎已經(jīng)沒有什么好意外的了。

但神奇的是，SpeedAI 的改寫文本居然測(cè)出了 0%，反倒令人大跌眼鏡。

對(duì)照測(cè)試：檢測(cè)平臺(tái) PaperYY 上的付費(fèi)降A(chǔ)I服務(wù)

在付了「降 AI」費(fèi)之后，PaperYY「自己答題自己改卷」的測(cè)試結(jié)果倒不出意外的是 0%。

測(cè)試結(jié)果：初始文章 AIGC 檢測(cè)結(jié)果：61.7%

除了在 PaperYY 平臺(tái)的對(duì)照測(cè)試外，真正能較好完成「降 AI」任務(wù)的，竟只有 SpeedAI。

然而，這一結(jié)果并不能證明 SpeedAI 在「降 AI」方面表現(xiàn)出色，反而使整個(gè)測(cè)試顯得更加撲朔迷離。

于是，我們進(jìn)一步選取了兩個(gè)極端案例——ChatGPT 改寫后被判定為 100% AIGC 的「文本一」與 SpeedAI 改寫后被判定為 0% 的「文本二」，讓 Grok 對(duì)其進(jìn)行詳細(xì)的對(duì)照分析。

乍一看似乎有點(diǎn)道理，然而回到具體文本，我們會(huì)發(fā)現(xiàn) Grok 不過是照著已有結(jié)論套說辭，「錘子找釘子」罷了，實(shí)際上：

SpeedAI 生成的「文本二」中同樣使用了很多抽象的理論詞匯如「社會(huì)象征」「敘事裝置」等；

ChatGPT 生成的「文本一」中其實(shí)具有更多處以「我」作主語的所謂口語化表達(dá)。

但話說回來，如果論文中都是充滿「人味」的口語表達(dá)，而缺少專業(yè)理論詞匯，還能叫學(xué)術(shù)論文嗎？邏輯清晰、條理分明的表達(dá)方式，什么時(shí)候變成 AI 專屬了呢？

寫作本該是思考與表達(dá)，而非證明「我不是 AI」

筋疲力竭地「降 AI」之后，盡管我的論文順利通過了系統(tǒng)檢測(cè)，但很多地方也變成了我不認(rèn)識(shí)的樣子。

在這個(gè)過程中，最終的論文質(zhì)量似乎不再是衡量的標(biāo)準(zhǔn)，關(guān)鍵變成了如何向系統(tǒng)證明我不是用 AI 寫的。

這種本末倒置的操作消耗了我很多本該投入在論文思考、打磨和創(chuàng)新中的時(shí)間、精力和金錢。

更加可怕的是，對(duì)于學(xué)生而言，這種章法不明的「標(biāo)準(zhǔn)」可能會(huì)變成一個(gè)無形的框架，窄化我們的語言表達(dá)，甚至約束我們的思維。

當(dāng)我們不再專注于深入思考問題，而是不斷琢磨如何迎合這一「標(biāo)準(zhǔn)」，就會(huì)逐漸失去寫作應(yīng)有的創(chuàng)造力、想象力和自我表達(dá)的功能。

對(duì)此，人大副教授董晨宇表示：

「AI 其實(shí)在倒逼學(xué)術(shù)生產(chǎn)進(jìn)行重新布局，適應(yīng)這種布局，需要進(jìn)行非常整體性的調(diào)整，但在這一切之前，應(yīng)激式的防火防盜防 AI 一定是我們最開始的反應(yīng)。但 AI 不是現(xiàn)代人的旁門左道，而是現(xiàn)代人的生存之道。AI 提高了底線，但是人仍然決定的是上限。」

所以，真正決定論文價(jià)值的，不該是系統(tǒng)判定的一個(gè)數(shù)值，而是其中凝結(jié)的思考深度與寫作誠意。

盡管 AI 提高了寫作的底線，但人類不必與工具對(duì)抗，而應(yīng)在理解它、駕馭它之后，繼續(xù)追求屬于人的表達(dá)上限。

媒介合作聯(lián)系微信號(hào)|ciweimeijiejun

如需和我們交流可后臺(tái)回復(fù)“進(jìn)群”加社群

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.