![]()
盡管 AI 提高了寫作的底線,但人類不必與工具對(duì)抗,而應(yīng)在理解它、駕馭它之后,繼續(xù)追求屬于人的表達(dá)上限。
文章來源|APPSO(ID:appsolution)
瑕疵「天臨七年」,今年畢業(yè)論文除了查重之外又多了一道關(guān)卡—— AIGC 檢測(cè)。
今年以來,國內(nèi)多所高校相繼發(fā)布通知,要求本科畢業(yè)論文須進(jìn)行 AIGC 檢測(cè),并對(duì)論文的 AIGC 率給出明確規(guī)定,把 檢測(cè)結(jié)果作為論文能否通過的指標(biāo)。
四川大學(xué)要求文科類畢業(yè)論文AI生成內(nèi)容占比不超過20%,理工醫(yī)科類不超過15%;
南京工業(yè)大學(xué)要求全校畢業(yè)論文均須進(jìn)行檢測(cè),標(biāo)準(zhǔn)由各學(xué)院自行制定;
廣西師范大學(xué)、河北工程大學(xué)、南京航空航天大學(xué)則規(guī)定AIGC比例不得高于40%。
作為剛經(jīng)歷答辯的畢業(yè)生,那段時(shí)間可是和 AIGC 檢測(cè)周旋了許久。經(jīng)歷了「檢測(cè)—修改—再檢測(cè)—再改」的痛苦循環(huán)后,終于從 61.7% 降到 0%。
這個(gè)過程之所以這么讓人崩潰,是因?yàn)?AIGC 檢 測(cè)真的不 講武德:
有些明明是自己一個(gè)字一個(gè)字敲下的,也會(huì)被整段標(biāo)紅,判定為 AI 生成;在這一個(gè)平臺(tái)上測(cè)出的 10%,換個(gè)平臺(tái)又可能測(cè)出 100%;而哪怕是在同一個(gè)平臺(tái),同一個(gè)段落這次測(cè)是 0%,下次可能就變成 100%。
這還不是最離譜的,有網(wǎng)友把 朱自清的散文《荷塘月色》扔給多款高校論文 AI檢測(cè)工具,居然被判定為「62.88%由 AI 生成」。
![]()
這不禁讓我深深懷疑,當(dāng)前的 AIGC 檢測(cè)和它最初的目的是否已經(jīng)偏離?從更大的層面來講,它會(huì)對(duì)我們的寫作和思考方式造成怎么樣的影響?
在「降 AI」的過程中,為了降低那個(gè)數(shù)字,內(nèi)容好壞變成了次要的事。論文被改得七零八落、面目全非只為了證明「我不是 AI」。與此同時(shí),我還額外支付了不少 AIGC 檢測(cè)費(fèi)用。
![]()
證明自己沒用 AI,成為學(xué)生新的噩夢(mèng)
上網(wǎng)一搜,發(fā)現(xiàn)一樣被 AIGC 檢測(cè)折磨的畢業(yè)生不在少數(shù),大家都叫苦不迭。
![]()
有大學(xué)生純手搓的論文,上傳檢測(cè)后 AI 率竟高達(dá)80%。而同一篇文章,不同平臺(tái)查重結(jié)果竟能相差 30%。
為通過審核,學(xué)生被迫故意制造瑕疵,比如刪減邏輯連接詞、刻意制造語病錯(cuò)別字、口語化表達(dá),為了降重不惜降低論文質(zhì)量,諷刺拉滿。
國外也不遑多讓,23 歲的美國大學(xué)生 Burrel,在一門寫作必修課的期末測(cè)試中得了 0 分,教授給出的理由,是懷疑她這篇作文是由 AI 代筆的。
「我的心跳都快停了。」 Burrel 認(rèn)為,這個(gè)指控既荒謬又可怕。
Burrel 稱這份模擬求職信的作業(yè)完全沒依賴 AI ,她給《紐約時(shí)報(bào)》展示了 Google 文檔的編輯歷史記錄,她表示花了整整兩天時(shí)間來起草和修改這份作業(yè)。
![]()
不過全球知名查重公司 Turnitin 所提供的 AI 檢測(cè)結(jié)果顯示,這篇文章有 AI 寫作的痕跡。
為了證明自己的清白,Burrel 向英語系主任提交了一份長(zhǎng)達(dá) 15 頁的 PDF 文件,里面包含了她寫作過程中所有帶時(shí)間戳的屏幕截圖和筆記。最終,她的成績(jī)被恢復(fù)了。
最終,她的成績(jī)被恢復(fù)了。但這次經(jīng)歷給 Burrel 留下了不小的陰影。
在那次被指控后,當(dāng) Burrel 再次提交作業(yè)時(shí),她上傳了一段長(zhǎng)達(dá) 93 分鐘的 YouTube 視頻,完整記錄了她的寫作全過程。
![]()
「我很害怕會(huì)因?yàn)橐患约簺]做過的事而影響成績(jī)。」
Turnitin 尚未回應(yīng)這一報(bào)道,但其首席產(chǎn)品官 Annie Chechitelli 曾在 2023 年的一篇博客文章中指出,AI 檢測(cè)分?jǐn)?shù)不應(yīng)被用作判斷學(xué)生是否濫用 AI 的唯一決定性因素。
去年開始,美國已經(jīng)有一些高校學(xué)生在網(wǎng)上發(fā)起請(qǐng)?jiān)福笏麄兯诘拇髮W(xué)停止使用類似的 AI 檢測(cè)工具,隨著 AI 工具的滲透,可以預(yù)見這樣的矛盾將在學(xué)生和老師之間愈發(fā)頻繁出現(xiàn)。
但實(shí)際上,現(xiàn)在大學(xué)生在論文和作業(yè)中使用 AI 的比例已經(jīng)非常高,但這未必是一種「作弊」。
![]()
圖片來自:小紅書@Darer
在就業(yè)市場(chǎng)都要求這些應(yīng)屆生要掌握 AI 技能的當(dāng)下,合理地使用 AI 反而應(yīng)該是大學(xué)教育里要給出引導(dǎo),而非與 AI 徹底切割。
![]()
搞懂 AIGC 檢測(cè)的基本邏輯
AIGC 檢測(cè)結(jié)果為什么總像是隨機(jī)生成的?它的檢測(cè)邏輯究竟是什么?畢竟只有理解它的原理,才能在「降 AI」時(shí)對(duì)癥下藥。
傳統(tǒng)的論文查重主要是與已有文獻(xiàn)數(shù)據(jù)庫進(jìn)行比對(duì),查重報(bào)告會(huì)明確告訴你是哪些段落和哪篇文獻(xiàn)重復(fù)了。
所以對(duì)于傳統(tǒng)「降重」,前人已經(jīng)摸索出一套有效的「打法」,比如改寫句子結(jié)構(gòu)、同義詞替換、翻譯成小語種再翻譯回中文……總之,只要能避開與已存在文獻(xiàn)的重復(fù),就能過關(guān)。
但到了 「降 AI 」這里,這些已有的經(jīng)驗(yàn)似乎都失靈了:
AIGC 檢測(cè)更像一個(gè)黑箱,標(biāo)準(zhǔn)不明。目前任何一種檢測(cè)手段都無法保證 100% 判定哪個(gè)是 AI 寫的,哪個(gè)是人類寫的。因此,檢測(cè)系統(tǒng)通常都會(huì)給出一個(gè) AIGC 疑似值。
![]()
雖然說這只是「疑似度范圍」,系統(tǒng)也聲明「檢測(cè)結(jié)果與論文質(zhì)量無關(guān)」,但一旦超過某個(gè)數(shù)值,論文就會(huì)實(shí)打?qū)嵉夭煌ㄟ^啊,讓人有種無處申訴的無力感。
去年人大新聞學(xué)院副教授董晨宇也要在 AIGC 檢測(cè)中被迫「自證清白」:他的研究團(tuán)隊(duì)的一篇耗時(shí)三年、基于真實(shí)案例撰寫的關(guān)于直播產(chǎn)業(yè)的研究論文,卻被某論文檢測(cè)平臺(tái)標(biāo)注為「高度疑似AI生成」。
![]()
https://www.bilibili.com/video/BV1WK7fzNEa5/?spm\_id\_from=333.337.search-card.all.click&vd\_source=2304bb3a0ff80390775707914f5ee0ed
所以,AIGC 檢測(cè)真的就是「黑箱」嗎?它的基本邏輯究竟是什么?
基于知網(wǎng)在 2023 和 2024 年發(fā)布的兩個(gè)專利,我們也可以總結(jié)目前知網(wǎng) AIGC 檢測(cè)的底層邏輯和流程:
第一階段:信息量差值檢測(cè)(基于 2023 年專利)
輸入文章,按學(xué)科分類
用大語言模型改寫文章,計(jì)算原文與改寫版的信息量
差值差值小 → 可能 AI 生成;差值大 → 可能人類寫作
第二階段:多特征分析(基于 2024 年專利)
使用文本分類模型計(jì)算 AI 生成概率
分析邏輯偏離度、詞匯擴(kuò)散度、句子長(zhǎng)度、字詞分布等特征
綜合多個(gè)特征判斷 AI 生成可能性
第三階段:最終判定
結(jié)合兩階段結(jié)果
兩階段均指向 AI → 判定 AI 生成
否則 → 判定人類寫作
既然如此,似乎有標(biāo)準(zhǔn)可循。那依據(jù)這個(gè)標(biāo)準(zhǔn),讓 AI 擬人化改寫文章,以此增加「人味」、降 「AI 味」,豈不是可以用魔法打敗魔法?
![]()
用 AI 降 AI ?真的有用嗎?
我試過市面上流傳的兩類 「用 AI 降 AI」的方法:
輸入 prompt,讓大模型對(duì)原文本進(jìn)行改寫
使用專門的「一鍵降 AI」工具(多為付費(fèi)服務(wù))
拿我的論文當(dāng)小白鼠,將幾段文字(人工撰寫+ Chat GPT 潤色共 972 字)丟進(jìn)一個(gè)大學(xué)生常用的免費(fèi) AI 查重平臺(tái)「PaperYY」平臺(tái)進(jìn)行 AIGC 檢測(cè),檢測(cè)結(jié)果 AIGC 疑似率為 61.7%。
![]()
![]()
接下來依次使用下面表格中的幾種「用 AI 降 AI」的方法分別改寫這段文本,并再次放入同一檢測(cè)平臺(tái) PaperYY 上進(jìn)行檢測(cè)。
同時(shí),作為對(duì)照,將購買檢測(cè)平臺(tái) PaperYY 上自帶的「降 AI」服務(wù)進(jìn)行測(cè)試。
![]()
筆棧: https://biee.net/;
SpeedAI: https://speedai.fun/;
PaperYY: https://www.paperyy.com/
方法一:人工指令
分別喂給 GPT、DeepSeek 和 Grok 一段相同的「降 AI」指令:
![]()
但結(jié)果仿佛養(yǎng)蠱,三個(gè) AI 各自一頓操作之后,AIGC 率全都成功從61.7% 升到100%……
![]()
![]()
![]()
不過,接收同樣的 prompt,GPT 和 Grok 改寫的文本風(fēng)格比較相似,語言較平實(shí),但 DeepSeek 卻出現(xiàn)了明顯的「AI 幻覺」,開始變得不像人話……
![]()
如原文在描寫攝影技法的時(shí)候,僅僅提到「色彩反轉(zhuǎn)、低角度構(gòu)圖、光源的超現(xiàn)實(shí)處理」等,但 DeepSeek 卻自行發(fā)明了「放射性構(gòu)圖」、「異色溫處理」、「鎢絲燈頻閃」等,并存在堆砌復(fù)雜詞匯的現(xiàn)象,使得與原文有較大偏離。
方法二:「一鍵降 AI」工具
我選取了兩款市面上專門的論文寫作與查重網(wǎng)站中的「降 AI」工具——「筆棧」和「SpeedAI」進(jìn)行測(cè)試。
![]()
![]()
筆棧改寫后 AIGC 率飆升至91.5%,似乎已經(jīng)沒有什么好意外的了。
但神奇的是,SpeedAI 的改寫文本居然測(cè)出了 0%,反倒令人大跌眼鏡。
![]()
![]()
對(duì)照測(cè)試:檢測(cè)平臺(tái) PaperYY 上的付費(fèi)降A(chǔ)I服務(wù)
在付了「降 AI」費(fèi)之后,PaperYY「自己答題自己改卷」的測(cè)試結(jié)果倒不出意外的是 0%。
![]()
測(cè)試結(jié)果:初始文章 AIGC 檢測(cè)結(jié)果:61.7%
![]()
除了在 PaperYY 平臺(tái)的對(duì)照測(cè)試外,真正能較好完成「降 AI」任務(wù)的,竟只有 SpeedAI。
然而,這一結(jié)果并不能證明 SpeedAI 在「降 AI」方面表現(xiàn)出色,反而使整個(gè)測(cè)試顯得更加撲朔迷離。
于是,我們進(jìn)一步選取了兩個(gè)極端案例——ChatGPT 改寫后被判定為 100% AIGC 的「文本一」與 SpeedAI 改寫后被判定為 0% 的「文本二」,讓 Grok 對(duì)其進(jìn)行詳細(xì)的對(duì)照分析。
![]()
![]()
乍一看似乎有點(diǎn)道理,然而回到具體文本,我們會(huì)發(fā)現(xiàn) Grok 不過是照著已有結(jié)論套說辭,「錘子找釘子」罷了,實(shí)際上:
SpeedAI 生成的「文本二」中同樣使用了很多抽象的理論詞匯如「社會(huì)象征」「敘事裝置」等;
ChatGPT 生成的「文本一」中其實(shí)具有更多處以「我」作主語的所謂口語化表達(dá)。
但話說回來,如果論文中都是充滿「人味」的口語表達(dá),而缺少專業(yè)理論詞匯,還能叫學(xué)術(shù)論文嗎?邏輯清晰、條理分明的表達(dá)方式,什么時(shí)候變成 AI 專屬了呢?
寫作本該是思考與表達(dá),而非證明「我不是 AI」
筋疲力竭地「降 AI」之后,盡管我的論文順利通過了系統(tǒng)檢測(cè),但很多地方也變成了我不認(rèn)識(shí)的樣子。
在這個(gè)過程中,最終的論文質(zhì)量似乎不再是衡量的標(biāo)準(zhǔn),關(guān)鍵變成了如何向系統(tǒng)證明我不是用 AI 寫的。
這種本末倒置的操作消耗了我很多本該投入在論文思考、打磨和創(chuàng)新中的時(shí)間、精力和金錢。
更加可怕的是,對(duì)于學(xué)生而言,這種章法不明的「標(biāo)準(zhǔn)」可能會(huì)變成一個(gè)無形的框架,窄化我們的語言表達(dá),甚至約束我們的思維。
![]()
當(dāng)我們不再專注于深入思考問題,而是不斷琢磨如何迎合這一「標(biāo)準(zhǔn)」,就會(huì)逐漸失去寫作應(yīng)有的創(chuàng)造力、想象力和自我表達(dá)的功能。
對(duì)此,人大副教授董晨宇表示:
「AI 其實(shí)在倒逼學(xué)術(shù)生產(chǎn)進(jìn)行重新布局,適應(yīng)這種布局,需要進(jìn)行非常整體性的調(diào)整,但在這一切之前,應(yīng)激式的防火防盜防 AI 一定是我們最開始的反應(yīng)。但 AI 不是現(xiàn)代人的旁門左道,而是現(xiàn)代人的生存之道。AI 提高了底線,但是人仍然決定的是上限。」
所以,真正決定論文價(jià)值的,不該是系統(tǒng)判定的一個(gè)數(shù)值,而是其中凝結(jié)的思考深度與寫作誠意。
盡管 AI 提高了寫作的底線,但人類不必與工具對(duì)抗,而應(yīng)在理解它、駕馭它之后,繼續(xù)追求屬于人的表達(dá)上限。
![]()
![]()
媒介合作聯(lián)系微信號(hào)|ciweimeijiejun
如需和我們交流可后臺(tái)回復(fù)“進(jìn)群”加社群
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.