![]()
AI越來越像人,于是人類開始被迫證明自己不是AI。
僅僅在本月,文學圈就發生了兩件事。
一件,是英聯邦短篇小說獎的一篇獲獎作品,被第三方AI檢測工具判定為“100%AI生成”。主辦方用Claude復核,卻沒有得到相似的結果。
另一件,是諾貝爾文學獎得主的新小說還沒發布,就被質疑是用AI寫的。
AI越來越強,文本、圖像和視頻都越來越難靠肉眼分辨。但與此同時,人類手里的判斷工具卻并沒有同樣可靠。
于是,一種新的秩序出現了。
文學獎獲獎者要解釋自己的作品,諾獎作家要解釋自己的創作方式,畫師要錄屏、開直播、展示圖層,普通博主也可能被評論區質疑“AI味太重”。
過去是機器努力通過圖靈測試,證明自己像人。
現在,越來越多人開始參加一場反向圖靈測試:證明自己不是機器。
01
諾貝爾文學獎得主都逃不過“鑒AI”
今年5月,英聯邦短篇小說獎的一篇獲獎作品,引發了一場大型“鑒AI”爭議。
引發爭議的是特立尼達和多巴哥作家賈米爾·納齊爾(Jamir Nazir)的短篇小說。
這篇作品獲得了2026年英聯邦短篇小說獎加勒比地區獎,并發表在文學雜志Granta上。很快,有讀者和業內人士開始質疑,這篇小說的語言里有明顯的AI痕跡:比喻混雜、句式整齊、修辭像是被批量生成出來的。
![]()
隨后,AI檢測工具Pangram給出了一個看起來非常確定的判斷:100%AI生成。
100%這個數字看上去像鐵證,可它并沒有立刻變成裁決。
英聯邦基金會表示,所有入圍作者都確認沒有使用AI輔助;Granta也沒有辦法僅憑一個檢測結果,就認定作者違規。
![]()
于是,事情進入了一個極其荒誕的環節。Granta雜志嘗試用Claude復核這篇小說,想讓另一個AI來判斷它是不是AI寫的。
結果,Claude沒有給出能夠一錘定音的答案,也就是說,Pangram言之鑿鑿判成“100%AI生成”的作品,Claude卻表示確定不了。
諾貝爾文學獎得主奧爾加·托卡爾丘克(Olga Tokarczuk)最近也遭遇了爭議。
事件的起因,是她在采訪中談到,自己會使用AI輔助構思、資料整理、初步研究和事實核查。
![]()
這個說法很快引發外界討論。要命的是托卡爾丘克馬上要發新書,于是大家都在熱議她的新小說是不是AI寫的。
隨后,托卡爾丘克不得不公開澄清,自己將于2026年秋季出版的波蘭語新書,并不是由AI或其他人代寫。她強調,幾十年來,她一直獨自寫作。
說到底,現在AI確實越來越強了,鑒AI正在變得越來越困難。
去年底,《紐約客》刊發了一篇實驗性文章。研究者用多位作家的作品微調模型,讓AI學習并模仿他們的個人風格。
實驗中,創意寫作專業的學生在不知情的情況下閱讀人類文本和AI文本,并判斷自己更喜歡哪一段。結果,在接近三分之二的案例里,他們更偏好AI生成版本。
這比“AI能寫小說”更麻煩。
《紐約客》作者Vauhini Vara在文章中還寫道,朋友和專業讀者會把AI生成的句子認成她自己的寫法,也會把她真正寫下的原文批評成“像AI”。
02
全程錄像“自證清白”的畫師欲哭無淚
“恐怖谷效應”絕不僅限于一個長得和人類似像非像的實體,在AI輸出的文本和圖像、視頻越來越逼近人類,甚至連最有人味的“風格”都攻克的時候,人類不可避免地被激起存在主義危機。
這是現在流行“空口鑒AI”的一個核心動因。
換句話說,大家“鑒AI”是可以理解的,背后其實是某種恐懼——這是人嗎?這是AI嗎?我又是誰?我們是誰?
但是可以理解不代表偉光正,“鑒AI”正在給各種領域的創作者帶來麻煩,讓后者在創作之余還要平添“自證清白”的成本。
論AI帶來的沖擊,繪畫圈是不陌生的。我們早在幾年前就討論過AI對繪畫圈的沖擊,以及很多畫師對AI的抵制。
然而在當下,畫師們面對的麻煩已經不僅僅是需要放著AI煉化自己的成果,而是自己手搓的作品被“鑒AI”。
在社交平臺搜索“畫畫UP自證”,會看到很多案例。
有的畫師被“鑒AI”之后,錄屏展示所有的圖層,以證明作品是出自自己之手。
![]()
但很多時候,這并不足夠。
一位插畫師朋友告訴我們,現在很多插畫師會在繪畫的時候全程錄屏,防止被“鑒AI”的時候難以自證,這也是目前最穩妥的做法。
如果沒有錄屏,或者是有錄屏“證據”但是仍然被懷疑是“印著描摹的”,那么還有下一步——對賭。
是的,繪畫界因為AI已經發展出了“鑒AI”方和“被鑒AI”方的對賭。在我們看到的一個案例當中,發帖人擺出若干理由如“頭發斷聯”“肩頸結構有問題”等,鑒別某畫師的作品疑似是將AI圖墊在下方描圖或者照著AI圖臨摹。
雙方以2000元對賭,最終畫師“自證成功”,發帖人給AI畫師支付2000元。
![]()
一般來說,“對賭”當中的“自證”環節,是雙方約定時間進行一場繪畫直播。而且直播需要多機位,比如一個機位展示屏幕作圖過程,另一個機位錄制畫師畫畫的樣子,以免有人“代筆”。
從很多畫師的“自證帖”當中不難看出無奈的情緒,他們往往會感慨“終究輪到我了”,并發誓“這是第一次也是最后一次自證”。
就這樣,一邊痛恨“空口鑒AI”,另一邊真的輪到自己了卻不得不“自稱清白”,實在難受。
![]()
有“鑒AI”但是畫師“自證”失敗的案例嗎?有。但是這依舊不能讓“鑒AI”的行為變得理直氣壯一些。畢竟“鑒AI”的成本,幾乎沒有。
而“鑒AI”的手段,更是粗糙——靠人眼。
這里就不得不提到最近的一個笑料,一個X用戶發了一張圖,說是自己用AI生成的“莫奈風格圖”,還讓大家“盡可能詳細地說明它為什么不如真正的莫奈”。
![]()
帖子后來700萬瀏覽量,評論區不少人開始認真“鑒AI”,說它缺少深度、顏色不統一、沒有人味、構圖不如真跡,甚至有人從筆觸和空間感上分析得頭頭是道。
![]()
結果反轉是:那張圖本來就是莫奈真跡。
03
“鑒AI”到底誰說了算?
所以這其實是對AI越來越像人的恐懼,與沒有完美“鑒AI”手段之間的矛盾。
“鑒AI”手段的粗糙,是讓創作者集體陷入“自證清白”的另一個重要因素。
除了“人眼鑒別”的方式之外,正如前文提到的文學比賽冠軍得主的作品,“鑒AI”的另一個主要方式是第三方檢測工具Pangram。
AI檢測工具在文本領域常用,容易制造一種錯覺:它會給出一個百分比,比如“80%AI生成”“100%AI生成”。這個數字看上去很像結論,甚至像某種技術鑒定。
![]()
但文本檢測和DNA鑒定不是一回事。它判斷的其實是“這段文字在統計特征上更像什么”。
AI檢測工具,也是在看“看起來像不像AI寫的”。
Pangram在官網上解釋,自己的AI檢測器會用自然語言處理技術和大量人類寫作、AI寫作數據,分析AI文本中的結構、風格和語義模式。Pangram的技術報告也稱,它的核心是一個基于Transformer的神經網絡分類器,訓練目標就是區分大型語言模型寫出的文本和人類寫出的文本。
![]()
也就是說,這類工具不是拿著一篇文章去查“AI文本數據庫”,看它有沒有命中某個已知樣本。
它更像是在做模式識別。這篇文字的詞匯選擇、句子節奏、結構安排、語義連接方式,更接近它見過的人類文本,還是更接近它見過的AI文本。
更麻煩的是,這其中有太多特殊情況。如果一篇文章是人類寫初稿,再用AI潤色幾句話,怎么算?如果是AI生成提綱,人類重新寫成全文,怎么算?如果一段英文資料被AI翻譯成中文,作者再人工修改,檢測工具還能不能判斷?如果一個學生本來就是非英語母語寫作者,句子更規整、更模板化,會不會更容易被誤傷?
在繪畫領域也一樣。有的畫師就哀嚎——確實結構畫得有問題,那是因為我技藝還需要修煉,不是因為這是AI畫的呀!
2023年,斯坦福大學研究者測試了7個AI文本檢測器。
他們選取了91篇非英語母語學生寫的托福作文——這些作文來自托福官方考試語料,本身就是學生在真實考試環境下手寫完成的,因此可以確認并不是AI生成。
結果其中89篇至少被一個檢測器標記為AI生成;平均誤報率達到61.22%;還有18篇被7個檢測器一致判定為AI生成。也就是說,這些學生明明是在寫一門外語,卻因為表達更規整、更接近模板,被工具當成了機器。
當然,2023年、2024年的檢測工具不能簡單等同于今天的檢測工具。過去幾年里,商業檢測器確實在迭代,一些新工具在特定測試里的表現已經明顯提升。
但問題并沒有得到解決。
“誤判”沒有被完全消除,就會給矛盾留下縫隙。
畢竟,工具給出的本來是概率,但落到人身上,就變成了指控。
04
說好的“水印”呢?
更大的問題在于,AI公司是不是應該做“來源標記”?
給所有AI內容打上原生“水印”、去不掉的那種,不就可以解決鑒別問題?
很多人一聽到“水印”,想到的還是圖片角落里的logo、視頻畫面上的平臺標識,或者“AI生成”幾個大字。
但今天的AI水印早就不只是這種肉眼可見的記號。
行業里大致有兩類做法:一類是元數據,比如C2PA和Content Credentials,相當于給數字內容附上一張“身份說明”,記錄它由什么工具生成、什么時候生成、經歷過哪些編輯;
![]()
另一類是隱形水印,把人眼難以察覺、但機器可以識別的信號嵌進圖像、音頻、視頻甚至文本里。
在圖像和視頻領域,這些方案已經開始落地。
谷歌DeepMind的SynthID可以給Imagen、Veo、Lyria、Gemini等工具生成的內容嵌入隱形水印。
Meta表示,Meta AI生成或編輯的圖像會加入可見水印、不可見水印和元數據;OpenAI也為DALL·E 3和ChatGPT生成圖片加入C2PA內容憑證,并在后來引入SynthID隱形水印。Adobe、微軟、谷歌、Meta、OpenAI等公司也都參與了C2PA和內容憑證生態。
![]()
這說明,AI公司也清楚只靠肉眼判斷“像不像AI”是不夠的。它們已經在嘗試用元數據、內容憑證、隱形水印和平臺標簽,為AI生成內容留下機器可讀的來源信號。
但這些方案并不完美。元數據可以在截圖、壓縮、轉發、重新上傳時丟失;可見水印可以被裁掉或遮住;隱形水印更耐用,但也可能被后期處理、擾動或再生成削弱。
更關鍵的是,這些方案通常只能識別接入了對應系統,并且保留了對應標記的內容。也就是說,谷歌的SynthID主要識別帶有SynthID的內容,OpenAI的內容憑證主要說明內容來自OpenAI系統。只要內容來自沒有接入標記的模型,或者經過多次搬運,來源鏈就可能斷掉。
到了文本,問題更復雜。
文本當然也可以做水印。它的原理是在模型生成文字時,悄悄改變某些詞的選擇概率,讓最終文本呈現出一種人眼讀不出來、但檢測器可以識別的統計模式。簡單說,就是讓AI留下自己的“用詞指紋”。
谷歌已經公開了SynthID-Text,稱它可以給Gemini生成的文本嵌入水印。OpenAI也很早就被期待解決這個問題。2023年7月,OpenAI、谷歌、Meta、亞馬遜、Anthropic、微軟等公司達成自愿承諾,表示將研發機制,幫助用戶識別AI生成內容,包括水印和內容來源標記。
但幾年過去,圖像、音頻、視頻的標記方案不斷推進,文本卻仍然沒有一個清晰、默認啟用、公眾可用的通用答案。
OpenAI曾在2023年推出過AI Text Classifier,用來判斷一段文字是否由AI生成,但上線時就提醒用戶不要把它作為決策的唯一依據。
半年后,OpenAI因為準確率太低將其下線。
2024年,《華爾街日報》又報道稱,OpenAI內部其實已經開發出一種文本水印工具,在足夠長的ChatGPT生成文本上,有效率可以達到99.9%。但OpenAI最終沒有公開發布它。
原因也不完全是技術問題。報道提到,OpenAI擔心文本水印引發用戶反彈、影響產品使用,也擔心非英語用戶承受額外污名化。
還有調查顯示,接近30%的ChatGPT用戶表示,如果啟用文本水印,他們可能會減少使用。
到最后,回到“鑒AI”與“自證清白”的兩方拉扯上,以上提到的所有水印方案,還不能做到萬無一失。
人類有一句話是“道高一尺魔高一丈”,還有一句話是“上有政策下有對策”,只要人類還相信這兩句話,“鑒AI”就不會停止。
也許有一天,“AI參與”成為默認狀態,“人類原創”變得異常稀有,這場大規模的“鑒AI”與“自證清白”的拉扯才會失去意義。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.