<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      我在大廠教AI寫小說,先殺死自己的文采

      0
      分享至


      AI只是在模仿結果,它沒有辦法真正的創新。

      盧冠秋 黃文玥

      編丨周航

      文章來源|極晝工作室(ID:media-fox)


      像AI一樣寫作

      去年5月,準備第三次考研時,為了找份過渡工作,我進了一家大廠外包公司的寫字樓,成了一名數據標注員。

      招聘要求有寫作經歷,我從高中起就寫科幻小說,也拿過獎,符合它的要求。面試時,HR給了我一千字的小說章節,讓我把它壓縮成不到一百字的梗概,也就是“細綱”。那是我頭一次知道這個概念。

      后來一段時間里,我每天的工作,就是把一篇萬字左右的爆款網絡小說,濃縮成一條條細綱。

      我們“細綱組”有十多個年輕人,大多來自中文、新傳專業,干過編劇的比較多。有人所在的劇組倒閉了,就來這里工作。公司嘗試過讓AI來抽細綱,但AI的概括非常干癟,字數不到人工細綱的三分之一,還會丟失大量關鍵信息。

      細綱有個要求:不能“類正文”。比如只能寫“他感到氣憤,把杯子打碎了”,但不能寫“他被氣得臉發紅,把杯子打碎了”。“臉發紅”,屬于有畫面感的內容,是要留給AI生成的。或者說,要讓AI明白,人類如果想要寫一個人物生氣了,會用“臉發紅”來形容。這是大廠產品團隊定的策略。他們會把細綱喂給自家AI,讓它寫出一篇完整的小說。

      我的很多同事,一直習慣不了干巴巴地寫細綱。他們不少人總會下意識用文學化的表達,直到兩個多月的項目結束,都存在“類正文”的問題。


      ●圖文無關。圖源 視覺中國

      我本科學采礦專業,不像他們長期寫固定文體,反而適應得很快。做了幾天,就從標注員提拔成了質檢員——流水線的下一道工序。兩者工資一樣,但質檢員負責修改標注員數據,也有權力退回去讓標注員重寫。

      比起“類正文”,我更頭疼的是各種語病。一千字的章節,細綱不能超過350字,又不能漏情節,標注員會大量省略,比如把幾個人的動作壓縮到一個極長的句子里,還全部用“他”來指代。把人名都改成“他”,可以省下幾十個字。省到最后,句子壓根不通順,還得給它加回去。

      項目經理說,嚴格限制字數既是因為模型單次能夠處理的token(大模型處理信息的最小信息單元)有限,也是為了減少字數波動對大模型識別的影響。如果一個章節的細綱是三百字,另一個寫了五百字,模型可能會以為后者需要詳寫,但也許字數多的原因只是情節細碎。

      小說標注項目一共有兩個組。除了“細綱”組,還有另一個組,活更雜一些,要寫“靈感”、“小標題”,給人物貼上各種標簽。大家都是“拆文”,只是拆的東西不一樣。

      “靈感”是整篇小說的梗概,“小標題”是段落的大意和作用。公司文檔提供了段落的九個基本功能:開端、發展、高潮、反轉、結尾,等等。我們從里面挑著用,再補充上“提供爽點”之類的其他作用。我們還要給人物寫小傳,用幾個形容詞,比如敏感、囂張跋扈,以及綠茶一類的“人設”,去概括人物。這是讓模型學習,什么樣的性格會做出什么樣的行為。

      做這份工作前,我沒完整看過一篇網文。但看多了就能發現,即便網絡小說里的人物比較刻板化,也遠不是規則文檔里那二三十個人設標簽能概括的。

      比如我們經常用到“綠茶”這個標簽,但網文中“綠茶”的變體其實很多。有的人物真的喜歡男主角,沒有惡意,只是說話軟一點,在我看來這算不上“綠茶”,可還是會被同事貼上這個標簽。

      我們經常感到,規則文檔里的標簽不夠用。比如一個人前期很窩囊,后期覺醒了,那“窩囊廢”就很難概括這個人物的弧光。這時候,我會向AI描述這個人物,讓它提供幾個標簽,再從里面選。就這樣我們自己編出了“逆襲者”“反抗者”之類的新標簽。但也有標注員不認可,覺得網文世界里沒有這種人設。

      算法人員給我們介紹過大模型的基本原理,說是通過預測下一個詞的方式來生成文本。但我還是不明白,AI能不能理解什么是“爽點”,什么是“綠茶”,或者說,它是怎么通過數學化的方式去理解的。

      :早在2020年,北京大學中文系一個研究項目,曾用人工標注贅婿文的方法,讓AI學習識別“贅婿文”中的“打臉”結尾,初步證明了將抽象情節轉化為具體數據標簽的可行性。)

      我也懷疑這種訓練方式能否寫出好小說。人類創作者也會學習創作技巧,比如很有名的《救貓咪》。但數據標注是反過來的。小說已經寫好了,我們把它套進模板里。作者可能并不是按這個模板寫的,比如并沒有以刻板印象中的“綠茶”為目標塑造人物,但我們卻要在標注的時候給它做模板化的處理。

      后來做評測的時候,我們都有明顯感受,AI生成的小說比較刻板化,很難有真人寫作的厚度。


      流水線上的爭議

      網上對數據標注有個評價:“賽博流水工”。

      我們公司屬于駐場外包,服務的互聯網大廠在一線城市有整片園區。我們在其中一棟樓里,整個標注團隊有幾百人,都給這家大廠的AI產品標數據。文本標注大類下,還有通用寫作、劇本對話等其他小組。

      我在那里的半年,大廠正編的產品團隊來開過幾次全員培訓會。開會時候他們都會強調,標注數據質量如何重要,對模型的學習效果有很大影響。但不會講具體的項目,也沒有告訴我們某類數據到底怎樣作用到模型。

      大廠的正編人員會制定標注規則。但至少對小說項目來說,他們給的標注規則大多很籠統。怎樣是一條高質量的數據?很多時候其實沒有統一標準。

      比如寫細綱的時候,組里經常會有各種爭議。在一篇“大女主”文里,原本逆來順受的妻子,為什么突然覺醒,開始反抗丈夫和家庭?有的標注員認為轉變的契機是朋友的一句話,有的人覺得是因為她真心付出卻遭到丈夫冷漠對待。原作者寫得并不清晰,大家各執一詞。

      標注員經常覺得質檢員的標準有問題。為了工作留痕,大家就算緊挨著坐,也在群里討論。有時爭執不下,就由項目經理來定奪。


      ●互聯網公司園區夜景。圖文無關。圖源:中國視覺

      我入職的時候,項目剛啟動,很多東西還在摸索,項目經理也是從其他部門臨時抽調過來。但她其實不太懂小說。一個標注員直接對她說,“我可以按照你說的改,但是我不會認同這個東西,我只是配合你的工作”。其實大家都是這么想的。

      項目經理也總覺得,一篇小說表達什么,應該有一個標準答案。有一次例會,她舉了魯迅那句“我家門前有兩棵樹,一棵是棗樹,另一棵也是棗樹”作為例子。

      “很可能魯迅當時只是隨手一寫。”她說,接著問我們:“寫段落作用的時候,究竟是應該從讀者的角度考慮,還是從作者的角度考慮?”

      這個問題在我聽來有點業余。我覺得文本一旦誕生,就和作者沒有關系了。哪怕作者沒有這么想,如果很多讀者都認為這是刻意設計的,我們也應該告訴AI,作者就是故意設計的,這樣寫會更好。這樣才能從小說里提取出一套寫作方法。

      可世界上那么多讀者,“很多讀者”到底指的是哪一批讀者?我們的工作某種程度上是充當標準讀者,但說到底,也只是站在自己的角度去解讀。

      有的時候,我們也只是尊重“爆款”本身。比如一篇主打“大女主逆襲”的網文里,女主角一邊說著要擺脫家庭、和丈夫離婚,一邊又用著前夫的資金、人脈做成自己的事業。我能看出來作者想把她塑造成正面人物,但水平不太行,導致逆襲敘事不太成立。但我們還是會遵照作者原意,給女主角打上“大女主”“逆襲者”的標簽。畢竟是“爆款”,說明還是有不少人吃這一套。

      后來工作三個月時,換了個編劇出身的項目經理,明顯能感覺她對小說的理解更深。但不是說她能定下服眾的標準,而是她理解大家對小說的理解有差異,會盡量采取折中的方式。

      剛開始的時候,大家覺得教AI寫小說是一件有趣的事。但真的做起來,會發現數據標注重在執行規則而非創造,很快就會覺得枯燥。

      我在的半年時間,兩個人沒過試用期,另外主動走了四個,有一個人入職一周就辭職了,他覺得工作太機械化,和預期不一樣。離職的都是標注員,沒有質檢員。標注員處在流水線的最末端,會覺得自己一直在被否定。從他們的視角看,這份工作就是不斷做,不斷被其他人挑刺,沒有人來告訴我,我寫得特別好。時間長了很壓抑。

      留下的人其實也都抱著臨時過渡的心態。這個行業上升空間小,整體流動性大。我去復印考研資料的時候,還看到其他人印的考教資、考導游證的資料。


      各有各的模版

      細綱項目做了2個多月就停了。沒有人通知我們為什么停,可能是因為訓練效果不好。那之后,我們做了一段時間的評測。

      算法團隊基于同一個提示詞,讓自家模型和國內外的競品模型生成小說。我們要給每篇小說打分,再填存在的問題。問題有詳細的清單,分為人物類、文風類、邏輯類、結構類、劇情類、指令遵從等。

      公司也給出了“好小說”的明確標準。比如緊張情節與舒緩的情節,是否滿足1比1.5的比例。不知道這個怎么算出來的,也可能是1.5比1,我也不記得了。又比如主角要立體,有清晰的成長與轉變;配角要扁平,不能搶掉主角的風頭。

      文風類里,有一項問題是AI感太重。雖然AI感本身也是模糊的概念,但剛開始我可以很明顯區分出AI感,后來看得多了,我發現自己分辨不出來了。做細綱項目時,有時候項目經理也問,你寫的這個是不是AI感太重了,但他也不確定。我覺得這個事挺恐怖的,也許再待上半年一年,我就寫不出小說了。

      評測過程可以發現,每個模型寫的小說都是高度模板化的。彼此的模板還不一樣。有些模型它可能前期劇情節奏特別快,然后中期劇情就停滯了,開展一些莫名其妙的支線后,又突然結尾。也有的模型可能劇情節奏還好,但人設就比較扁平,特別刻板。

      評測滿分3分,我們自己做的那款AI,在評測中總是墊底。一般只有1-2分。這應該也是用戶的感受。我們能看到后臺用戶的輸入,80%都是讓AI寫同人文,用來磕CP的。但它寫出來的角色行為經常和性格嚴重不符,基本上只能保證性別是對的。

      我們分批次做了好幾輪評測,模型有一些進步,但不是很明顯。一個前面極其窩囊的人,還是常常因為一件小事莫名其妙地覺醒。表現好的模型也會出現這些問題,只是沒有那么嚴重。

      去年11月,我提了離職,專心準備考研。那時候細綱項目已經停了4個多月,除了做小說評測,我們一直在支援其他組的項目,意圖識別、應用文寫作,亂七八糟的。

      離開后,我一直在想,為什么AI寫小說的能力,遠遠落后于它做很多事情的能力?

      我的思考是,AI模板化寫作能力比較強,比如工作總結、周報月報、會議紀要等等。但寫小說沒有那么明確的“操作方法”。讀小說的人,也不是只想了解發生了什么事,而是想透過語言去感知作者的生命體驗。這種共情是很直觀的,不是邏輯推理的結果。AI在迭代,它的文風也在不停地迭代,有些問題已經不太會出現了。但我覺得它永遠做不到用數學化的方式,按步驟觸發人的情感。

      我自己寫小說,很多時候來自于生活中的刺痛。我第一次寫小說,是高三的晚自習,那時候我很抵觸學校的衡水模式。小說叫《地震降臨之時》,大概有六七千字。主角的血液可以感知磁場的變化,因此被某個機構抓去做研究。我高中時寫的基本都是這種風格,故事里的體制是黑暗的、迫害人的,主角最后往往會因為想要反抗,走向悲壯的死亡。


      ●淵星高中時寫的科幻小說。講述者供圖

      在“小標題”項目里,我們需要明確告訴模型,每一個段落表達的情感是什么。很多時候這種概括是正確的,比如悲傷,但即便是明確的情緒,也是立體的、豐滿的,一旦用悲傷總結,它就扁平了。在人類身上,“悲傷”是理解的結果,在AI那里,這卻是理解的媒介。正因如此,模型寫作時也會按照套路,輸出各種各樣扁平的情緒。

      做小說標注的經歷,也讓我對自己的寫作有了更多思考。這幾年,我總在模仿經典作品的情節和敘事方式,但大多數時候,結果都不太好。反而那些以自己生活體驗為源頭寫出來的東西更自然,情緒也更飽滿。

      可能這就是AI和人類創作最大的區別。AI只是在模仿結果,它沒有辦法真正的創新,之所以能讀出來是AI的,我覺得因為它是空洞的,文字背后沒有真實的生活做支撐。

      我喜歡聶魯達的《看不見的河流》。他在青年時描寫家鄉的自然風光,中年開始投身社會革命,最終在真正的失敗到來前去世了。那我們要如何評價他為之奮斗的一生呢?這就很有厚度了。我覺得AI永遠無法給讀者帶來這樣的體驗。

      (本文系極晝工作室“大學生非虛構寫作項目”作品。)

      本文轉載自【極晝工作室】

      關注查看更多故事





      媒介合作聯系微信號|ciweimeijiejun

      如需和我們交流可后臺回復“進群”加社群

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      甩掉黑鍋!駐法蘭克福總領事“點名”樊振東,釋放3大強烈信號

      甩掉黑鍋!駐法蘭克福總領事“點名”樊振東,釋放3大強烈信號

      阿傖說事
      2026-06-03 02:40:16
      皇馬切爾西醞釀重磅互換:巴爾韋德加錢換恩佐,門德斯牽線

      皇馬切爾西醞釀重磅互換:巴爾韋德加錢換恩佐,門德斯牽線

      星耀國際足壇
      2026-06-02 23:07:07
      孫科比繼母宋慶齡大兩歲,沒叫過母親,卻守住了孫家的體面與分寸

      孫科比繼母宋慶齡大兩歲,沒叫過母親,卻守住了孫家的體面與分寸

      磊子講史
      2026-05-29 18:27:50
      太尷尬了!9個姐妹聚餐,臨時倡議各邀請一男生,竟然無一人到場

      太尷尬了!9個姐妹聚餐,臨時倡議各邀請一男生,竟然無一人到場

      火山詩話
      2026-04-19 08:06:38
      我59歲才頓悟一個道理:如果別人請客不想去,千萬別傻傻地回“有事去不了,下次再約”,高情商的人這樣回應

      我59歲才頓悟一個道理:如果別人請客不想去,千萬別傻傻地回“有事去不了,下次再約”,高情商的人這樣回應

      心理觀察局
      2026-05-13 09:07:23
      銘記這一刻,巴黎球迷將加布里埃爾踢飛點球的瞬間紋在小腿上

      銘記這一刻,巴黎球迷將加布里埃爾踢飛點球的瞬間紋在小腿上

      懂球帝
      2026-06-02 11:14:56
      博福爾城堡陷落:黎巴嫩真主黨為何“數萬大軍”形同虛設

      博福爾城堡陷落:黎巴嫩真主黨為何“數萬大軍”形同虛設

      民間胡扯老哥
      2026-06-01 16:12:33
      紀委核查通訊記錄的獨門手段,很多人到落馬都不知道

      紀委核查通訊記錄的獨門手段,很多人到落馬都不知道

      細說職場
      2026-06-01 18:36:34
      普通家庭存款到這個數,已經是天花板級別,之前不信,現卻很肯定

      普通家庭存款到這個數,已經是天花板級別,之前不信,現卻很肯定

      小蘭聊歷史
      2026-05-07 00:09:33
      單次注射,低密度脂蛋白直降62%!NEJM最新:打一針管18個月,降脂治療迎來"顛覆性時刻"

      單次注射,低密度脂蛋白直降62%!NEJM最新:打一針管18個月,降脂治療迎來"顛覆性時刻"

      梅斯醫學
      2026-06-02 08:36:10
      高價奢侈品全是騙局?從Rimowa行李箱說起

      高價奢侈品全是騙局?從Rimowa行李箱說起

      固件更新中
      2026-05-30 00:22:00
      最大回撤40%,可以抄底了?

      最大回撤40%,可以抄底了?

      好買研習社
      2026-06-02 17:54:42
      為什么領導都喜歡上班?網友曝光領導抽屜都是性用品:絲襪、套套

      為什么領導都喜歡上班?網友曝光領導抽屜都是性用品:絲襪、套套

      黯泉
      2026-06-01 15:33:05
      浙江爸爸帶1歲兒子去菜場買菜,慘案發生!兒子逗玩店鋪籠中兔子,食指幾乎被咬斷……法院判決:監護人擔主責

      浙江爸爸帶1歲兒子去菜場買菜,慘案發生!兒子逗玩店鋪籠中兔子,食指幾乎被咬斷……法院判決:監護人擔主責

      環球網資訊
      2026-06-02 18:05:18
      唐山貨車司機大熱天捎七旬老人40公里,臨下車老人突然變臉訛錢

      唐山貨車司機大熱天捎七旬老人40公里,臨下車老人突然變臉訛錢

      聽心堂
      2026-06-02 12:03:05
      釋永信4罪并罰,不僅私生子多,資產多,還有3位家喻戶曉明星徒弟

      釋永信4罪并罰,不僅私生子多,資產多,還有3位家喻戶曉明星徒弟

      混沌錄
      2026-06-01 23:03:17
      燃氣灶致癌,再添實錘!斯坦福大學:即使關著爐子,也能釋放一級致癌物,患癌風險飆升;僅烹飪1小時,NO?就超標,每年致1.9萬人死亡

      燃氣灶致癌,再添實錘!斯坦福大學:即使關著爐子,也能釋放一級致癌物,患癌風險飆升;僅烹飪1小時,NO?就超標,每年致1.9萬人死亡

      梅斯醫學
      2026-05-31 07:55:29
      打牌到半夜,我順路送一個女牌友回家,到了樓下,她忽然不下車了

      打牌到半夜,我順路送一個女牌友回家,到了樓下,她忽然不下車了

      千秋文化
      2026-05-22 18:52:25
      U19國足被非洲球隊橫掃帶來啟示:業余球員趕緊轉職業,職業球員盡量去歐洲

      U19國足被非洲球隊橫掃帶來啟示:業余球員趕緊轉職業,職業球員盡量去歐洲

      文匯報
      2026-06-03 04:12:09
      網友稱山姆鵪鶉蛋兩個裝很尷尬,特別是分享男同事的時候

      網友稱山姆鵪鶉蛋兩個裝很尷尬,特別是分享男同事的時候

      映射生活的身影
      2026-06-01 22:00:15
      2026-06-03 06:16:49
      刺猬公社 incentive-icons
      刺猬公社
      聽記者講幕后,聽新聞前輩講古
      10107文章數 172594關注度
      往期回顧 全部

      科技要聞

      燒掉千億后,美團、阿里、京東誰先止血?

      頭條要聞

      演員魏宗萬去世 曾在94版《三國演義》中飾演"司馬懿"

      頭條要聞

      演員魏宗萬去世 曾在94版《三國演義》中飾演"司馬懿"

      體育要聞

      1米74的業余聯賽替補,在英超踢中衛

      娛樂要聞

      奚夢瑤何猷君補辦婚禮超幸福

      財經要聞

      智元和宇樹的“暗戰”愈演愈烈

      汽車要聞

      星途神秘新車輪廓曝光 又一款性能SUV要來了?

      態度原創

      本地
      家居
      藝術
      公開課
      軍事航空

      本地新聞

      用剪紙的方式,打開江蘇揚州

      家居要聞

      流線型輪廓 包容多元身形

      藝術要聞

      二十年前割麥的場景

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗媒體新發布最高領袖照片

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: WWW色| 欧美熟妇精品一区二区三区| 高清自拍亚洲精品二区| 久久久久人妻精品一区三寸| 中文字幕久热精品视频在线| 精品伊人久久久香线蕉| 2020年最新国产精品正在播放 | 夜夜爽影院| 国产精品热久久毛片| 无码精品一区二区久久久| 98日韩精品人妻一二区| 亚洲一二三四五区中文字幕| 98福利国产在线观看午夜天堂 | 黄色三级亚洲男人的天堂| 国产精品中文字幕av| 久久精品免费观看国产软件| 亚洲经典无码| 这里只有精品在线播放| 亚洲一区二区三区精品国产| 久久久久亚洲AV色欲av| 无套无码中出| 人妻丰满熟妇av无码区波多野| 在线va亚洲va天堂中文字幕| 亚洲国产AV一区二区三区| 疯狂三人交性欧美| 色www.| 亚洲成人小说| 免费高清特黄a大片| 丝袜无码| 蜜臀98精品国产免费观看| 精品国产亚洲一区二区三区| 欧美日韩一二三区高在线| 亚洲成人视频| 熟女人妻aⅴ一区二区三区电影| 免费人妻AⅤ无码专区久久综合| 中文字幕中文字幕久久 | 国产精品午夜福利视频| 亚洲亚洲人成综合网络| 97久久精品人人做人人爽| 日韩精品人妻中文字幕在线GIF| 福利视频网|