本文轉自:求是網
![]()
生成式人工智能與知識生產創新
孫茂松清華大學人工智能研究院常務副院長、計算機科學與技術系長聘教授
知識生產與兩個關鍵環節密不可分:知識的產生和知識的傳播。兩者相輔相成:好的知識是好的傳播的動力源,而好的傳播又能通過知識的“教化”作用,在人們利用所學解決各類問題的生產和生活實踐中催生更多好的知識。古往今來,上述過程“環復轉運,終始無端”,不斷豐富著人類的知識寶庫。
在漫長的歷史演進中,知識的生產與拓展,長期帶有少數“智者”留下的鮮明印記。隨著時代的發展,“智者群”的數量會漸次擴大,但在整個人群里相對來說仍是少數。進入現代社會特別是互聯網時代,這種狀況發生了急劇變化,普羅大眾可以依托互聯網信息技術對知識的生產作出貢獻。知識傳播模式的演進更是令人嘆為觀止,從文字產生前以語音為知識載體的口口相傳,數千年前以泥板、莎草紙、羊皮卷、甲骨、竹簡、絹帛等為載體的文本手抄,到1000多年前尤其是數百年來以紙張為載體的圖書印刷,百余年來以廣播、電影、電視為載體的模擬及數字內容生產,再到近30年來以互聯網和社交網絡為載體的跨模態數字內容生產,知識生產以其范式持續更替所引發的巨大能量推動著人類文明進步。縱觀歷史,無論是造紙術、印刷術,還是模擬和數字通信、互聯網等,無一不是當時的重大科技發明。科技的一次次重大進步,促成了知識生產的一次次范式創新。
近年來勃興的以語言大模型為基礎的生成式人工智能,無疑會促成知識生產的又一次范式變革。與此前所有知識生產范式中人類始終是唯一主體不同,這次破天荒地增加了一個全新的“主體”——機器。傳播模式中所關涉的主體,現在既可以是人,也可以是機器,并且兩者相互雜糅,構成了異常復雜的多重關系。眾所周知,語言大模型具有強大的語言生成能力,同時具有較好的開放式語言理解能力。機器能做到這一點,是千百年來未曾有過的局面。向量表征、自注意力機制、強化學習、思維鏈等一系列令人眼花繚亂的技術創新,加之大參數、大數據、大算力的強力加持,以及復雜系統涌現機理的“玄妙”作用,諸多要素的風云際會造就了這一奇跡。語言大模型在基本學會人類語言的同時,還將海量語料中蘊含的萬千世界知識及邏輯推理能力,以參數化的形式整合到模型中。《人類簡史》的作者尤瓦爾·赫拉利曾表示:“人類文化基于語言。而因為人工智能已經破解了語言,它現在可以開始創造文化。”事態的發展似乎正在印證這個判斷。今年年初,被稱為“龍蝦”的OpenClaw開源智能體框架火爆全球,其核心驅動正是語言大模型優良的理解和生成能力。語言大模型可以說是OpenClaw的“大腦”,一定意義上形成了人工智能的“操作系統”,可用來構建并運行各類“技能”,以完成包括知識生產在內的各種任務。這為人工智能在經濟文化社會等領域的推廣應用,提供了難得的發展機遇。
但同時也要看到,語言大模型遠非完美。本質上它是概率模型,在語言理解上,不能保證如人類一般精準可靠;在語言生成上,會出現“與生俱來”的“幻覺”現象,即生成虛假信息。換言之,OpenClaw的“大腦”時不時會犯糊涂,更麻煩的是,何時犯糊涂、犯怎樣的糊涂,很難預料。其結果是當我們將“動作”的權力賦予OpenClaw時,它不能保證不出錯,就好像在“瓷器店里捉老鼠”,即使非常小心,打碎一兩件瓷器也在所難免,也就是說,OpenClaw天然存在安全隱患。此外,訓練語言大模型使用的互聯網語料中,往往摻雜人類的各種偏見與謬見,致使模型也存在偏見與謬見。一項隨機抽樣調研顯示,截至2026年3月,互聯網上由人工智能生成的文章數量與人類撰寫的文章數量基本相當。盡管這個調研比較初步,存在采樣規模過小等不足,但還是能從側面反映出一種現象:現如今互聯網上的文章不少是機器寫的,我們卻可能渾然不覺,無意識地受其影響。這個進程尚處于剛剛開始的階段,如果不予以必要治理,今后會愈演愈烈,甚至會涉及意識形態安全、責任倫理、學術不端和知識產權等問題。生成式人工智能在進行知識生產時,從真實性、可靠性、安全性等諸多角度對我們提出了新的挑戰。
這里面還會生發一些更為深刻的問題。例如,語言大模型是通過海量文本訓練出來的,可謂匯總、融通了所有人的知識,性能頂尖的大模型可望得到最廣泛人群的青睞和使用,于是乎它仿佛成了唯一的“智者”,在“人人為模型,模型為人人”的閉環迭代中,互聯網時代“多對多”的傳播模式反而有可能退回到過去印刷時代與電視時代“1對多”的傳播模式,只不過此時的“1”已變成了機器,而不再是人了。此外,語言大模型會傾向于生成概率意義上“共識”較大的內容,而易忽視具個性稟賦的內容,導致知識生產出現某種平庸化、同質化傾向。有研究表明,生成式人工智能可以提升個體創造力,卻降低了“新穎”內容的集體多樣性。這個似乎有些矛盾的結論,其實是不難理解的。
知識生產創新中面臨的此類帶有普遍性的問題,促使我們必須深入思考:第一,在知識生產與傳播進程中,如何處理好人和機器的關系?毋庸置疑,在這個進程中人始終應占據主導地位。生成式人工智能應成為人類的好助手、好伙伴,但絕不能“反客為主”,人是當然的主體和核心。第二,在人機共存的基本條件下,如何更積極地發揮人在知識生產中的主觀能動性?第三,生成式人工智能可加速知識發現與整合,以及無時不在、無遠弗屆的知識傳播,如何在此基礎上有效重構知識生產新范式,使其與時、與世俱進?第四,生成式人工智能降低了知識生產門檻,如何以此為契機更好調動和挖掘大眾知識生產能力,與專家知識生產形成互補?
總的來看,語言大模型乃至生成式多模態大模型的快速發展,給知識生產創新帶來前所未有的機遇和挑戰。面對技術迭代引發的深刻變革,應始終高揚人的主體性,在人與機器協同中探索知識生產的創新之路,讓生成式人工智能真正成為人類文明進步的加速器。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.