當Anthropic的研究人員打開社會學家的問卷返回數據時,一個尖銳的統計差異讓他們停下了手上的動作——在社會科學領域,男性研究者使用AI編程代理的頻率,穩穩地超過女性的兩倍。這種工具像Claude Code一樣,能夠自動生成程序代碼,正在成為學術生產力的新變量,但它的滲透曲線卻畫出了一道令人困惑的性別分界線。
研究團隊是按照姓名推斷性別的方式做的統計,結果發現典型男性姓名的學者調用這類AI助手的次數,比典型女性姓名的同行多出一倍還多。更讓人在意的是,這個落差并非來自學科分布或資歷結構的差異——即便把比較范圍壓縮到同一個學科、相近的職業階段,差距依然頑固地橫在那里。
![]()
論文作者特意指出,編程代理使用上的性別鴻溝、資歷鴻溝和大學排名的鴻溝,全都比研究者日常使用一般AI工具時看到的差距要大得多。當任務從“讓AI幫忙想點思路”升級到“讓AI直接寫代碼”時,原本存在的落差非但沒有消失,反而被放大了。
學科間的斷層同樣劇烈。經濟學家以39%的采用率高居榜首,把其他社會科學領域遠遠甩在身后;而教育研究者只有4%的人用過這類工具,兩端之間差了近十倍。在職業階梯上,熱情最高的是博士生和博士后這群年輕人,他們使用編程AI的比例遠高于手握教職的教授。機構光環也起著作用:排名前25的大學里的研究人員,對這類工具的接納程度比普通院校的同行高出40%。所有這些數據疊加在一起,勾勒出一個現實:越靠近資源中心、越依賴量化方法、越處于職業上升期的研究者,越傾向于把代碼生成這件事交給AI。
他們用AI到底在寫什么?答案近乎單調——97%的使用場景集中在數據分析和代碼生成上。這才是編程代理在社會科學場域里最核心的角色:不是幫忙寫論文,而是處理那些過去需要專門訓練才能搞定的統計腳本、清洗程序、可視化代碼。只有大約三分之一的受訪者會把AI用到文字寫作上。
這種高度聚焦的應用模式,一方面解釋了為什么經濟學家這個計量密集型學科會領頭,另一方面也暗示,性別差距的根源可能并不在“女性不愿意用AI”,而在于研究范式、技能儲備、協作網絡這些更底層的分工與可見度。當一種工具的入場券附帶著編程經驗的門檻,早期使用權就天然地向那些本來就站在技術側的研究者傾斜。
即便存在這樣的結構性斷裂,受訪者對于AI能撬動自己學術產出這件事依然極度樂觀。當一個10分制量表擺在面前,88%的人都給自己預期的生產力提升打了5分以上,有一半的人直接給出了8分甚至更高的評價。而那些已經在高頻使用編程代理的人,樂觀程度還要再高出一截。
這種“用了的更看好”的心態,正在研究圈里催生出一股自我強化的加速流——樂觀者率先投入,投入帶來回報,回報又繼續推高期待。
然而,當安注點從個人辦公桌拉到整個社會科學系統的尺度上,信心曲線忽然就塌掉了一大塊。雖然有70%的受訪者對自身的效率提升信心十足,可一旦被問到AI對社會科學整體的影響,這份興奮就打了個折。研究作者推測,學者們的擔憂集中在出版系統的承載力上:一旦人人都能借助AI更快地產出論文,同行評審的管道就會被迅速擠爆,注意力的爭奪會更慘烈,而那些在學術圈早就拉響警報的頑疾——比如選擇性報告陽性結果、傾向于做安全而小幅推進的增量研究——很可能在論文洪流中被進一步固化。換句話說,個體的生產力狂歡,未必能換算成整個知識生態的健康升級。
這樣的擔憂并不是憑空想象出來的。Anthropic在論文中注意到,類似的事情已經在生物學和醫學領域留下了痕跡。那些由AI幻覺產生的虛假參考文獻,正慢慢滲透到足以影響臨床指南的文章里,從2023年至今,引用造假的比例足足飆高了十二倍以上。社會科學會不會走上同一條路?至少在參與調查的研究者看來,這個問號比AI能帶來多少邊際產出要沉重得多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.