網易首頁 > 網易號 > 正文申請入駐

大模型正摧毀軟件價值？個人效率翻倍，部署頻率反降11%

2026-06-01 01:05:45　來源: 灰度測試中

北京舉報

分享至

AI編碼工具總被描繪成效率神器，似乎只要插件一裝，代碼就能10倍速飛濺而出。但來自工程實際運營的數據，可能讓所有樂觀預期都尷尬地沉默了。一家名叫Faros.ai的研發遙測公司，直接接入了Jira、GitHub和CI/CD流水線，量化追蹤了使用AI輔助編程的團隊與不使用AI的團隊的真實表現差異——結果遠非“10倍效能神話”，反倒指向一個讓人不安的結論：我們大規模使用大語言模型的方式，平均來看，很可能正在毀滅價值。

事情的起點是今年3月Faros發布的一份報告，覆蓋了22000名開發者、4000個工程團隊，是對LLM在軟件交付流程中實際影響的罕見大規模對比。報告里最刺眼的數字，莫過于個人產出和系統交付的致命背離：開發者們的“生產率”——也就是完成單個任務的速度——確實提升了，最高能達到2倍左右，這對于個體而言是不小的進步。可一旦把目光拉到整個價值流，意外就來了：衡量團隊真正向用戶交付價值的部署頻率，反而下降了11%。這就像每個廚師都炒菜更快了，但客人等菜的時間卻變長了。

作者Jake May特意辨析了一個運營學上的關鍵區分：生產率（productivity）和吞吐量（throughput）根本不是一回事。生產率只看工人把手頭活兒干完的速度，但吞吐量衡量的是整個系統有多少成品真正流向了客戶。一個功能分支被寫完，離上線還隔著代碼審查、測試、集成和發布，LLM帶來的個人加速很可能被這些環節的隱性摩擦消耗殆盡。更觸目驚心的一個指標是代碼刪除比例，報告沒有展開細節，但高刪除率往往暗示批量產出的代碼質量堪憂，寫得多、扔得也多，返工成本默默侵蝕著效率增益。

當然，這里有一個需要注意的樣本細節：完整的系統級數據只來自將遙測管線接入CI/CD的10%客戶，實際落在約2200位開發者和400個團隊上。這個子樣本是否足夠推及整體，自然會有不同看法。作者認為，子樣本規模已經大到足以讓統計均值描述整體的分布中心，至少在討論趨勢時，這份數據提供的信息比任何主觀感受更可靠。

“這個圖讓我震驚，它是對我們使用LLM的方式的殘酷控訴。”Jake May用這樣一句感嘆鎖定了立場。如果個人效率的提升不能轉化為更頻繁的價值交付，反而附帶上更高的代碼刪除負擔，那所謂的“適度提升”背后，可能藏著更大的系統性損耗。看清這些被忽略的指標，或許比追趕任何新工具都更需要這行人的清醒。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.