網易首頁 > 網易號 > 正文申請入駐

微軟漏洞系統得分88.45%，背后是100個代理在“開會”

2026-06-01 18:41:54　來源: 我是一個養蝦人

北京舉報

分享至

當安全行業還在用單個大模型挖漏洞時，微軟卻悄悄搭建了一個讓100多個AI代理互相挑刺的系統。它叫MDASH，一個多模型代理安全平臺。在包含1507個真實世界漏洞的公開基準測試CyberGym里，MDASH拿下了88.45%的得分，比第二名高出大約5個百分點。而這個成績的關鍵，不是某個模型有多聰明，而是代理們協同掃描、辯論、驗證、去重，甚至自動生成攻擊證明。

微軟并未把所有希望壓在單一模型或一條提示詞鏈上。MDASH被設計成一個多階段管道，掃描、辯論、驗證、去重和利用都由專門的代理分別負責。這些代理協作進行跨文件推理，能識別生命周期漏洞、并發漏洞，還能判斷漏洞究竟是不是真的可被利用，而不只是理論上的弱點。這種方式讓系統在面對Windows、Hyper?V、Azure這類龐大的專有代碼庫時，仍能保持較高的覆蓋率和精度。

微軟在公告中透露，MDASH在內部測試中對經過微軟安全響應中心審查的歷史漏洞clfs.sys召回率達到96%，對tcpip.sys的召回率達到100%。這一結果背后，是圍繞模型構建的協調框架在起作用。微軟強調，整套系統在設計上不依賴于特定的模型，這意味著團隊更換或升級底層模型時，周邊的驗證、證明和工作流基礎設施可以完整保留。換言之，比起模型的原始能力，模型之外的工程系統才是決定AI安全工具上限的核心。

這種由代理構成的協調層，也正在引發關于大規模自主安全系統運營風險的討論。在LinkedIn上，Sandesh KS的一篇博文寫道：“協調層正是讓事情變得引人入勝同時又充滿風險的地方。當專用代理開始協調身份系統、財務監控和云基礎設施時，一個權限邊界的配置錯誤所引發的連鎖反應能夠波及的范圍將變得極其巨大。治理層必須在代理投入運行之前就設計好，而不是在發生首起事件后才進行補救。”

Sandesh KS的擔憂直指一個現實：當代理們能夠自主編排掃描、驗證甚至利用的流程時，系統一旦越過權限邊界，故障半徑將難以預估。這也解釋了為什么微軟目前只讓MDASH進行內部測試，并通過有限私有預覽向部分特定客戶開放。微軟表示，有興趣測試該系統的組織可通過微軟安全預覽計劃申請。可以看出，在把協調層真正嵌入生產環境前，治理框架的構建已經被提到了與系統開發同等重要的位置。

從單個模型測試到集成化的代理系統，AI輔助網絡安全正在經歷一次架構層面的轉向。MDASH的出現說明，未來的安全工具將更像一個由專門代理人組成的攻防團隊，而不是一個全知全能的模型哨兵。當100多個代理開始討論漏洞時，安全發現的效率和覆蓋面或許會被重新定義，而如何管好這群“開會”的代理，將成為新的難題。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.