Anthropic于2026年3月26日正式公開了一套面向AI代理的零信任架構框架,這一動作將原本還在爭論“是否需要為AI代理單獨設計安全模型”的行業推向實戰應答——答案是不容置疑的“需要”,并且直接給出了可落地的架構藍圖。該框架不再停留在理論指導層面,而是提供了具體的架構模式,明確指出前沿AI已將漏洞從發現到被利用的時間線從數月壓縮到數小時,傳統的邊界式安全模型已徹底失效。 該框架瞄準了傳統訪問控制天生無力應對的四種威脅向量:提示注入導致的代理行為劫持、通過工具污染實現的供應鏈攻擊、跨會話記憶竊取與污染,以及多代理間的權限混淆越權。這四類威脅在傳統網絡邊界模型下幾乎無法防御。 架構分為基礎、企業和高級三個實施層級。基礎層面向單代理部署,提供基本的隔離和最小權限模式;企業層增加了跨會話審計追蹤、記憶沙箱隔離以及MCP元數據驗證;高級層則引入實時異常檢測、代理間策略執行和自動化事件響應編排。例如針對通過MCP服務器元數據進行的工具投毒攻擊,企業層通過元數據模式校驗進行防護,而高級層則進一步通過運行時對工具輸出的行為監控來進行深度防御。 這套框架最值得關注之處在于,它在AI代理大規模部署之前就搶先完成了安全標準化,而不像歷史上許多安全體系那樣跟在攻擊者身后亡羊補牢。它實際上也間接承認了當前包括Anthropic自有的Claude在內的代理生態存在結構性漏洞,僅靠提示工程層面的修補已無力回天。正如早期披露該消息的@_vmlops所強調的:“這不是理論,這是架構。”Anthropic正在將代理安全的討論從“要不要做”推進到“怎么做”的層面,迫使企業安全團隊必須正視一個事實:AI代理需要完全獨立的安全模型,而擺在面前的,就是現成的施工圖。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.