![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】Claude Fable 5發(fā)布當(dāng)天,微軟火速上架,自家員工卻用不了。一道ZDR紅線,擋住了最強(qiáng)模型。
6月9日,Anthropic正式發(fā)布Claude Fable 5。
![]()
這是Mythos家族第一個(gè)面向公眾的模型,號(hào)稱(chēng)能扛下數(shù)天級(jí)、多階段的復(fù)雜任務(wù)。
Fable 5發(fā)布后微軟火速向客戶(hù)推出,GitHub Copilot、Microsoft Foundry當(dāng)天上架,Azure官方博客的標(biāo)題寫(xiě)著「開(kāi)啟自主智能體的下一個(gè)時(shí)代」。
![]()
GitHub Copilot模型選擇器中已可選Claude Fable 5,微軟員工的內(nèi)部版沒(méi)有這個(gè)選項(xiàng)。
![]()
微軟Azure官方博客高調(diào)宣布Fable 5上線Foundry:「開(kāi)啟自主智能體的下一個(gè)時(shí)代」。
客戶(hù)第一時(shí)間嘗鮮,自家員工卻用不了。
據(jù)The Verge報(bào)道,在微軟員工內(nèi)部使用的GitHub Copilot里,其他Claude模型全都在,唯獨(dú)沒(méi)有Claude Fable 5。
![]()
報(bào)道稱(chēng),微軟一直在告訴員工:法務(wù)團(tuán)隊(duì)正在評(píng)估Anthropic新的數(shù)據(jù)留存要求,核心擔(dān)憂(yōu)是客戶(hù)數(shù)據(jù)和機(jī)密信息。
法務(wù)最終會(huì)不會(huì)放行,目前沒(méi)人知道。
一道紅線
擋住了最強(qiáng)Claude
要理解微軟在擔(dān)心什么,要先看Anthropic Fable 5模型官方發(fā)布頁(yè)有關(guān)數(shù)據(jù)留存的一項(xiàng)規(guī)定,它寫(xiě)道:
使用Fable,需要30天數(shù)據(jù)留存,用于安全監(jiān)控。
![]()
GitHub在變更日志中,向Copilot用戶(hù)轉(zhuǎn)述了這條上游條款:
與Copilot中的其他Claude模型不同,Claude Fable 5需要數(shù)據(jù)留存來(lái)運(yùn)行Anthropic的安全分類(lèi)器。提示詞和輸出由Anthropic保留最長(zhǎng)30天,到期刪除。
而其他所有Claude模型,包括Opus 4.8、Sonnet 4.5、Haiku 4.5,繼續(xù)在零數(shù)據(jù)留存(Zero Data Retention,ZDR)規(guī)則下運(yùn)行。
Anthropic隱私中心說(shuō)明,被安全分類(lèi)器標(biāo)記為違反使用政策的輸入輸出,最長(zhǎng)可以保留2年。
這意味著30天只是常規(guī)上限:標(biāo)記由分類(lèi)器自動(dòng)觸發(fā),一旦命中,企業(yè)數(shù)據(jù)脫離自己掌控的時(shí)間,就從一個(gè)月拉長(zhǎng)到兩年。
留存的數(shù)據(jù)不會(huì)用于訓(xùn)練模型,只用于安全監(jiān)控。這是Anthropic條款里的承諾,GitHub在變更日志中也寫(xiě)明了這一點(diǎn)。
但對(duì)微軟自身來(lái)說(shuō),問(wèn)題并不在這里。
它手里握著的,是GitHub上全球開(kāi)發(fā)者的代碼、Office文檔里的合同,以及Azure云上的企業(yè)機(jī)密。
員工的每一個(gè)提示詞里,都可能帶著客戶(hù)數(shù)據(jù)。這些東西在別家服務(wù)器上留存30天,本身就是誘發(fā)合規(guī)事故的種子。
ZDR的邏輯很簡(jiǎn)單:請(qǐng)求處理完,數(shù)據(jù)即刻刪除。服務(wù)器上不留副本,就談不上泄露,談不上被調(diào)取,也談不上被人查看。
對(duì)金融、醫(yī)療、政府這類(lèi)客戶(hù),ZDR往往直接寫(xiě)進(jìn)合同。它是微軟給客戶(hù)的承諾,也是它給自己畫(huà)的紅線。
而Fable 5的30天留存的數(shù)據(jù)新政,剛好正面撞在了這條線上。
Anthropic
不看數(shù)據(jù)不敢放模型
再把視線轉(zhuǎn)向另一邊,Anthropic給出的理由也同樣硬:信任和安全。
為了確保能夠負(fù)責(zé)任地部署Mythos級(jí)模型,我們要求在安全工作中實(shí)施有限的數(shù)據(jù)保留和審查。在所有提供這些模型的平臺(tái)上,提交給Mythos級(jí)模型的提示及其生成的輸出內(nèi)容均會(huì)保留30天。
這項(xiàng)政策已于2026年6月9日生效,適用于Mythos系列模型以及Anthropic官方指定為受涵蓋模型的、具備類(lèi)似能力的未來(lái)模型。
所有其他模型,相關(guān)條款不變,用戶(hù)的使用內(nèi)容不受影響。
早在幾個(gè)月前,Anthropic就表示過(guò)Mythos這一類(lèi)模型在網(wǎng)絡(luò)安全任務(wù)上能力過(guò)強(qiáng),危險(xiǎn)到不適合公開(kāi)發(fā)布。
Claude Fable 5與Claude Mythos 5是同一個(gè)底座。也就是說(shuō),幾周前那顆被認(rèn)為危險(xiǎn)到不宜公開(kāi)發(fā)布的大腦,F(xiàn)able 5同樣具備。
![]()
區(qū)別在于,F(xiàn)able 5疊加了一層安全機(jī)制:涉及網(wǎng)絡(luò)安全、生物等敏感領(lǐng)域的請(qǐng)求,會(huì)被安全分類(lèi)器攔下,自動(dòng)切換到Claude Opus 4.8處理,且不按Fable的價(jià)格計(jì)費(fèi)。
真正不設(shè)限的Mythos 5,只開(kāi)放給極少數(shù)獲批組織。
那為什么還要留數(shù)據(jù)?Anthropic幫助中心給出的解釋是:有些攻擊,單看一條請(qǐng)求根本看不出來(lái)。
Best-of-N越獄,會(huì)朝模型發(fā)出幾百個(gè)微調(diào)過(guò)的提示詞變體,賭其中一個(gè)能突破防線,比如數(shù)據(jù)勒索這類(lèi)大規(guī)模濫用,只有把海量請(qǐng)求放在一起看,模式才會(huì)浮出水面。
要檢測(cè)這些威脅,必須臨時(shí)留存提示詞和輸出,放在一起分析。
Anthropic也列出了保護(hù)措施:
員工無(wú)權(quán)隨意查看留存數(shù)據(jù),只有內(nèi)容被標(biāo)記為潛在嚴(yán)重危害、或客戶(hù)書(shū)面請(qǐng)求時(shí),少數(shù)獲批準(zhǔn)的審核員才能通過(guò)專(zhuān)用工具查看,而這套工具禁止導(dǎo)出、復(fù)制和下載。
每一次訪問(wèn)都記入防篡改日志。30天一到,數(shù)據(jù)自動(dòng)刪除。
符合條件的組織還可以加上客戶(hù)自管加密密鑰和訪問(wèn)透明度審計(jì)日志。
按照Anthropic的解釋?zhuān)⒎撬肟茨愕臄?shù)據(jù),只是不看,它就不敢把這個(gè)模型放出來(lái)。
30天留存,是Mythos級(jí)能力對(duì)外開(kāi)放的條件。想用它,必須要先放棄你的ZDR紅線。
誰(shuí)受影響
留存怎么設(shè)置
個(gè)人用戶(hù)不受影響。
Claude的Free、Pro、Max套餐本來(lái)就會(huì)為安全目的留存數(shù)據(jù),這次什么都沒(méi)變。
![]()
Anthropic幫助中心逐平臺(tái)列出了Fable 5的數(shù)據(jù)留存配置方式https://support.claude.com/en/articles/15425996-data-retention-practices-for-mythos-class-models
真正被改變的,是那些專(zhuān)門(mén)配置了ZDR的組織:
在Claude Console里設(shè)了ZDR工作區(qū)的;
在Claude Enterprise里用ZDR跑Claude Code的;
以及通過(guò)AWS Bedrock、Google Cloud Agent Platform或Microsoft Foundry啟用了ZDR的。
當(dāng)初對(duì)數(shù)據(jù)合規(guī)要求越嚴(yán)格的公司,越要面臨重新做選擇的挑戰(zhàn)。
官方給出了使用Fable 5的操作指南。
![]()
Anthropic幫助中心逐平臺(tái)列出了留存配置方式,五個(gè)渠道中只有Azure Foundry(高亮處)要求另建訂閱。
直接用Claude API的,在開(kāi)發(fā)者控制臺(tái)里給指定工作區(qū)打開(kāi)留存,路徑是工作區(qū)→管理→隱私控制,其他ZDR工作區(qū)照舊。
Claude Code跟著所在工作區(qū)走,工作區(qū)開(kāi)了留存,它就能用指定模型。
走Amazon Bedrock和Google Cloud Agent Platform的,同樣要先啟用留存,但有一個(gè)關(guān)鍵區(qū)別:留存的數(shù)據(jù)待在你自己的AWS或GCP環(huán)境里,不出自家云。
對(duì)最在意數(shù)據(jù)歸屬的公司,這是一個(gè)很重要的緩沖區(qū)。
Azure Foundry最特殊:留存按訂閱配置,已設(shè)ZDR的訂閱想用Fable 5,得專(zhuān)門(mén)另建一個(gè)。
用Claude Enterprise的ZDR組織,管理控制臺(tái)正在上線開(kāi)關(guān),主管理員可以直接改。
不想動(dòng)生產(chǎn)環(huán)境的,Anthropic可以幫忙搭一個(gè)獨(dú)立的沙盒組織。
整套設(shè)計(jì)的思路是隔離:留存的口子只開(kāi)在你指定的那個(gè)工作區(qū)、訂閱或沙盒里,其他地方紅線照舊。
要用可以
你自己簽字
故事到這兒還沒(méi)完,微軟對(duì)自家客戶(hù),其實(shí)也留了一手。
GitHub變更日志里藏著一個(gè)細(xì)節(jié):在Copilot Business和Enterprise中,Claude Fable 5的策略默認(rèn)關(guān)閉,管理員必須手動(dòng)開(kāi)啟。
而開(kāi)啟這個(gè)策略,即構(gòu)成對(duì)數(shù)據(jù)留存要求的確認(rèn)。
![]()
![]()
GitHub官方寫(xiě)明:策略默認(rèn)關(guān)閉,開(kāi)啟即視為確認(rèn)接受留存要求。這個(gè)開(kāi)關(guān)就是本節(jié)說(shuō)的「免責(zé)聲明」。
Azure那邊同理。
ZDR訂閱想用Fable 5只能另建一個(gè),開(kāi)新訂閱這個(gè)動(dòng)作本身,就是客戶(hù)自己做的選擇。
換句話(huà)說(shuō),微軟把選擇權(quán)和責(zé)任打包在一起,交給了客戶(hù)的管理員。你要用,你自己簽字。
那個(gè)默認(rèn)關(guān)閉的開(kāi)關(guān),就像微軟的一份免責(zé)聲明。
它和對(duì)員工的限制,背后是同一套邏輯。區(qū)別只是,客戶(hù)還能自己選,自家員工沒(méi)有選擇。
選模型
只看跑分不行了
以前判斷一個(gè)模型能不能用,看跑分、看價(jià)格、看手感。
現(xiàn)在多了一道隱形的關(guān)卡——法務(wù)。
你在公司里能用上哪個(gè)AI,除了性?xún)r(jià)比之外,還要看數(shù)據(jù)是否合規(guī)等法務(wù)問(wèn)題,這次Fable 5就是一個(gè)例子,就連微軟自己的員工都被攔在門(mén)外,何況別人。
Anthropic當(dāng)然希望能比競(jìng)爭(zhēng)對(duì)手更早推出更強(qiáng)的模型,但模型能力越強(qiáng),安全護(hù)欄就要越高。
它賭的是:Mythos級(jí)的能力,值得大家交出這30天數(shù)據(jù)的留存權(quán)。
落到微軟這邊,法務(wù)評(píng)估的是:ZDR這條紅線,值不值得為Fable 5破例。
微軟內(nèi)部的評(píng)估,至今還沒(méi)有結(jié)論。
有一件事已經(jīng)變了:以后想用上最強(qiáng)的模型,可能要先過(guò)法務(wù)這一關(guān)了。
參考資料:
https://www.theverge.com/report/947575/microsoft-claude-fable-5-restricted-internally
https://www.anthropic.com/claude/fable
https://support.claude.com/en/articles/15425996-data-retention-practices-for-mythos-class-models
編輯:元宇
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.