“如果這個標(biāo)準(zhǔn)應(yīng)用到整個行業(yè),將有效阻止所有前沿模型提供商發(fā)布新模型。”這是Anthropic針對美國政府緊急出口管制令的回應(yīng)。故事開端:美國政府演示了一個越獄方法,要求模型讀取特定代碼庫并修復(fù)軟件漏洞。Anthropic的反駁很直接:GPT-5.5每天都在做這件事,全球開發(fā)者用它保護(hù)系統(tǒng)、防御黑客。
在暫停令下達(dá)之前,用戶已經(jīng)炸了三次鍋:激進(jìn)的安全護(hù)欄攔截了合法的學(xué)術(shù)查詢,悄然修改的數(shù)據(jù)保留政策打破了給企業(yè)客戶的零保留承諾,以及用戶在不知情下被降級使用殘缺版模型。而這一切讓我們有理由深挖一個數(shù)字:1585行。
![]()
https://nimg.ws.126.net/?url=http%3A%2F%2Fdingyue.ws.126.net%2F2026%2F0613%2Ff0773e2aj00tgkpdb0011d000m700c4p.jpg&thumbnail=660x2147483647&quality=80&type=jpg
1585行是Claude Fable 5系統(tǒng)提示的長度。粗看之下,一千多行指令聽起來像一出混亂的配方,理應(yīng)在自身重壓下崩潰,各段落彼此矛盾,輸出亂七八糟的行為。但Fable 5沒有散架。它被普遍視作Anthropic迄今最精準(zhǔn)、最一致的產(chǎn)品,還出奇地擅長知道什么時候該求助。秘密不在于它是個更長的提示,而在于它是個偽裝成提示的模塊化操作系統(tǒng)。
如果你把Fable 5的系統(tǒng)提示當(dāng)成一份線性的指令清單來讀,你會徹底蒙圈。它不是一個文檔,而是一套架構(gòu),七個邊界清晰的子系統(tǒng):行為模塊管身份、邊界、語氣和倫理;記憶系統(tǒng)負(fù)責(zé)跨會話回憶;搜索指令決定何時以及如何上網(wǎng)搜;電腦使用權(quán)限是一個可以執(zhí)行代碼的Linux沙盒;工具定義涵蓋二十多種工具并附完整JSON模式;技能系統(tǒng)存儲可復(fù)用的領(lǐng)域知識;工件存儲提供跨會話的持久化鍵值存儲。
每個子系統(tǒng)獨(dú)立運(yùn)作。產(chǎn)品信息部分不干預(yù)心理健康協(xié)議,語氣規(guī)則不跟搜索策略打架。軟件工程里講求的關(guān)注點(diǎn)分離原則,被原樣搬進(jìn)了提示工程里,這是Fable 5好用的第一重原因。行為模塊本身相當(dāng)于一部憲法,定義的不僅是Fable 5能做什么,更是在框定它的邊界和姿態(tài)。Anthropic在發(fā)布前與美國政府、英國AISI以及多方第三方進(jìn)行了數(shù)千小時的團(tuán)隊(duì)紅隊(duì)測試,也沒人發(fā)現(xiàn)通用越獄方法。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.