![]()
Anthropic于周四正式發布了其目前最先進公開模型的最新版本——Opus 4.8。該模型已在所有平臺全面上線,定價標準與上一版本Opus保持一致。
此次新模型的發布距離Opus 4.7上線僅41天,這對Anthropic而言是一個遠超以往的快速迭代周期。作為對比,最新版Sonnet和Haiku模型距今分別已有三個月和七個月未更新。此番加速迭代,或許與Opus 4.7發布后遭遇的冷淡反響有關——部分用戶認為該版本表現不盡如人意。
與此同時,OpenAI的Codex和谷歌的Gemini Flash模型相繼推出重要更新,也進一步加劇了Anthropic在競爭中的壓力。
新版本除了延續行業領先的基準測試成績外,在處理錯誤或不確定數據方面也獲得了特別關注。在官方發布博文中,Anthropic早期測試用戶發現,Opus 4.8"更傾向于主動標記工作中的不確定性,且更少提出缺乏依據的結論"。
橋水基金(Bridgewater Associates)的用戶測評也印證了這一點,其表示此次升級最顯著的變化在于"Opus 4.8能夠主動發現分析輸入和輸出中存在的問題,而這正是其他模型通常會忽略、留給用戶自行排查的部分"。
與新模型同步發布的,還有一項名為"動態工作流"(Dynamic Workflows)的新功能,目前以研究預覽版形式開放使用。該系統旨在幫助Opus等大型模型協調管理跨數百個并行子智能體的復雜任務。
官方博文中寫道:"Claude Code結合Opus 4.8,現已能夠在現有測試套件的約束下,從啟動到合并,完整執行涵蓋數十萬行代碼的代碼庫級遷移任務。"
值得一提的是,Anthropic旗下最先進的Mythos模型目前仍處于暫緩發布狀態——上個月的初步預覽因引發網絡安全方面的顧慮而被叫停。不過,Anthropic在今天的Opus發布公告中暗示,一旦必要的安全防護措施就位,Mythos的預覽期或將很快結束。
"我們正在加快推進相關安全措施的開發工作,預計將在未來幾周內向所有用戶開放Mythos級別的模型。"Anthropic在公告中表示。
Q&A
Q1:Opus 4.8相比Opus 4.7有哪些改進?
A:Opus 4.8最顯著的改進在于對不確定數據的處理能力。新版本更傾向于主動標記分析中的不確定性,減少提出無依據結論的情況。橋水基金的測試反饋也指出,Opus 4.8能主動發現分析輸入和輸出中存在的問題,而非將排查工作留給用戶,這是其他模型普遍缺失的能力。
Q2:動態工作流功能具體是做什么的?
A:動態工作流(Dynamic Workflows)是Anthropic與Opus 4.8同步推出的新功能,目前以研究預覽版形式開放。該功能旨在幫助Opus等大型模型協調管理跨數百個并行子智能體的復雜任務。結合Claude Code使用,可實現對數十萬行代碼的代碼庫級遷移,覆蓋從任務啟動到代碼合并的完整流程。
Q3:Anthropic的Mythos模型什么時候正式發布?
A:目前Mythos模型仍未正式對外開放。此前的初步預覽因引發網絡安全顧慮而暫停。Anthropic在Opus 4.8發布公告中表示,公司正加快推進相關安全防護措施的開發,預計將在未來幾周內向所有用戶開放Mythos級別的模型,具體發布時間尚未正式確認。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.