<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      百度智能云 DuMate 測評:辦公 Agent 教我用 Claude Code,效果如何?

      0
      分享至

      雷峰網訊 百度針對企業級場景設計的桌面級 AI 智能體 DuMate 于今年 3 月 22 日全量上線。從我們對于 AI 辦公產品的以往測評來看,能夠真實進入辦公場景的產品還是不多見。

      DuMate 能否打破中看不中用的魔咒,成為一款真正能“抗活兒”的 AI 搭子?帶著這樣的疑問,我們設計了一項覆蓋項目研究、結果整理以及包括四種交付物的多形態輸出任務。看看百度智能云 DuMate,究竟能把任務推進到什么程度。



      01


      先看產品邏輯:解決真實工作流問題

      中國一眾 AI 玩家里,百度的打法一直有自己的邏輯。文心一言打頭部認知市場,秒噠打無代碼應用搭建,而 DuMate 則試圖填補一個更具體的位置,個人及團隊的日常辦公場景中,真正替代那些需要“操作軟件、串聯文件、交付結果”的重復勞動。

      本質上,這就是桌面級 Agent 的生態位。AI 助手的價值,不在于“答得更好”,更在于“做得更多”。當大模型的推理能力逐漸同質化,真正拉開差距的,是誰能更好地把 AI 嵌入真實工作流,并交付可留存、可復用的結果。

      根據百度智能云公開資料,DuMate 強調的不只是問答,而是“看見屏幕、操作軟件、處理文件、串聯業務系統”。看起來簡單的功能定位,實際上覆蓋了從桌面執行、工作區、技能擴展到本地安全、辦公交付的整條工作鏈。在技術邏輯上,這需要 DuMate 具備三個層次的能力。

      第一層是感知與理解。DuMate 需要理解用戶在說什么、想做什么,這背后是將自然語言指令映射為具體操作序列的能力。

      第二層是工具調用與執行,理解之后,DuMate 需要調起正確的工具,讀寫文件、操作瀏覽器、執行代碼、調用 API。這要求它對桌面環境有真實的感知和控制能力,而非只返回一個 API 調用建議。

      最后就是結果交付與歸檔。執行完成后,結果需要以正確的形態輸出,對于辦公助手來說,這往往是 Word 文檔、Excel 表格、PPT 演示或者網站頁面。而且交付物本身必須可留存、可復用。

      今年 3 月 22 日全量上線后,DuMate 迅速補齊了技能廣場、Word/PPT/Excel 優化、文件預覽解析、每日總結、消息渠道接入和正式計費等能力。在不到一個月的時間內,核心辦公能力已經基本完整。DuMate 辦公工作臺的產品邏輯已經越發清晰:即通過一個智能體,將用戶模糊的目標,直接轉化為可留存、可復用的最終交付物,從而真正嵌入并解決真實的工作流問題。


      02


      實測:一套事實底稿,四種交付物

      這次測試,我們沒有選擇常見的“寫一篇文章”或“整理一份表格”之類不痛不癢的輕任務,而是給 DuMate 布置了一項更接近真實工作的復雜任務,圍繞某一個 GitHub 項目,完成一次“項目研究 + 多形態交付”任務。

      比如讓 AI 做一張 excel 或者生成一張 PPT,這類任務太簡單、太干凈,現實中很少有人這樣工作,根本測不出來AI 的水平。但是用一個真實的、雜亂的、多源信息的任務來考核 AI,比如圍繞一個 GitHub 項目做任務,這正是研發、產品、技術寫作人員日常會碰到的工作。如果 AI 在這種任務上表現不錯,那它在真實辦公場景中大概率也能派上用場。

      這次我們選擇的 GitHub 項目叫做 everything-claude-code,給不熟悉的朋友介紹一下。這個項目在 GitHub 上的 Star 數已經超過了 14 萬。比起某種工具,它更像是一套專為 Claude Code 等 AI 編程工具設計的工程化配置系統,既能用來調教 AI,也能拿它學習怎么跟 AI 打配合。

      Everything-claude-code 被設計出來的目的就是把 AI 從“聊天助手”升級成可遵循規范、沉淀經驗的智能工程系統。

      具體來說它解決的是四大痛點:

      ?持久化記憶:通過自動化鉤子實現跨會話上下文保存,避免換項目就失憶;

      ?規范化流程:將開發拆解為規劃、審查、測試等環節;

      ?自動化檢查:內置安全掃描工具 AgentShield,含 1282 項測試和 102 條安全規則;

      ?持續學習:AI 自動提取有效模式沉淀為團隊知識。

      整個項目組件像一個完整的“AI 開發流水線”,包括 30 多個各司其職的 Agent,150+ 個可復用 Skill 固化成的最佳實踐,70+ 條快捷命令一鍵觸發復雜流程,還有 30 余條規則構成 AI 的行為底線。

      簡單來說,everything-claude-code 就是將一位資深工程師的一次性對話變成了可積累、可優化的“工程實踐”,并且能直接服務于你的私人 Agent 助理。

      我們為 DuMate 設計的測試任務,就是要求它對開源在 GitHub 上的 everything-claude-code 進行整理,并把這份“秘籍”以 Excel 內容目錄、Word 說明書、PPT 大綱與逐頁內容、網站四種形式進行輸出。

      測試題目:


      代碼塊


      請圍繞 GitHub 項目 everything-claude-code(https://github.com/affaan-m/everything-claude-code)完成一次“項目研究 + 多形態交付”任務。

      注意:該項目不是普通應用,而是一個面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增強系統。請重點分析其 commands、skills、hooks、rules、guides、install scripts、配置與集成方式,不要誤寫成傳統 SaaS 或單體軟件。

      請你先基于 GitHub 倉庫和公開網絡資料完成研究,形成一份“統一事實底稿”,再基于這同一套事實底稿輸出以下 4 項交付物:
      1. 一份可歸檔的正式 Word 說明書, 以計算機類專業書籍的格式呈現
      2. 一份適合介紹/匯報的 PPT 內容稿,面向計算機專業群體
      3. 一個可本地預覽的展示型靜態網站
      4. 一份 Excel 統計表,用于統計當前項目的組件/模塊/目錄/關鍵文件數量、名稱、作用說明及備注

      一、研究范圍
      至少覆蓋:
      - 項目定位、目標用戶、解決的問題、典型場景
      - commands / skills / hooks / rules / guides / scripts / 配置文件 / tests / integrations 的結構與作用
      - 安裝、配置、接入方式、典型用法
      - 架構或工作機制
      - 當前版本狀態、最近更新、維護活躍度
      - 風險、限制、不確定項
      - GitHub 之外的 guide、release、官網、文檔、博客、社區、教程、討論等資料

      二、統一事實底稿
      請先輸出一份結構化項目情報,作為后續全部交付物的唯一事實來源。
      要求:
      - 先輸出“統一事實底稿”,標注【已確認】【推斷】【待確認】,盡量附來源鏈接
      - 如有資料沖突,列出沖突點與判斷依據
      - 所有后續交付物必須嚴格基于同一套事實底稿,彼此不得矛盾
      - 不得編造項目中不存在的功能、組件、版本或官方信息

      三、交付物要求
      1)Word:面向首次接觸者,章節完整、專業正式,適合歸檔/培訓/對外說明;若不能直接生成 .docx,則提供完整正文、標題層級、封面建議、排版建議和文件名
      2)PPT:適合介紹/匯報,不照搬說明書;先大綱后逐頁;每頁含標題、3-6個要點、圖示建議、演講備注;10-18頁;若不能直接生成 .pptx,則提供完整逐頁內容和文件名
      3)網站:若不能直接發布,則生成本地可運行的靜態網站目錄;至少包含首頁、項目介紹、核心能力、安裝使用、架構說明、FAQ、參考資料;提供目錄結構、全部文件內容、入口文件名和打開方法;優先使用無需復雜構建的 HTML/CSS/JS
      4)Excel:先說明統計口徑;統計當前項目的目錄、commands、skills、hooks、rules、scripts、docs/guides、配置文件、tests、integration targets 等數量、名稱、路徑、作用說明、所屬類別、備注、來源依據;若不能直接生成 .xlsx,則提供可直接導入 Excel 的 CSV 或表格內容及文件名

      四、輸出順序
      1. 研究方法與信息來源
      2. 統一事實底稿
      3. Excel 統計口徑與統計表
      4. Word 說明書
      5. PPT 大綱與逐頁內容
      6. 網站目錄結構與文件內容
      7. 風險說明、未確認項、受限項
      8. 最終交付清單與建議文件名

      五、全局約束
      - 所有產出必須基于同一套事實底稿,彼此不得矛盾
      - 不得編造 GitHub 倉庫中不存在的功能、組件、版本或官方信息
      - 對不確定內容必須明確標注
      - 不得在無法生成真實 .docx/.pptx/.xlsx 文件時謊稱“已生成完成”

      這項任務的難點在于,everything-claude-code 不是普通應用程序,而是一個面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增強系統,因此 DuMate 不能把它誤寫成傳統 SaaS 或單體軟件。

      此外由于超高的熱度,everything-claude-code 在網絡上有大量公開資料補充,DuMate 的研究不能局限于 GitHub 倉庫。良莠不齊的公開資料又對交付質量提出了挑戰,即所有內容必須基于同一套”統一事實底稿”,DuMate 需要甄別、摒棄那些自相矛盾的錯誤信息。

      最終,它需要交付四樣東西:一份 Word 說明書、一份 PPT 內容稿、一個可本地預覽的靜態網站,以及一份 Excel 統計表。

      DuMate 的表現如何呢?下面來看看:

      ?搭底稿:先研究,后輸出

      第一步,DuMate 先讀懂 everything-claude-code 項目,并從公開網絡補充 guide、release、文檔、博客和社區資料,最終形成“統一事實底稿”。這一步最值得看的,不光是它會不會把倉庫 README 摘一遍,還有它有沒有能力把倉庫內信息和倉庫外信息合并起來,再組織成后續交付物共同依賴的底層材料。

      從實際界面看,DuMate 沒有停留在“對話框里給一段總結”,而是把任務拆成了多個階段節點。右側“進程”欄會顯示當前正在生成的 Word、PPT、網站目錄與最終清單等內容,左側則能看到當前對話與工作區文件。這意味著它的執行過程不是黑箱,用戶能知道它正在做什么、哪些文件已經生成、后續還會走到哪一步。對一款以“真干活”為賣點的辦公 Agent 來說,可觀察、可控的使用體驗是必不可少的。


      更關鍵的是,DuMate 先搭底稿,再做輸出。這個動作的價值在于:一旦底稿成型,后面的 Word、PPT、網站和 Excel 才有可能保持前后一致。對有過真實項目經歷的人來說,最耗人的往往不是寫材料,而是來回核對材料之間是否矛盾。DuMate 表現出來的,是一種更接近項目工作的研究先行 + 一稿多用思路。



      ?Excel 統計:統計口徑先行

      在事實底稿之后,DuMate 被要求生成 Excel 統計表。這里的難點不是“做個表”,而是要明確統計口徑,梳理項目模塊、目錄、關鍵文件、數量、路徑、作用說明和備注,并且與前面的研究結論保持一致。

      實際任務中,它給出的不是一張臨時列表,而是一份更接近可二次使用的統計材料,包含統計口徑說明、各字段定義,以及能夠與后續文檔交叉核對的結構化數據。


      ?Word 說明書:進入真實文件生成流程

      接著是 Word 說明書。這一步更像交付驗證,普通聊天助手往往只能給你一段“可以復制到 Word 里”的正文,而 DuMate 則進入了真實文件生成流程,最后直接拿出一個可以直接預覽的 .docx 文檔。

      用戶看到的不再是“文本建議”,而是一個已經生成出來、可以繼續流轉和保存的文件。這其中的差距,遠比聽上去的大。


      到這一步,交付物已經展現出了不俗的落地價值。everything-claude-code 本身就是極具分享價值的實踐經驗,在此基礎上形成的技術說明書,更是把這份“大牛指南”掰開揉碎了喂給用戶。架構設計和核心組件介紹都是最基本的,這份 35 頁的文檔里,一半以上都是可以直接指導 Agent 實踐的部署教程和最佳實踐案例。就連高頻出現的問題,都整理成了一份故障排除指南。


      ?PPT + 網站:內容形態切換

      PPT 的呈現效果也不錯。事實上這個環節的難點從來不在于把文檔壓縮到幾個畫面上,而是要讓內容從書面敘述切換到視覺表達。DuMate 在這一環節繼續沿用同一套事實底稿,沒有重新發明一套邏輯,項目說明就此轉化為了更適合介紹和匯報的結構。


      最后一環是展示型網站。這里考驗的就不再是文檔生成能力,而是信息架構遷移:項目介紹、核心能力、安裝使用、FAQ、參考資料等模塊,需要被重新組織成網頁表達。DuMate 最終生成了可本地預覽的靜態網站目錄。這意味著同一套事實底稿,已經不只是能被"寫成文檔",而是能被“做成網站”。


      把這四項交付串起來看,DuMate 這次最有價值的表現,并不是某一個單項上做得比別人更漂亮,而是它在研究—整理—文件生成—展示化輸出這條鏈路上可靠地跑完了全程。對于辦公 Agent 來說,在多個任務步驟之間能順滑地銜接,恰恰是落地最關鍵的門檻。


      03


      桌面級 AI 辦公工具的PMF分水嶺

      從“單次生成”到“任務閉環”,桌面級 AI 辦公工具正在經歷一場不容拒絕的范式轉移。

      回看過去一年的 AI 辦公賽道,大多數產品的邏輯依然是“提問-生成-復制”的三步循環。用戶在對話框里輸入需求,AI 返回一段文字或一張圖表,用戶再手動把它搬到 Word、PPT 或郵件里。但復制這個動作,恰恰是攔住辦公 Agent 落地的最后一道門檻,它讓 AI 只能扮演內容供應商的角色,而不是真正接手、執行這套工作流。

      這類產品無法嵌入日常辦公場景,也不能被稱為辦公助手。DuMate 這次展示的方向,就是辦公 Agent 從“內容提供商”到“辦公搭子”的轉向,這也是辦公 Agent 賽道此后真正的技術分水嶺。

      一位長期關注 AI 辦公賽道的投資人向我們透露,2025 年到 2026 年上半年,主流 AI 辦公產品其實都在做同一件事,那就是把對話交互做得更流暢、把模型幻覺率壓得更低、把生成速度壓到秒級。但這些指標的提升,本質上還是在優化“單次生成體驗”。而真正的戰場,已經在向“任務閉環能力”轉移。讓 AI 在真實工作流里跑完全程,只是未來留在牌桌上的入場券。

      這是商業閉環邏輯之下的必然選擇,訂閱制的 AI 辦公產品最怕的不是用戶流失,而是“用不起來”。即使用戶付了月費,但如果只拿來寫周報,ROI 算不過來,最后還是會停掉續費,這樣的產品是沒有PMF可言的。

      換言之,而當 AI 能夠真正替代部分重復性辦公勞動時,用戶的付費意愿和續費動力才會真正被喚起,這個市場才真的有可能出現。

      從被動的“生成-反饋”循環,進化到主動的“感知-規劃-執行-交付”,百度在這條路上的選擇很有意思。DuMate沒有去卷對話體驗或者試圖用模型參數解決一切,而是把賭注押在了“執行層”,也就是讓 AI 看見屏幕、操作軟件、串聯文件,把結果直接交付成可留存、可復用的形態。

      當然,這條路并不好走。它要求 AI 系統對桌面環境有更深的感知能力,對任務有更長的記憶和規劃能力,對交付形態有更靈活的支持能力。任何一個環節出現短板,閉環都會斷裂。這或許也是為什么,大多數 AI 辦公產品仍然選擇停在“生成”這一層。“閉環”級別的穩定性,確實已經構成了技術門檻和護城河。在我們看來,這種能力很有可能是桌面級 AI 辦公工具達成 PMF 的 分水嶺。

      DuMate 這次的壓力測試,固然也有不足。PPT 的設計、網站的交互仍有優化空間,但它已經無法用單純的生成質量進行評價,而是在任務完成度這個更靠近真實工作場景的維度上被審視。從幫你做得更快,到替你做得更多,這或許就是 AI 辦公賽道真正走向成熟的標志。

      雷峰網文章

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      為什么領導都喜歡上班?網友曝光領導抽屜都是性用品:絲襪、套套

      為什么領導都喜歡上班?網友曝光領導抽屜都是性用品:絲襪、套套

      黯泉
      2026-06-01 15:33:05
      能否止住下滑頹勢?鄭欽文下周迎草地賽季首秀,195積分需要捍衛

      能否止住下滑頹勢?鄭欽文下周迎草地賽季首秀,195積分需要捍衛

      全景體育V
      2026-06-01 19:19:13
      在國安局退休后,發現鄰居每天準時曬被子,被子顏色是在傳遞機密

      在國安局退休后,發現鄰居每天準時曬被子,被子顏色是在傳遞機密

      千秋文化
      2026-05-28 19:38:07
      江西“氣功大師”王林:落網之后,情婦為了救他,竟包養辦案民警

      江西“氣功大師”王林:落網之后,情婦為了救他,竟包養辦案民警

      做一個合格的吃瓜群眾
      2026-06-01 19:21:35
      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      夜深愛雜談
      2026-06-01 19:22:01
      廣州白云機場一航班落地滑行58分鐘?航旅縱橫顯示情況屬實,機場客服稱將調查

      廣州白云機場一航班落地滑行58分鐘?航旅縱橫顯示情況屬實,機場客服稱將調查

      上游新聞
      2026-06-01 18:27:16
      6月1日發布!華為9款新機官宣:10300mAh+20GB+1TB!

      6月1日發布!華為9款新機官宣:10300mAh+20GB+1TB!

      科技堡壘
      2026-06-01 09:25:33
      同學聚會,發現一個扎心現象,年過40歲的女同學,1/3沒工作,1/3做著低薪沒前途的工作...

      同學聚會,發現一個扎心現象,年過40歲的女同學,1/3沒工作,1/3做著低薪沒前途的工作...

      背包旅行
      2026-06-01 17:39:34
      索菲亞教堂棚頂被掀飛?附近居民稱“一切正常,有很多游客”,當地回應:暫未接到報告

      索菲亞教堂棚頂被掀飛?附近居民稱“一切正常,有很多游客”,當地回應:暫未接到報告

      瀟湘晨報
      2026-06-01 12:57:26
      上海政法學院再通報女廁發現攝像頭:決定開除涉事學生學籍

      上海政法學院再通報女廁發現攝像頭:決定開除涉事學生學籍

      界面新聞
      2026-06-01 15:05:36
      7月1日起!投資美股不報備,就要沒收違法所得...

      7月1日起!投資美股不報備,就要沒收違法所得...

      瑪麗姬絲
      2026-06-01 15:29:35
      黃仁勛聯手宇樹打造1.8米參考人形機器人:英偉達提供“大腦”,宇樹造“身體”

      黃仁勛聯手宇樹打造1.8米參考人形機器人:英偉達提供“大腦”,宇樹造“身體”

      紅星新聞
      2026-06-01 16:30:28
      燃氣灶致癌,再添實錘!斯坦福大學:即使關著爐子,也能釋放一級致癌物,患癌風險飆升;僅烹飪1小時,NO?就超標,每年致1.9萬人死亡

      燃氣灶致癌,再添實錘!斯坦福大學:即使關著爐子,也能釋放一級致癌物,患癌風險飆升;僅烹飪1小時,NO?就超標,每年致1.9萬人死亡

      梅斯醫學
      2026-05-31 07:55:29
      1100萬清洗!前巴薩10號離隊:巔峰身價8000萬 梅西接班人

      1100萬清洗!前巴薩10號離隊:巔峰身價8000萬 梅西接班人

      葉青足球世界
      2026-06-01 20:06:16
      寶媽稱網購童鞋收到空鞋盒,申請退款被拒后再買同款根據重量差異舉證,獲平臺支持退款

      寶媽稱網購童鞋收到空鞋盒,申請退款被拒后再買同款根據重量差異舉證,獲平臺支持退款

      瀟湘晨報
      2026-06-01 12:57:26
      基輔議會大廳內,298張贊成票落下,他拿到了歐盟900億歐元的貸款

      基輔議會大廳內,298張贊成票落下,他拿到了歐盟900億歐元的貸款

      空想之喵
      2026-06-01 03:39:32
      兩院院士、著名飛機空氣動力學家顧誦芬逝世,享年96歲

      兩院院士、著名飛機空氣動力學家顧誦芬逝世,享年96歲

      極目新聞
      2026-06-01 15:38:09
      華為“韜定律”又讓國內的贏學家們自嗨起來

      華為“韜定律”又讓國內的贏學家們自嗨起來

      廖保平
      2026-06-01 12:30:02
      世界首富押注的火箭發動機:折騰了60年,終于變成了流水線產品

      世界首富押注的火箭發動機:折騰了60年,終于變成了流水線產品

      平流層散步者
      2026-05-27 08:04:47
      浙江國企“塌方”  高管批量投案

      浙江國企“塌方” 高管批量投案

      經濟那道理
      2026-06-01 15:55:26
      2026-06-01 21:40:49
      雷峰網 incentive-icons
      雷峰網
      關注智能與未來!
      69567文章數 656138關注度
      往期回顧 全部

      科技要聞

      黃仁勛演講實錄|40年來PC首次重設計!

      頭條要聞

      媒體:鄭麗文"兩手空空"訪美 被指有望見到特朗普

      頭條要聞

      媒體:鄭麗文"兩手空空"訪美 被指有望見到特朗普

      體育要聞

      杰威:如果我沒受傷,我們能擊敗馬刺

      娛樂要聞

      奚夢瑤婚禮現場圖!一雙兒女當花童

      財經要聞

      宇樹過會,杭州贏麻了

      汽車要聞

      奇瑞集團5月銷量24.8萬輛 同比增長20.5% 出口18.2萬輛再創新高

      態度原創

      游戲
      藝術
      健康
      數碼
      公開課

      《巫師4》開發加速 團隊超500人 “舊時曲”DLC是鋪墊

      藝術要聞

      吳鎮寫竹,清清爽爽

      干細胞臨床研究向患者收費?別踩坑

      數碼要聞

      我國玻璃硬盤實現量產 單盤最大容量360TB

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日日躁夜夜躁狠狠躁| 成人h动漫精品一区二区| 蜜臀AV在线播放一区二区三区| 国产成人综合欧美精品久久| 秋霞91大神| 97碰碰碰人妻视频无码| a级免费| 国产成人久久精品流白浆| 亚洲无码色| 亚洲无码综合网| 国产三级AV在在线观看| 亚洲欧美不卡高清在线| 在线国产精品中文字幕| 老司机性色福利精品视频| 日本道中文字幕久久一区| 国产午夜精品久久一二区| 成人亚洲A片V一区二区三区蜜月| 午夜无码AV| 久久国产中文娱乐网| 男女爽爽无遮挡午夜视频| 久久熟妇| 凌云县| 2020亚洲欧美日韩在线观看 | 国产精品视频不卡一区二区| 亚洲精品亚洲人成在线观看下载| 97cao超碰| 国产精品久久久久久久久鸭| 国产成人一区二区三区免费| 日韩乱码av| 无码人妻一区二区三区AV| 国产亚洲精久久久久久无码77777 久青草久青草视频在线观看 | 免费看成人毛片无码视频| 国产日韩欧美一区二区东京热| 精品国产91久久久久久亚瑟| 日韩 一区二区在线观看| 国产精品亚洲欧美一级久久精品| 波多野结衣中文一区二区三区| 特黄特色大片免费视频大全| 精品国产片一区二区三区| 国产精品国产三级国产an| 日韩AV综合|