AI代理部署時,常面臨兩大致命盲區:缺乏實時可觀測性與失控的模型開支。hermes-telemetry應運而生——它專為Hermes Agent打造,通過純鉤子層捕獲每次調用的真實Token消耗和費用,零延遲、不干擾模型行為,并將數據存入本地SQLite WAL數據庫,性能高效且無外部依賴。
成本管控上,插件提供靈活的預算設定(日/月、全局/作用域),并實現了自動熔斷機制。實測中,設置0.001美元日預算后,定時任務在花費達0.18美元時被精確暫停;將限額提升至2.00美元,任務立即恢復。從OpenRouter、OpenAI到Anthropic,插件均直接抓取服務商返回的實際Token數(OpenRouter實測估算誤差0%),并通過自定義pricing.yaml覆蓋費率,確保計費精準,告別估算猜疑。
![]()
核心技術鏈路完整閉環:on_session_start → pre_api_request → post_api_request(捕獲用量) → pre_llm_call(預算檢查) → pre_tool_call(工具門控) → SQLite存儲。內置94項全面測試,覆蓋所有邊界場景和執法邏輯,為生產級AI系統提供必備的成本治理與可觀測性基礎設施。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.