Hermes Agent 三個月突破 14 萬 GitHub Stars,NVIDIA 硬體加持本地 AI 代理新基準

2026-05-21 · 來源:NVIDIA AI Blog
重點摘要

DeepSeek V4首次深度適配華為昇騰晶片,標誌中國AI去CUDA化關鍵突破,萬億參數+百萬上下文

Nous Research 開發的開源代理框架 Hermes Agent 在不到三個月內累積逾 14 萬個 GitHub Stars,並根據 OpenRouter 數據成為目前全球使用量最高的 AI 代理。NVIDIA 官方部落格以此為切入點,推介 RTX PC、RTX PRO 工作站與 DGX Spark 作為本地部署 Hermes 的理想硬體平台,並搭配阿里巴巴最新發布的 Qwen 3.6 系列模型,共同勾勒出「邊緣端自主代理」的新生態雛形。

Hermes 的核心技術差異在於四個設計取向:自我演進技能(agent 會將每次任務學習儲存為可複用技能)、隔離式子代理(短生命週期、聚焦上下文,適合本地模型的小視窗限制)、可靠性優先(Nous Research 人工審查所有技能與工具,使 30B 級模型即可穩定運行)、以及主動編排層設計(區別於單純 API 封裝,支援持續在設備端運行而非逐任務執行)。這些特性合力解決業界長期存在的代理穩定性問題,使開發者在相同底層模型下獲得明顯更強的執行結果。

Qwen 3.6 的規格數字值得特別注意。Qwen 3.6 35B 僅需約 20GB 記憶體,卻能超越需要 70GB 以上記憶體的 120B 參數模型;Qwen 3.6 27B(dense 架構)在精度上媲美 Qwen 3.5 397B,但體積僅為後者的十六分之一。換言之,Qwen 3.6 系列在「效能對記憶體佔用」的比值上出現了世代性躍升,直接拉低了本地部署高品質代理的硬體門檻。NVIDIA DGX Spark 具備 128GB 統一記憶體與 1 PFLOP AI 算力,可全天持續運行 120B MoE 模型,而 Qwen 3.6 35B 的推出更讓相同硬體有餘裕同時跑多個並行工作負載。

從產業格局角度解讀,這篇文章的深層意義並不只是硬體促銷。第一,它標誌著「邊緣端持續運行代理」正在從概念走向可落地配置,Hermes 的 140k Stars 速度顯示開發者社群對本地代理的需求已超越早期探索者範疇。第二,Qwen 3.6 的效率突破讓中高階消費級或工作站硬體進入代理部署的可行區間,這對亞太市場的意義尤其顯著——企業不必等待雲端批准或支付高額 API 費用,即可在本地完成敏感業務流程的自動化。第三,NVIDIA 藉由整合開源框架(Hermes)、開源模型(Qwen 3.6)與自有硬體(RTX、DGX Spark),正在構建一條從模型到執行層的完整本地 AI 堆疊,試圖複製其在資料中心的生態護城河策略至邊緣端。

對亞太商業決策者而言,最值得關注的行動訊號是:當 35B 模型在 20GB 記憶體下即可超越前代 120B 模型,意味著今年底前採購的中高階工作站,已具備部署生產級自主代理的能力。企業若正在評估是否將部分 AI 工作負載從公有雲遷回本地(出於數據合規、成本或延遲考量),Hermes+Qwen 3.6+RTX 的組合提供了一個目前市場上少見的、具備開源可審計性的完整方案選項。

原文出處
原文標題 【AI+大模型】DeepSeek V4據報4月下旬發布 阿里騰訊等科企已訂芯片做足準備
媒體來源 NVIDIA AI Blog
發布日期 2026-05-21
閱讀原文 ↗

訂閱品富智圖 AI 新聞

每日 AI 產業要聞彙整,一封信直送信箱。