Hermes Agent 三個月突破 14 萬 GitHub Stars，NVIDIA 硬體加持本地 AI 代理新基準

2026-05-21 · 來源：NVIDIA AI Blog

重點摘要

DeepSeek V4首次深度適配華為昇騰晶片，標誌中國AI去CUDA化關鍵突破，萬億參數+百萬上下文

Nous Research 開發的開源代理框架 Hermes Agent 在不到三個月內累積逾 14 萬個 GitHub Stars，並根據 OpenRouter 數據成為目前全球使用量最高的 AI 代理。NVIDIA 官方部落格以此為切入點，推介 RTX PC、RTX PRO 工作站與 DGX Spark 作為本地部署 Hermes 的理想硬體平台，並搭配阿里巴巴最新發布的 Qwen 3.6 系列模型，共同勾勒出「邊緣端自主代理」的新生態雛形。

Hermes 的核心技術差異在於四個設計取向：自我演進技能（agent 會將每次任務學習儲存為可複用技能）、隔離式子代理（短生命週期、聚焦上下文，適合本地模型的小視窗限制）、可靠性優先（Nous Research 人工審查所有技能與工具，使 30B 級模型即可穩定運行）、以及主動編排層設計（區別於單純 API 封裝，支援持續在設備端運行而非逐任務執行）。這些特性合力解決業界長期存在的代理穩定性問題，使開發者在相同底層模型下獲得明顯更強的執行結果。

Qwen 3.6 的規格數字值得特別注意。Qwen 3.6 35B 僅需約 20GB 記憶體，卻能超越需要 70GB 以上記憶體的 120B 參數模型；Qwen 3.6 27B（dense 架構）在精度上媲美 Qwen 3.5 397B，但體積僅為後者的十六分之一。換言之，Qwen 3.6 系列在「效能對記憶體佔用」的比值上出現了世代性躍升，直接拉低了本地部署高品質代理的硬體門檻。NVIDIA DGX Spark 具備 128GB 統一記憶體與 1 PFLOP AI 算力，可全天持續運行 120B MoE 模型，而 Qwen 3.6 35B 的推出更讓相同硬體有餘裕同時跑多個並行工作負載。

從產業格局角度解讀，這篇文章的深層意義並不只是硬體促銷。第一，它標誌著「邊緣端持續運行代理」正在從概念走向可落地配置，Hermes 的 140k Stars 速度顯示開發者社群對本地代理的需求已超越早期探索者範疇。第二，Qwen 3.6 的效率突破讓中高階消費級或工作站硬體進入代理部署的可行區間，這對亞太市場的意義尤其顯著——企業不必等待雲端批准或支付高額 API 費用，即可在本地完成敏感業務流程的自動化。第三，NVIDIA 藉由整合開源框架（Hermes）、開源模型（Qwen 3.6）與自有硬體（RTX、DGX Spark），正在構建一條從模型到執行層的完整本地 AI 堆疊，試圖複製其在資料中心的生態護城河策略至邊緣端。

對亞太商業決策者而言，最值得關注的行動訊號是：當 35B 模型在 20GB 記憶體下即可超越前代 120B 模型，意味著今年底前採購的中高階工作站，已具備部署生產級自主代理的能力。企業若正在評估是否將部分 AI 工作負載從公有雲遷回本地（出於數據合規、成本或延遲考量），Hermes＋Qwen 3.6＋RTX 的組合提供了一個目前市場上少見的、具備開源可審計性的完整方案選項。

原文出處

原文標題【AI+大模型】DeepSeek V4據報4月下旬發布　阿里騰訊等科企已訂芯片做足準備

媒體來源 NVIDIA AI Blog

發布日期 2026-05-21

閱讀原文 ↗

Hermes Agent 三個月突破 14 萬 GitHub Stars，NVIDIA 硬體加持本地 AI 代理新基準

訂閱品富智圖 AI 新聞