Moonshot AI 發布 Kimi K2.7-Code 聲稱推理效率提升三成,但業界對其基準數據真實性存疑

2026-06-13 · 來源:VentureBeat AI
重點摘要

Moonshot AI開源Kimi K2.7-Code聲稱推理效率提升,但業界對基準真實性存疑,值得追蹤中國開源模型動態

Moonshot AI 本週發布 Kimi K2.7-Code,這是其 K2 系列程式碼模型的開源更新版本。官方宣稱新模型在推理過程中減少了 30% 的「thinking token」用量,並在多項基準測試中取得雙位數效能提升,對於運行代理工作流程(agentic workflows)的企業而言,此舉具有直接降低推理成本的意義。

K2.7-Code 延續前代 K2.6 的兆參數混合專家(MoE)架構,支援 OpenAI 相容 API,可直接替換部署於現有生產環境。模型以 Modified MIT 授權釋出,權重上架 HuggingFace,並支援 vLLM 與 SGLang 推理框架。與 K2.6 相比,K2.7-Code 的主要技術差異在於直接生成底層程式碼實作,而非透過既有函式庫包裝,Moonshot AI 表示此設計提升了模型在 Rust、Go、Python 等語言以及前端、DevOps、效能優化等不同任務類型上的泛化能力。

然而,部分業界從業者已公開質疑官方基準數據的可信度,認為實際表現與宣稱數字存在落差。鑒於 K2.6 曾以開發者實際 API 路由決策為依據登上 OpenRouter 週排行榜榜首,K2.7-Code 是否能通過獨立驗證,仍有待觀察。

原文出處
原文標題 Kimi K2.7-Code cuts thinking tokens 30% — but practitioners say the benchmarks don't check out
媒體來源 VentureBeat AI
發布日期 2026-06-12
閱讀原文 ↗

訂閱品富智圖 AI 新聞

每日 AI 產業要聞彙整,一封信直送信箱。