智源整理2025中國AI大模型年度事件：DeepSeek、豆包、月之暗面等關鍵進展回顧

2026-05-27 · 來源：北京智源

重點摘要

智源社區整理2025年中國AI大模型年度重大事件，涵蓋DeepSeek、通義千問等關鍵進展，具戰略回顧價值。

2025年是中國大模型格局加速重組的一年。北京智源社區梳理了這一年內最具代表性的產業事件，從中可以清晰看出三條主線：成本顛覆、應用稱王、資本退潮後的商業化收斂。

年初最具衝擊力的事件來自深度求索。1月20日，DeepSeek R1以約560萬美元的訓練成本達到比肩OpenAI o1的推理性能，登頂全球應用商店榜首，連帶引發英偉達市值單日蒸發近6000億美元。這個數字的意義不在於震撼，而在於它讓「算力壁壘即護城河」的邏輯出現裂縫。矽谷投資人安德里森稱之為「AI的Sputnik時刻」，這個比喻的核心含義是：技術差距未必來自資源投入的絕對量。9月，DeepSeek R1論文登上《自然》封面，並首次披露訓練成本僅29.4萬美元——這一數字較最初公開的560萬美元更低，顯示外界對其成本結構的理解仍不完整。

應用層面，字節跳動的豆包是2025年最具商業意義的案例。6月發布的豆包1.6，日均Token使用量較前一年增長137倍；根據IDC數據，豆包在中國公有云大模型API市場的份額達到46.4%，遠超阿里云的27%和百度的17%。到12月發布的豆包1.8，日均tokens調用量已超過50萬億，累計實現400億倍增長。豆包的崛起不是技術上的碾壓，而是字節系產品矩陣帶來的場景滲透——這對沒有同等分發能力的獨立大模型公司而言，是一個結構性壓力。

阿里和月之暗面則代表另一種路徑。阿里通義千問Qwen系列在4月一次性開源8款模型，此前QwQ-32B的性能已比肩DeepSeek-R1，Qwen系列在Hugging Face的下載量持續領先，鞏固了其開源生態的主導地位。月之暗面的Kimi K2在7月以萬億參數登頂全球開源榜首，11月的K2 Thinking版本主打「邊思考邊調用工具」的原生Agent能力，支持300輪工具調用。12月完成的5億美元C輪融資超額認購，IDG領投1.5億美元，阿里、騰訊等老股東跟進，投後估值43億美元。創始人楊植麟明確將超越Anthropic列為下一階段目標。

百度在3月發布文心4.5與X1，前者API定價為競品的1%，6月進一步開源10款模型，這是一次明確的戰略轉向。華為則在5月發布盤古Ultra MoE，7180億參數、全程在昇腾平台訓練，試圖以全棧國產化證明脫離英偉達生態的可行性。

年末，MiniMax與智谱相繼通過港交所聆訊，同步衝擊「全球大模型第一股」。兩者走出差異化路線：MiniMax海外收入占比逾70%，智谱本地化部署收入占比達84.8%。上市的意義不只是融資，更在於為這個行業建立公開的估值錨點。大模型公司的商業模式能否支撐其估值，將在二級市場得到驗證。

2025年中國大模型競爭的底層邏輯已從「誰的模型更強」轉移到「誰能把模型變成持續的商業收入」。豆包的市場份額、月之暗面的海外用戶增速、MiniMax的境外收入占比——這些才是判斷下一輪競爭格局的真實變量。技術迭代仍在加速，但技術領先的窗口期越來越短，先發優勢正在讓位於分發能力與商業化執行力。

原文出處

原文標題 2025人工智能大事件回顾丨中国AI大模型篇 - 智源社区

媒體來源北京智源

發布日期 2026-05-27

閱讀原文 ↗

智源整理2025中國AI大模型年度事件：DeepSeek、豆包、月之暗面等關鍵進展回顧

訂閱品富智圖 AI 新聞