智源整理2025中國AI大模型年度事件:DeepSeek、豆包、月之暗面等關鍵進展回顧

2026-05-27 · 來源:北京智源
重點摘要

智源社區整理2025年中國AI大模型年度重大事件,涵蓋DeepSeek、通義千問等關鍵進展,具戰略回顧價值。

2025年是中國大模型格局加速重組的一年。北京智源社區梳理了這一年內最具代表性的產業事件,從中可以清晰看出三條主線:成本顛覆、應用稱王、資本退潮後的商業化收斂。

年初最具衝擊力的事件來自深度求索。1月20日,DeepSeek R1以約560萬美元的訓練成本達到比肩OpenAI o1的推理性能,登頂全球應用商店榜首,連帶引發英偉達市值單日蒸發近6000億美元。這個數字的意義不在於震撼,而在於它讓「算力壁壘即護城河」的邏輯出現裂縫。矽谷投資人安德里森稱之為「AI的Sputnik時刻」,這個比喻的核心含義是:技術差距未必來自資源投入的絕對量。9月,DeepSeek R1論文登上《自然》封面,並首次披露訓練成本僅29.4萬美元——這一數字較最初公開的560萬美元更低,顯示外界對其成本結構的理解仍不完整。

應用層面,字節跳動的豆包是2025年最具商業意義的案例。6月發布的豆包1.6,日均Token使用量較前一年增長137倍;根據IDC數據,豆包在中國公有云大模型API市場的份額達到46.4%,遠超阿里云的27%和百度的17%。到12月發布的豆包1.8,日均tokens調用量已超過50萬億,累計實現400億倍增長。豆包的崛起不是技術上的碾壓,而是字節系產品矩陣帶來的場景滲透——這對沒有同等分發能力的獨立大模型公司而言,是一個結構性壓力。

阿里和月之暗面則代表另一種路徑。阿里通義千問Qwen系列在4月一次性開源8款模型,此前QwQ-32B的性能已比肩DeepSeek-R1,Qwen系列在Hugging Face的下載量持續領先,鞏固了其開源生態的主導地位。月之暗面的Kimi K2在7月以萬億參數登頂全球開源榜首,11月的K2 Thinking版本主打「邊思考邊調用工具」的原生Agent能力,支持300輪工具調用。12月完成的5億美元C輪融資超額認購,IDG領投1.5億美元,阿里、騰訊等老股東跟進,投後估值43億美元。創始人楊植麟明確將超越Anthropic列為下一階段目標。

百度在3月發布文心4.5與X1,前者API定價為競品的1%,6月進一步開源10款模型,這是一次明確的戰略轉向。華為則在5月發布盤古Ultra MoE,7180億參數、全程在昇腾平台訓練,試圖以全棧國產化證明脫離英偉達生態的可行性。

年末,MiniMax與智谱相繼通過港交所聆訊,同步衝擊「全球大模型第一股」。兩者走出差異化路線:MiniMax海外收入占比逾70%,智谱本地化部署收入占比達84.8%。上市的意義不只是融資,更在於為這個行業建立公開的估值錨點。大模型公司的商業模式能否支撐其估值,將在二級市場得到驗證。

2025年中國大模型競爭的底層邏輯已從「誰的模型更強」轉移到「誰能把模型變成持續的商業收入」。豆包的市場份額、月之暗面的海外用戶增速、MiniMax的境外收入占比——這些才是判斷下一輪競爭格局的真實變量。技術迭代仍在加速,但技術領先的窗口期越來越短,先發優勢正在讓位於分發能力與商業化執行力。

原文出處
原文標題 2025人工智能大事件回顾丨中国AI大模型篇 - 智源社区
媒體來源 北京智源
發布日期 2026-05-27
閱讀原文 ↗

訂閱品富智圖 AI 新聞

每日 AI 產業要聞彙整,一封信直送信箱。