分類:模型發布

品富智圖 AI 新聞 — 模型發布 彙整

DeepSeek V4發布:1.6T參數、遷移昇騰,但開源紅利與商業化矛盾正在撕裂中國AI行業

DeepSeek V4正式發布,主要規格落地:最大參數量1.6T、上下文窗口1M,採用MoE架構與稀疏注意力機制DSA以降低計算與顯存需求,並針對Agent能力進行優化。訓練框架已從英偉達遷移至華為昇騰。這款讓外界等待近三個月的模型,最終仍是純語言模型,多模態生成因算力與資金限制暫緩。

閱讀全文 →

微軟 Build 大會前瞻:首款自研推理模型、Copilot 超級應用與 Windows 開發者模式將同步亮相

微軟本週在舊金山舉行 Build 開發者大會,時間點頗為敏感——開發者對 Windows 與 GitHub 的信任度據稱處於歷史低點,而微軟正將整個業務體系向 AI 重組。這是一場爭取開發者回心轉意的戰役,不只是產品發表會。 從可信消息來源獲得的情報看,這次 Build 有幾條主線值得重點關注。

閱讀全文 →