黃仁勳與Dell Technologies World聯合宣示:Vera Rubin NVL72將推論成本壓至十分之一,企業AI進入代理規模化部署時代

2026-05-18 · 來源:NVIDIA AI Blog
重點摘要

黃仁勳稱AI推論需求「拋物線式暴增」,NVIDIA Vera Rubin NVL72每token成本降至十分之一,算力供給格局將再重塑。

Dell Technologies World年度主題演講於本週一登場,Dell創辦人兼執行長Michael Dell與NVIDIA創辦人兼執行長黃仁勳(Jensen Huang)聯合上台,宣告企業AI已從概念驗證全面進入代理式AI(Agentic AI)與推論的規模化部署階段。黃仁勳以「拋物線式暴增,徹底的拋物線」形容當前需求曲線,並點出生產力壓縮的本質:過去耗費數月的工作現在以週計算,以週計的現在以天計,以天計的現在以小時計——背後對應的是運算需求的幾何級數放大。

此次最具份量的硬體公告是Dell PowerEdge XE9812,搭載NVIDIA Vera Rubin NVL72,每個token的推論成本較前一代Blackwell架構降低最高達10倍。這一數字直接回應了市場長期以來的核心痛點:大規模代理AI部署的邊際成本壓力。同場發布的PowerEdge XE9880L、XE9885L、XE9882L系列則是首批基於NVIDIA HGX Rubin NVL8的Dell系統,單機架最多支援144顆GPU,效能是HGX B200的5.5倍,並採100%直接液冷設計。

在CPU端,NVIDIA Vera CPU正式進入企業AI Factory,Dell推出PowerEdge M9822與R9822對應機型。Vera搭載1.2 TB/s記憶體頻寬,黃仁勳強調其擁有全球最高單執行緒效能,代理工作流程(agentic workload)的完成速度較x86處理器快50%,資料庫查詢吞吐量提升3倍。這對於代理AI需要持續存取企業資料庫的應用場景具有直接效益。

Dell自身調查數據揭示了一個關鍵趨勢:67%的AI工作負載目前在雲端以外運行,88%的受訪企業至少有一項AI工作負載部署於本地端。這組數字說明「回歸本地」並非口號,而是已在發生的基礎設施遷移。此次公告的安全架構以NVIDIA Confidential Computing為核心,結合Fortanix、Google、Red Hat等合作夥伴,讓企業能在不暴露模型IP或敏感資料的前提下,於防火牆內部署前沿模型。Google Distributed Cloud搭載Gemini 3.0已在Dell PowerEdge XE9780上提供預覽,SpaceXAI亦宣布將透過相同架構把最新模型引入本地部署。

生態系整合層面,OpenAI Codex將與Dell AI Data Platform對接,讓代理工具能存取企業內部程式庫、文件與業務系統;Palantir主權AI OS參考架構也正式移植至Dell基礎設施。客戶側的公開背書涵蓋製藥(Lilly)、半導體與消費電子(Samsung)、工業自動化(Honeywell)及算法交易(Hudson River Trading),橫跨多個受監管產業。

對亞太市場決策者而言,這場發布會有幾個不顯而易見的意涵值得注意。其一,token成本降至十分之一意味著過去因成本而擱置的大規模代理AI部署,其ROI門檻已實質下移,採購決策的時間視窗可能比預期更短。其二,Dell調查所揭示的「本地化浪潮」在亞洲尤其顯著——資料主權、監管合規與資安考量驅動企業將工作負載拉回本地,而此次發布的全棧整合方案(Dell PowerRack將運算、網路、儲存工程化為一體)正在降低本地部署的整合複雜度。其三,黃仁勳在演講結尾預告NVIDIA將在6月1至4日台北COMPUTEX的GTC Taipei帶來更多宣告,意味著此次Dell Technologies World僅是本輪硬體周期產業情報的前哨,亞太採購與合作窗口的實質資訊將在數週內陸續落地。

原文出處
原文標題 NVIDIA CEO Jensen Huang at Dell Technologies World: “Demand Is Going Parabolic, Utterly Parabolic”
媒體來源 NVIDIA AI Blog
發布日期 2026-05-18
閱讀原文 ↗

訂閱品富智圖 AI 新聞

每日 AI 產業要聞彙整,一封信直送信箱。