黃仁勳與Dell Technologies World聯合宣示：Vera Rubin NVL72將推論成本壓至十分之一，企業AI進入代理規模化部署時代

2026-05-18 · 來源：NVIDIA AI Blog

重點摘要

黃仁勳稱AI推論需求「拋物線式暴增」，NVIDIA Vera Rubin NVL72每token成本降至十分之一，算力供給格局將再重塑。

Dell Technologies World年度主題演講於本週一登場，Dell創辦人兼執行長Michael Dell與NVIDIA創辦人兼執行長黃仁勳（Jensen Huang）聯合上台，宣告企業AI已從概念驗證全面進入代理式AI（Agentic AI）與推論的規模化部署階段。黃仁勳以「拋物線式暴增，徹底的拋物線」形容當前需求曲線，並點出生產力壓縮的本質：過去耗費數月的工作現在以週計算，以週計的現在以天計，以天計的現在以小時計——背後對應的是運算需求的幾何級數放大。

此次最具份量的硬體公告是Dell PowerEdge XE9812，搭載NVIDIA Vera Rubin NVL72，每個token的推論成本較前一代Blackwell架構降低最高達10倍。這一數字直接回應了市場長期以來的核心痛點：大規模代理AI部署的邊際成本壓力。同場發布的PowerEdge XE9880L、XE9885L、XE9882L系列則是首批基於NVIDIA HGX Rubin NVL8的Dell系統，單機架最多支援144顆GPU，效能是HGX B200的5.5倍，並採100%直接液冷設計。

在CPU端，NVIDIA Vera CPU正式進入企業AI Factory，Dell推出PowerEdge M9822與R9822對應機型。Vera搭載1.2 TB/s記憶體頻寬，黃仁勳強調其擁有全球最高單執行緒效能，代理工作流程（agentic workload）的完成速度較x86處理器快50%，資料庫查詢吞吐量提升3倍。這對於代理AI需要持續存取企業資料庫的應用場景具有直接效益。

Dell自身調查數據揭示了一個關鍵趨勢：67%的AI工作負載目前在雲端以外運行，88%的受訪企業至少有一項AI工作負載部署於本地端。這組數字說明「回歸本地」並非口號，而是已在發生的基礎設施遷移。此次公告的安全架構以NVIDIA Confidential Computing為核心，結合Fortanix、Google、Red Hat等合作夥伴，讓企業能在不暴露模型IP或敏感資料的前提下，於防火牆內部署前沿模型。Google Distributed Cloud搭載Gemini 3.0已在Dell PowerEdge XE9780上提供預覽，SpaceXAI亦宣布將透過相同架構把最新模型引入本地部署。

生態系整合層面，OpenAI Codex將與Dell AI Data Platform對接，讓代理工具能存取企業內部程式庫、文件與業務系統；Palantir主權AI OS參考架構也正式移植至Dell基礎設施。客戶側的公開背書涵蓋製藥（Lilly）、半導體與消費電子（Samsung）、工業自動化（Honeywell）及算法交易（Hudson River Trading），橫跨多個受監管產業。

對亞太市場決策者而言，這場發布會有幾個不顯而易見的意涵值得注意。其一，token成本降至十分之一意味著過去因成本而擱置的大規模代理AI部署，其ROI門檻已實質下移，採購決策的時間視窗可能比預期更短。其二，Dell調查所揭示的「本地化浪潮」在亞洲尤其顯著——資料主權、監管合規與資安考量驅動企業將工作負載拉回本地，而此次發布的全棧整合方案（Dell PowerRack將運算、網路、儲存工程化為一體）正在降低本地部署的整合複雜度。其三，黃仁勳在演講結尾預告NVIDIA將在6月1至4日台北COMPUTEX的GTC Taipei帶來更多宣告，意味著此次Dell Technologies World僅是本輪硬體周期產業情報的前哨，亞太採購與合作窗口的實質資訊將在數週內陸續落地。

原文出處

原文標題 NVIDIA CEO Jensen Huang at Dell Technologies World: “Demand Is Going Parabolic, Utterly Parabolic”

媒體來源 NVIDIA AI Blog

發布日期 2026-05-18

閱讀原文 ↗

黃仁勳與Dell Technologies World聯合宣示：Vera Rubin NVL72將推論成本壓至十分之一，企業AI進入代理規模化部署時代

訂閱品富智圖 AI 新聞