Nvidia 聯手 EPRI 在變電站旁建微型資料中心,以「分散式推論」解鎖電網閒置容量
百度文心5.1發布,搜索能力登頂國內榜,預訓練成本僅業界6%,顯示中國模型效率競爭力提升。
AI 資料中心對電力的龐大需求正在重塑基礎設施邏輯。Nvidia 與非營利研究機構 EPRI 宣布一項名為「分散式推論」(distributed inference)的試驗計畫,預計於 2026 年底前動工,在美國五家電力公司轄下的變電站旁建造約 25 座微型資料中心,每座規模介於 5 至 20 百萬瓦(MW),並以協調調度方式將其作為一個邏輯上的大型叢集運作。合作夥伴還包括資料中心建商 InfraPartners 與房地產服務商 Prologis。
這項計畫的核心邏輯來自一個常被忽視的電網現實:美國 5.5 萬座變電站中,每座平均有約 5 MW 的閒置容量,但這個規模長期以來太小,不足以吸引傳統資料中心業者投資。然而若將數十座微型節點整合調度,整體可用電力最高可翻倍。更重要的是,根據杜克大學 Nicholas Institute 2025 年的報告,美國電網平均僅使用約 53% 的發電容量;若大型負載如資料中心能在尖峰時段削減僅 0.25% 的用電,電網就可額外釋出約 76 GW 的可用容量,相當於尖峰需求的 10%。Nvidia 與 EPRI 估計,實際需要將運算工作移轉至不同變電站的頻率,僅約 0.1%。
這個方案之所以可行,關鍵在於推論(inference)工作負載的特性。與需要數萬顆 GPU 緊密互連、長達數月的模型訓練不同,推論只需處理單一用戶的請求,不涉及大規模反向傳播,因此可以分散部署於規模較小、彼此獨立的節點。推論工作負載可以「動態路由」——哪裡有電,算力就往哪裡走——這使其成為極少數能真正配合電力可用性即時調配的 AI 運算類型。此外,變電站本身通常已具備光纖高速網路連線,進一步降低了建置門檻。
對商業決策者而言,這件事的深層意義不只是一個試驗計畫,而是指向 AI 基礎設施的結構性分叉點。目前業界主流仍是競相建造 5 GW 級的巨型資料中心,但 EPRI 的 Ben Sooter 明確點出「第二波算力浪潮」正在醞釀——由大量處理推論需求的小型節點構成,且預計在 2027 年需求將顯著放量。這代表資料中心選址邏輯將從「靠近大型電廠」轉向「靠近電網閒置容量」,土地、電力與建設週期的競爭優勢將重新洗牌。對亞太市場而言,此一模式是否可複製,取決於各地電網架構與變電站閒置容量分布,但其背後的分散式推論思路,已為下一代 AI 基礎設施部署提供了值得關注的參照座標。
訂閱品富智圖 AI 新聞
每日 AI 產業要聞彙整,一封信直送信箱。
