Nvidia 聯手 EPRI 在變電站旁建微型資料中心，以「分散式推論」解鎖電網閒置容量

2026-05-19 · 來源：IEEE Spectrum AI

重點摘要

百度文心5.1發布，搜索能力登頂國內榜，預訓練成本僅業界6%，顯示中國模型效率競爭力提升。

AI 資料中心對電力的龐大需求正在重塑基礎設施邏輯。Nvidia 與非營利研究機構 EPRI 宣布一項名為「分散式推論」（distributed inference）的試驗計畫，預計於 2026 年底前動工，在美國五家電力公司轄下的變電站旁建造約 25 座微型資料中心，每座規模介於 5 至 20 百萬瓦（MW），並以協調調度方式將其作為一個邏輯上的大型叢集運作。合作夥伴還包括資料中心建商 InfraPartners 與房地產服務商 Prologis。

這項計畫的核心邏輯來自一個常被忽視的電網現實：美國 5.5 萬座變電站中，每座平均有約 5 MW 的閒置容量，但這個規模長期以來太小，不足以吸引傳統資料中心業者投資。然而若將數十座微型節點整合調度，整體可用電力最高可翻倍。更重要的是，根據杜克大學 Nicholas Institute 2025 年的報告，美國電網平均僅使用約 53% 的發電容量；若大型負載如資料中心能在尖峰時段削減僅 0.25% 的用電，電網就可額外釋出約 76 GW 的可用容量，相當於尖峰需求的 10%。Nvidia 與 EPRI 估計，實際需要將運算工作移轉至不同變電站的頻率，僅約 0.1%。

這個方案之所以可行，關鍵在於推論（inference）工作負載的特性。與需要數萬顆 GPU 緊密互連、長達數月的模型訓練不同，推論只需處理單一用戶的請求，不涉及大規模反向傳播，因此可以分散部署於規模較小、彼此獨立的節點。推論工作負載可以「動態路由」——哪裡有電，算力就往哪裡走——這使其成為極少數能真正配合電力可用性即時調配的 AI 運算類型。此外，變電站本身通常已具備光纖高速網路連線，進一步降低了建置門檻。

對商業決策者而言，這件事的深層意義不只是一個試驗計畫，而是指向 AI 基礎設施的結構性分叉點。目前業界主流仍是競相建造 5 GW 級的巨型資料中心，但 EPRI 的 Ben Sooter 明確點出「第二波算力浪潮」正在醞釀——由大量處理推論需求的小型節點構成，且預計在 2027 年需求將顯著放量。這代表資料中心選址邏輯將從「靠近大型電廠」轉向「靠近電網閒置容量」，土地、電力與建設週期的競爭優勢將重新洗牌。對亞太市場而言，此一模式是否可複製，取決於各地電網架構與變電站閒置容量分布，但其背後的分散式推論思路，已為下一代 AI 基礎設施部署提供了值得關注的參照座標。

原文出處

原文標題 AI日报头条｜大语言模型精选人工智能资讯- Podcast - Apple Podcasts

媒體來源 IEEE Spectrum AI

發布日期 2026-05-19

閱讀原文 ↗

Nvidia 聯手 EPRI 在變電站旁建微型資料中心，以「分散式推論」解鎖電網閒置容量

訂閱品富智圖 AI 新聞