輝達指出,Rubin GPU 已回到實驗室進行驗證,為台積電代工的首批樣品。單顆 Rubin 採 2 顆 reticle 尺寸 GPU 核心,並配有 8 顆 288GB HBM4,將來到總計 100 PFLOPS 的算力。Vera CPU 採 88 顆客製化 Arm 核心、176 執行緒,兩者以 NVLINK-C2C 1.8TB/s 高頻寬互連,同時可以看到 CPU 兩側搭配 LPCAMM2 或 SODIMM2 記憶體模組插槽。黃仁勳更是大讚這款超級晶片機架系統設計,將不再使用傳統的纜線連接,而是改為插槽,同時完全採用液冷,有助於簡化 AI 伺服器內結構、組裝與升級散熱管理。

時程與定位方面,黃仁勳預計,Vera Rubin NVL144 平台將於 2026 年下半年量產上線,銜接並迭代現行 Blackwell GB300 平台的機櫃級部署。在同一機櫃容量下,Vera Rubin NVL144 可提供雙倍 NVLINK 與 CX9 的通訊能力(最高分別為260 TB/s與28.8 TB/s),相較 GB300 ,可實現FP4 推理與FP8 訓練的算力,同時顯著強化機架內外帶寬與可擴充性。

黃仁勳說明,往下一階段來看,將於 2027 年推出 Rubin Ultra NVL576,CPU 架構不變,GPU 升級為 4 顆 reticle 尺寸核心,並規劃於 2028 年推出下一代 GPU 架構 Feynman 平台,不過 CPU 仍採用 Vera,維持 GPU 改版 2 次、CPU 改版 1 次的迭代節奏。與 Rubin Ultra 同時推出的還有新一代機架系統 Kyber NVL576,同樣延續至 Feynman 平台。

輝達執行長黃仁勳揭露輝達未來AI晶片發展藍圖。翻攝NVIDIA官方YT直播
輝達執行長黃仁勳揭露輝達未來AI晶片發展藍圖。翻攝NVIDIA官方YT直播

黃仁勳也在同場演講提到,亞馬遜、CoreWeave、Google、Meta、微軟與甲骨文等雲端服務(CSP)巨頭正迎來新一輪資本支出擴張期,利用輝達GB200 NVL72平台,生產最高 Token 產生效率、最低 TCO 回應這波AI超級擴張需求,並確保服務在使用高峰期也能維持速度與效能。

黃仁勳分析,AI進入了新的擴展階段,從預訓練、後訓練再到推論,等三階段全部開始運作後,AI模型需要更即時計算,而非單純調度資源,屆時運算需求將以指數型成長,資料中心也從傳統通用架構走向全加速運算。

黃仁勳強調,CSP透過 GB200 取得十倍效能與成本下降,才能讓 AI 應用的正向循環持續轉動,推動更多需求再回到更大規模的算力投資。

火線話題 | 輝達GTC 黃仁勳再衝AI

這篇報導屬於「 輝達GTC 黃仁勳再衝AI 」主題,更多延伸閱讀:

  1. 黃仁勳感謝台灣供應鏈!鴻海飆逾5%創18年新高 這檔股受惠奔漲停
  2. 輝達市值直逼5兆美元大關!黃仁勳身價暴衝晉升「五兆男」
  3. 都是台灣之光!黃仁勳GTC大會開頭影片 竟現全盛時期王建民

點擊閱讀下一則新聞 點擊閱讀下一則新聞
AI需求熱掀搶電潮 台灣電力夠不夠經長龔明鑫這麼說