NVIDIA網路介面卡與系統單晶片首席架構師Burstein在演講中指出,AI推理需要具備機架等級的效能,才能同時滿足速度與規模需求。他介紹了NVIDIA Connect X-8SuperNIC技術,如何透過高速、低延遲的多GPU通訊,支撐大型AI模型的運行。

NVIDIA同步展示其完整網路平台,包括NVLink、NVLink Switch與NVLink Fusion,提供垂直擴展的GPU連結能力;而Spectrum-X乙太網路則提供水平擴展,能將分散叢集整合成統一運算單元。更進一步的Spectrum-XGS跨域技術,可將多個資料中心互聯,打造「千兆瓦級AI超級工廠」。

值得注意的是,隨著矽光子技術持續發展,透過共同封裝光學(CPO)交換器以光纖取代傳統銅線,不僅加速傳輸,更大幅降低能耗,突破大規模AI基礎設施瓶頸。

另一大焦點是NVIDIA GB200 NVL72系統。該單一機架百萬兆級(exascale)電腦整合36顆GB200超級晶片,每顆晶片由兩個B200 GPU與一個Grace CPU組成,並透過NVLink網域連結,能以每秒130TB的低延遲效能支援AI與高效能運算。這項基於Blackwell架構的系統,將推理效能提升至全新境界。

NVIDIA架構資深總監Blackstein則介紹了GeForce RTX 5090 GPU所展現的突破。透過DLSS4技術,遊戲效能可翻倍提升,並引入神經渲染功能,將效能、光影效果與設計週期均放大或縮短十倍,讓電腦圖形與模擬達到前所未有的真實感。

在桌面端應用方面,NVIDIA發表DGXSpark超級電腦,由GB10超級晶片驅動。其設計面向研究人員與開發者,能以小型化外型承載生成式AI的高效運算。DGXSpark支援NVFP4數值格式,針對大型語言模型(LLM)推理進行最佳化,兼具能效與效能,成為學術研究與企業研發的有力工具。

除了硬體創新,NVIDIA也積極推動軟體生態。公司宣布已加速多項開源函式庫與框架,如Tensor RT-LLM、Cutlass、Collective Communication Library等,並與FlashInfer、PyTorch、vLLM等熱門框架合作,提供模型最佳化方案。

此外,NVIDIA NIM微服務也支援包括OpenAI gpt-oss與Llama4在內的多款開源模型,讓開發者在享有靈活度與安全性的同時,也能使用託管型API,擁有更多元的開發選擇。

從機架級電腦、超高速網路,到圖形與遊戲技術,NVIDIA在Hot Chips大會展示的系列創新,展現其打造「AI工廠」的完整藍圖。無論是資料中心的大規模AI推理,還是桌面端的生成式AI開發,NVIDIA都以軟硬體並進的策略,推動AI技術無所不在。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
國巨*「1拆4」股價重返百元價!今一度飆6.6% 成交爆量2.6萬張