博通資深副總裁暨核心交換器部門總經理 Ram Velaga 表示,機器學習需要將大量 GPU、CPU 或客製化晶片互相連結,如同單一大型運算系統。傳統上,垂直擴充(Scale-up)依賴 NVLink 等專有技術,但受限於單一伺服器或機架規模;水平擴充(Scale-out)則需跨機架甚至跨資料中心連結,對延遲要求極高,Broadcom 的 Tomahawk Ultra 交換器可將延遲壓低至 400ns,刷新業界紀錄。
他指出,輝達 NVLink 與 InfiniBand 屬於封閉專有技術,授權受制於該公司,甚至可能要求連接自家交換器或 GPU。Broadcom 則採開放策略,將以太網路連接 XPU 的完整規格公開,允許任何廠商使用任何乙太網交換器進行 Scale-out,並已推動 Meta、AWS 等雲端業者將大型 GPU 叢集由 InfiniBand 轉向 Ethernet 架構。
Jericho4 採台積電 3 奈米製程、內建 4 顆 HBM,支援跨距離 100 公里以上的資料中心互連,並具深度緩存與壅塞控制,確保長距離 RoCE 無損傳輸。單一系統可擴展至 36,000 個 HyperPort,每個傳輸速度 3.2Tb/s,並支援全線速 MACsec 加密,提升安全性與效能,可將不同地點的小型資料中心串接成單一運算資源池,突破電力與空間限制。
Ram Velaga總結,網路是分散式運算的核心,而 Ethernet 是最佳互連技術。開放標準能讓最佳網路與最佳 GPU 在同一市場公平競爭,避免因封閉式專有網路導致的技術封鎖,讓最好的網路產品勝出,也讓最好的 GPU可以獲得市場青睞,而不該將 GPU 綁定在專有網路上限制市場競爭。
