NVIDIA表示,Colossus目前是全球最大的AI超級電腦,專為訓練xAI的Grok系列大型語言模型設計,並為X Premium用戶提供聊天機器人功能。據悉,xAI計劃將Colossus的規模擴大至20萬個NVIDIA Hopper GPU,以提升處理能力。

xAI與NVIDIA在僅122天內完成了Colossus超級電腦及其配套設施的建置。如此大規模的系統建置通常需耗時數月至數年,而xAI從安裝第一個機架到AI訓練啟動僅花費了19天。

Colossus在訓練Grok模型的過程中展現出強大的網路效能。其三層網路結構在流量高峰時,依然沒有應用延遲或封包遺失的問題。藉由Spectrum-X壅塞控制技術,Colossus保持95%的資料輸送效率。一般標準乙太網路無法在大規模下達到此效能,可能會造成頻繁的流量碰撞,並僅能提供約60%的資料輸送量,顯示出Spectrum-X的技術優勢。

NVIDIA網路事業部資深副總裁Gilad Shainer表示,AI已成為關鍵業務,需求更高的效能、安全性、擴充能力與成本效益。NVIDIA Spectrum-X乙太網路平台的設計,正是為像xAI這樣的創新公司加速AI工作負載處理、分析及部署,推動AI解決方案更快地進入市場。

xAI創辦人馬斯克(Elon Musk)在X平台上表示,Colossus是全球最強大的訓練系統。xAI團隊、NVIDIA及合作夥伴的表現相當出色,為Colossus的成功貢獻巨大。

xAI發言人指出,xAI建造出全球最大、最強大的超級電腦,NVIDIA的Hopper GPU與Spectrum-X讓我們突破了大規模AI訓練的限制,並在乙太網路標準基礎上打造超級加速且最佳化的AI工廠。

Spectrum-X平台的核心設備為Spectrum SN5600乙太網路交換器,支援800Gb/s連接埠速度,並採用Spectrum-4交換器ASIC。xAI選擇將Spectrum-X SN5600交換器與NVIDIA BlueField-3 SuperNIC搭配使用,以實現前所未有的效能。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
輝達財報撐盤 美股收紅!道瓊漲461點