NVIDIA 同步發表兩套以 Omniverse 和 Cosmos 平台驅動的全新藍圖,提供大規模、可控的合成資料生成引擎,協助開發人員加速後期訓練機器人與自駕車。1X、Agility Robotics、Figure AI、Foretellix、Skild AI 和 Uber 等企業已率先採用 Cosmos,進一步加速訓練流程,提升實體 AI 系統的效能與應用範圍。

NVIDIA執行長黃仁勳表示:「正如大型語言模型徹底改變生成式與代理 AI,Cosmos 世界基礎模型則為實體 AI 帶來重大突破。Cosmos 提供開放且完全可客製化的推理模型,為機器人與實體產業的跨越式發展創造全新機會。」

在 Cosmos 平台中,Cosmos Transfer WFM 支援將結構化影片輸入(如分割圖、深度圖、姿態估計圖等)轉換為可控的高真實度影片輸出,顯著簡化感知 AI 的訓練流程。Agility Robotics 率先導入 Cosmos Transfer 和 Omniverse,以生成大量合成資料訓練機器人模型。該公司技術長 Pras Velagapudi 表示:「Cosmos 幫助我們擴大訓練資料範圍,超越現實世界資料的限制,進一步提升機器人的學習與執行效能。」

此外,Foretellix 應用 Cosmos Transfer 藍圖模擬不同天氣、光線條件,豐富自駕車駕駛場景資料集,Parallel Domain 也針對感測器模擬應用類似技術。NVIDIA GR00T 藍圖則結合 Omniverse 和 Cosmos Transfer,可在數小時內大規模生成多樣化資料集,加速 AI 模型訓練。

Cosmos Predict WFM 則主打多模態世界生成,支援文字、圖像與影片輸入,預測虛擬世界中物體動作與運動軌跡。1X、Skild AI、Nexar 與 Oxa 等企業已將 Cosmos Predict 應用於人形機器人、自駕系統的開發與優化。搭配 NVIDIA Grace Blackwell NVL72 系統與 NVLink 技術,開發者可實現即時世界生成,滿足高效能應用需求。

針對影片理解與互動預測,NVIDIA 推出 Cosmos Reason WFM,支援時空感知與思維鏈推理,能以自然語言描述物體行為並預測互動結果,協助開發人員優化實體 AI 資料註釋、模型訓練與高階任務規劃。

NVIDIA 同時提供 DGX Cloud 上的 PyTorch 指令碼與 NeMo 架構,簡化 Cosmos WFM 的後期訓練流程,並透過 NeMo Curator 加速資料處理。Linker Vision、Milestone Systems 與 Virtual Incision 等企業均採用該解決方案,推進視覺代理模型、自駕車與手術機器人開發。

為落實負責任 AI,NVIDIA 宣布在 Cosmos WFM 上實施開放護欄,並與 Google DeepMind 合作整合 SynthID 浮水印技術,強化 AI 生成內容的透明度。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
美股反攻輝達股價仍遭低估 這檔主題ETF可望搭上再次起飛行情