NVIDIA指出,物理AI可結合視覺感測與推理能力,執行過去需人工操作的高風險任務,例如重型機械操控、工廠瑕疵檢測與公共安全監控。透過Metropolis平台,開發者能簡化影片分析AI代理的開發、部署與擴充流程,提升城市與基礎建設的安全性與效率。
在應用案例上,Accenture與Belden合作,利用NVIDIA Omniverse與Metropolis打造智慧型虛擬圍欄,結合數位孿生與3D空間智慧,降低人機協作事故風險;Avathon則運用Metropolis影片搜尋與摘要藍圖(VSS)提升製造與能源設施的即時監控能力,並已在Reliance BP Mobility加油站落地,降低違規事件並提升生產力。
DeepHow推出「Smart Know-How Companion」,將標準作業流程轉化為多語言影片指引,協助Anheuser-Busch InBev將職前訓練時間縮短八成;Milestone Systems則運用NVIDIA NeMo Curator與Cosmos Reason VLM打造智慧交通專用視覺語言模型,強化市區道路管理;Telit Cinterion整合NVIDIA TAO Toolkit 6於視覺檢測平台,支援快速部署高精度AI瑕疵檢測模型。
NVIDIA同步公布Metropolis五大更新:
第一,Cosmos Reason VLM,這款具7億參數的開放式視覺語言模型能支援情境化影片理解與事件推理,適用於交通監控、公共安全與智慧決策;第二,VSS Blueprint 2.4可結合Cosmos Reason擴充視覺AI功能,並提供更彈性的API組合。
第三,全新視覺基礎模型整合於TAO Toolkit,結合自我監督式學習與知識蒸餾,優化邊緣與雲端部署;第四,Isaac Sim擴充套件提供更豐富的模擬與資料集生成能力,解決標註資料不足與極端場景問題;第五,硬體支援擴展至RTX PRO 6000 Blackwell GPU、DGX Spark與Jetson Thor平台,全面涵蓋邊緣到雲端的AI開發與部署需求。
NVIDIA強調,這些更新將讓物理AI開發門檻大幅降低,並推動全球工業、交通與公共安全邁向更智慧、更高效、更安全的新階段。
