已經有40多年歷史的電腦視覺與圖形辨識會議CVPR (IEEE Computer Vision and Pattern Recognition Conference)是人工智慧與計算機視覺領域最具有影響力的國際學術會議,每年吸引頂尖科技企業、研究機構以及學術界高手參與,今年是第二年舉行Waymo Sim Agents Challenge項目,這個聚焦於自動駕駛場景模擬的競賽,目的在推動自動駕駛技術的發展,並為研究人員提供了一個展示和交流的平台。
鴻海研究院與香港城市大學所提出的BehaviorGPT,專為自動駕駛汽車測試而設計,確保自動駕駛系統在實際部署前能安全地處理各種路上場景,如直行、轉彎、變換車道、路口交會等等。在今年的比賽中,與Google DeepMind、蘇黎世聯邦理工學院、普林斯頓大學、南洋理工大學等頂尖研究一構與學術單位同場競技,會後獲得第一名的肯定。
此項成果由鴻海研究院人工智慧研究所栗永徽所長率領所內研究員,與香港城市大學汪建平教授團隊、美國卡內基梅隆大學研究人員共同合作完成,將於今年 10月8日至9日舉行的鴻海科技日(Hon Hai Technology Day)展位詳細展示此項技術與其相關應用。
有別於以往的交通模擬器,通常使用複雜的編碼和解碼結構,輸入固定且有限時間段的歷史軌跡來預測車輛的未來軌跡,導致資料利用率較低。由鴻海研究院和香港城市大學提出的BehaviorGPT採用一種無須依賴複雜編碼、改良後的自回歸模型架構,可彈性地擷取任一時間段的歷史軌跡作為當前輸入,簡化了模型設計並提高了數據使用效率。
該方法提出了Next-Patch Prediction Paradigm(NP3)機制,有效地模擬車輛的連續運動,並捕捉多個車輛之間的長距離時空交互作用。該模型同時提出了三向注意力機制來考量時間連續性、環境物件和車輛互動模式對於未來軌跡預測的影響。這種高效的設計將能支援自動駕駛系統的驗證並提升其安全性。在模型大幅瘦身的基礎下(減少了91.6%的參數),BehaviorGPT以優異的0.7473 真實感評分和1.4147 minADE指標分數超越了先前的模擬器,並獲得Waymo Sim Agent Challenge 的冠軍殊榮。