GPT-4o基於GPT-4升級的最新版本,加入對文字、圖片及影音方面的能力。GPT-4o可讓使用者輸入文字、圖片、音訊等資訊後即時產生文字、圖片、音訊的輸出組合,像是分析數據建議圖表、跟使用者聊聊所拍攝的照片。根據示範影片顯示,GPT-4o能夠與使用者進行即時互動,透過鏡頭畫面來描述現場環境,甚至進一步的聊天,即便是交談中被中斷也能夠像是跟真人一般繼續回答。

Open AI表示GPT-4o可以在短至232毫秒的時間內回應使用者的提問(與人類對話時,人類的回應速度平均為320毫秒)。 它在英文和程式碼上的表現與GPT-4 Turbo的效能相當,但在非英文上的效能顯著提高,同時API的速度也更快,成本更降低50%。 與現有模型相比,GPT-4o在視覺和音訊理解方面會特別出色。

GPT-4o文字和圖像功能今日起在ChatGPT中推出。 一般用戶可免費使用,ChatGPT Plus會於未來幾週內加入可以即時語音對話的新版語音模式GPT-4o alpha版。

除了手機版的ChatGPT,即日起也率先為Plus用戶推出適用於macOS的桌面版App,Windows電腦版本預計今年稍晚推出。用戶能夠直接從電腦與ChatGPT進行語音對話,GPT-4o的新音訊和視訊功能將在未來推出。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
7月除權息旺季2900億元活水來了 專家:AI挑低基期成長股、高股息題材