這款新模型採用了全新的優化演算法和專門設計的訓練數據集,並利用強化學習技術來進行訓練。OpenAI研究主管Jerry Tworek指出,o1模型是使用像人類般「思維」的推理方式,使得模型能更準確地解答問題,雖然回答時會出現「thinking...」的停頓,但卻也同時減少了自行猜測、捏造等「幻覺」結果的現象。
在國際數學奧林匹克競賽的資格考試中,o1模型的得分達到83%,明顯地比GPT-4o的 13%來得高。此外,在程式設計競賽Codeforces中,o1模型也進入了參賽者的前89%,顯示o1在編碼和數學領域的強大實力。未來,OpenAI預計o1模型將在物理、化學和生物學等領域達到類似博士生的水平。
目前,o1模型僅對部分用戶開放。即日起ChatGPT Plus和 ChatGPT Teams用戶可以使用o1-preview和o1-mini版本,而企業和教育用戶則預計於下週起開放。OpenAI計劃未來向所有免費用戶開放o1-mini。
儘管o1模型在推理和複雜問題解決方面表現優異,但在事實性知識和資訊檢索方面仍不及GPT-4o,不過OpenAI認為o1代表了一種新的能力類別,並為推理任務設立新的標準。
點擊閱讀下一則新聞
ASUS VIP會員破600萬 專屬福利全面升級