上周五,在接受MIT Technology Review採訪時,OpenAI團隊對於這次成功顯得格外謙遜。

華爾街見聞報導,OpenAI人工智慧政策研究人員Sandhini Agarwal表示,這在內部被視為一次「研究預覽」,是一項已有2年歷史的更完善版本,也是一次透過蒐集用戶回饋來彌補其缺陷的嘗試。另一位研究人員Liam Fedus則指出,OpenAI並不想將其作為一項重大的突破來過度宣傳。

自11月以來,OpenAI已經多次更新ChatGPT,研究人員正在使用一種稱為「對抗性訓練」的技術來阻止ChatGPT「越獄(jailbreaking)」。這項工作使多個聊天機器人相互對抗:一個聊天機器人扮演對手,透過生成文本來對抗另一個聊天機器,迫使其打破常規的限制。

此外,OpenAI還與微軟簽署一項價值數十億美元的協議,並宣布與全球管理諮詢公司貝恩結成聯盟,目標是透過突破性的人工智慧技術增強客戶的業務潛力。在OpenAI之外,圍繞ChatGPT掀起一場大模型的淘金熱,全球各地公司和投資者都積極參與其中。

以下是採訪的部分內容:
針對ChatGPT爆紅,對產業帶來巨大衝擊,Jan Leike(負責提高系統安全性團隊負責人):老實說,這的確是勢不可擋的的。我們很驚訝,也在一直在努力完善。

John Schulman(聯合創辦人):在發表後的幾天裡,我經常查看Twitter,在這段瘋狂的時間裡,充斥著ChatGPT截圖,我希望它能獲得更多的關注,但我沒想到它能爆紅到這種程度。

Sandhini Agarwal(人工智慧政策研究員):我認為這對我們所有人來說絕對是一個驚喜,人們開始使用它。我們對這些模型進行了大量研究,以至於我們忘記了它們有時對外界來說是令人驚訝的。

Liam Fedus(人工智慧政策研究員):我們很驚訝它的迴響這麼大,以前有很多人嘗試過使用聊天機器人,然而,我們的私人測試版讓我們相信,我們擁有了人們可能真正喜歡的東西。

Jan Leike說:我想更好地理解是什麼推動了這一切,是什麼推動著病毒性傳播。老實說,我們也不知道。

(團隊的部分困惑來自於ChatGPT中的大多數技術都不是新的,ChatGPT是GPT-3.5的一個微調版本,GPT-3.5是OpenAI在聊天機器人發表前幾個月研究出的大型語言模型。GPT-3.5本身是GPT-3的更新版本,於2020年發表,OpenAI還在2022年1月發表GPT-3.5的微調版本,名為InstructGPT,但這些早期版本的技術都沒有對公眾發布。)


Liam Fedus:ChatGPT模型是從與InstructGPT相同的語言模型中進行微調得出的,我們增加一些會話資料,並在訓練過程進行一些微調。

我們並不想將其作為一項重大的突破來過度宣傳,但事實證明,會話資料對ChatGPT產生巨大的影響。透過標準測試評估原始技術能力,模型之間實際上沒有實質性差異,但ChatGPT更易於訪問和使用。

Sandhini Agarwal:當我們準備發表時,我們並不認為這個模型存在其他新的風險,GPT-3.5已經發表,我們知道它已經足夠安全了。透過ChatGPT對人類偏好的訓練,該模型可以自動學習拒絕行為,即拒絕大量請求。

Jan Leike:我們確實為ChatGPT做了一些額外的紅隊演練(Red Teaming),OpenAI的每個人都試圖打破這種模式。我們有外部團體在做同樣的事情。我們也有一個早期訪問計畫,由信任的用戶提供回饋。

Sandhini Agarwal:我們確實發現它輸出一些不必要的內容,所以作為一個研究預覽這個意圖是好的。

John Schulman:你不能等到你的系統完美後再發表它,我們已經對早期版本進行幾個月的測試,測試人員對產品有較好的印象。我們最擔心的是真實性,因為模型喜歡捏造東西,但是InstructGPT和其他大型語言模型已經存在,所以我們認為,只要ChatGPT在真實性和其他安全問題上優於那些模型,應該就是更好的選擇。在發布之前,根據我們有限的評估,確認這些模型確實比其他模型更真實和安全,所以我們決定繼續發表。

壹蘋新聞網-投訴爆料

爆料網址:reporting.nextapple.com

爆料信箱:news@nextapple.com

★加入《壹蘋》Line,和我們做好友!

★下載《壹蘋新聞網》APP

★Facebook 按讚追蹤

壹蘋娛樂粉專壹蘋新聞網粉專


點擊閱讀下一則新聞 點擊閱讀下一則新聞

科技領軍財報利多 美股收高 那指勁揚316點