中央研究院先前推出語言模型CKIP-Llama-2-7b,與Chat-GPT一樣採用問答方式,可用於文案生成、語言翻譯等。不過,專家發現,此語言模型採用中國資料「簡轉繁」,因此有不少問答內容,都以中國文化回答,用語也是中國用語。

後續中研院將系統下架,中研院也說,此為個人小型研究,希望將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件等事理圖譜,民眾的提問超出原始研究範疇,導致語言模型產生的內容出乎預期,未來研究及成果釋出會更加謹慎。中研院也稱,將規劃成立「生成式AI風險研究小組」,深入了解AI對社會的衝擊,提供研究人員相關指引,避免類似事件再度發生。

立法院教育及文化委員會今天邀請中研院院長廖俊智列席報告業務概況,並備質詢,也審查明年度中研院預算案。多位立委在質詢時,關切CKIP-Llama-2-7b出包爭議。

對於事發原因,廖俊智在立委質詢時表示,此語言模型是一名研究人員求快心切,把尚未完全測試完畢的軟體,以開源精神放上網,請大家一同測試。

廖俊智也說,此計畫並非針對生成式AI,而是做明清人物相關研究,後來發現有機會可以用新技術,研究人員才拿這些經費去做,原來的計畫並沒有要做到生成式AI。

廖俊智坦言,把尚未完全測試完畢的軟體放上網有待商榷,該研究人員也深切反省,而此事件也讓中研院體認到繁體中文語言詞彙很重要,且需要大家一起來做。

中研院長廖俊智出席立法院教育及文化委員會,進行業務概況報告並備質詢。王良博攝
中研院長廖俊智出席立法院教育及文化委員會,進行業務概況報告並備質詢。王良博攝

立委萬美玲詢問,中研院研究人員在研究出爐後就放上網給大家測試,廖俊智是否知道?對此廖俊智坦言是事後才知道有對外發布。萬美玲直言,中研院發布出去的東西就是代表中研院,管理上要更嚴謹。

另外,中研院先前表示,將成立「生成式AI風險研究小組」,了解AI對社會的衝擊,提供研究人員相關指引,立委張廖萬堅質詢時詢及此事。

廖俊智表示,中研院「生成式AI風險研究小組」正在規劃當中,會盡快進行,因為AI帶來的衝擊是未知數,全世界都在學習當中。

廖俊智也強調,除了風險管控之外,也要整合全國力量,建置台灣的繁體中文詞彙資料庫,這是刻不容緩也需要大力投入。

立委黃國書質詢時則說,目前中研院有6個類似ChatGPT的生成式AI研究計畫,經費最高達到1200萬,要求廖俊智說明是否使用到中國資料庫。

廖俊智回應,目前了解沒有使用到中國資料庫,他也說,未來會配合國科會計畫,開發台灣自己的資料庫。

廖俊智強調,在「生成式AI風險研究小組」做出給研究人員的指引之前,相關研究不會暫停,因為仍有資料庫以外的層面需要處理,但會提醒研究人員需要多加注意。

壹蘋新聞網-投訴爆料

爆料網址:reporting.nextapple.com

爆料信箱:news@nextapple.com

★加入《壹蘋》Line,和我們做好友!

★下載《壹蘋新聞網》APP

★Facebook 按讚追蹤

壹蘋娛樂粉專壹蘋新聞網粉專


點擊閱讀下一則新聞 點擊閱讀下一則新聞
漸凍症、阿茲海默症治療新思路 中研院團隊以「雙醣分子」減緩神經元退化