中央研究院先前推出語言模型CKIP-Llama-2-7b,與Chat-GPT一樣採用問答方式,可用於文案生成、語言翻譯等。不過,專家發現,此語言模型採用中國資料「簡轉繁」,因此有不少問答內容,都以中國文化回答,用語也是中國用語。

後續中研院將系統下架,中研院也說,此為個人小型研究,希望將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件等事理圖譜,民眾的提問超出原始研究範疇,導致語言模型產生的內容出乎預期,未來研究及成果釋出會更加謹慎。中研院也稱,將規劃成立「生成式AI風險研究小組」,深入了解AI對社會的衝擊,提供研究人員相關指引,避免類似事件再度發生。

立法院教育及文化委員會今天邀請中研院院長廖俊智列席報告業務概況,並備質詢,也審查明年度中研院預算案。

廖弘源會前受訪表示,此語言模型的計畫是大型語言模型,大型語言模型就相當於人的腦袋,人的腦袋是由很多腦神經單元所組成的,腦神經單元之間是用腦神經連結,要經過訓練才能把知識訓練到腦神經的連結裡面。

廖弘源進一步說明,現在的AI其實有一個腦袋,就是希望用電腦來模擬人腦的運作,為了加以訓練,就會有需要資料集的問題。

對於惹出爭議的CKIP-Llama-2-7b,廖弘源表示,負責此計畫的年輕研究員先前參與一個國科會語言模型的計畫,該計畫從去年8月到今年7月,經費也僅有70多萬。到了今年1月起,該研究員負責中研院數位文化中心關於明清歷史人物時空關係的計畫,因此想透過新的科技加以應用。

廖弘源表示,因為在製作階段缺乏足夠資料,所以研究員想到,對岸跟我們使用相同語言,因此直接使用對岸的資料集,再把簡體字轉成繁體字,然後用於訓練系統,但卻造成一些價值觀也被加入系統中。

廖弘源強調,該研究員的目的是要解決明清的歷史人物的相關知識,混入其他知識並不是他的本意。

壹蘋新聞網-投訴爆料

爆料網址:reporting.nextapple.com

爆料信箱:news@nextapple.com

★加入《壹蘋》Line,和我們做好友!

★下載《壹蘋新聞網》APP

★Facebook 按讚追蹤

壹蘋娛樂粉專壹蘋新聞網粉專


點擊閱讀下一則新聞 點擊閱讀下一則新聞
漸凍症、阿茲海默症治療新思路 中研院團隊以「雙醣分子」減緩神經元退化