中研院AI用對岸資料庫　資訊所長曝原因：明清歷史人物研究缺乏資料

2023/10/12 10:30 記者良博綜合報導

【記者王良博／台北報導】中央研究院日前推出繁體中文的語言模型CKIP-Llama-2-7b，此語言模型類似Chat-GPT，但上線不久即遭抓包採用中國資料「簡轉繁」，導致諸多用語、問答內容都以中國文化回答，引發爭議。對此，中研院資訊所所長廖弘源今（12）日表示，此為研究員要進行明清歷史人物時空關係的計畫，因缺乏足夠資料集，才使用對岸的資料集，但卻造成一些價值觀也被加入系統中。

中研院資訊所所長廖弘源回應語言模型CKIP-Llama-2-7b出包爭議。王良博攝

中央研究院先前推出語言模型CKIP-Llama-2-7b，與Chat-GPT一樣採用問答方式，可用於文案生成、語言翻譯等。不過，專家發現，此語言模型採用中國資料「簡轉繁」，因此有不少問答內容，都以中國文化回答，用語也是中國用語。

後續中研院將系統下架，中研院也說，此為個人小型研究，希望將明清人物的生平進行自動化分析，建構自動化的歷史人物、事件等事理圖譜，民眾的提問超出原始研究範疇，導致語言模型產生的內容出乎預期，未來研究及成果釋出會更加謹慎。中研院也稱，將規劃成立「生成式AI風險研究小組」，深入了解AI對社會的衝擊，提供研究人員相關指引，避免類似事件再度發生。

立法院教育及文化委員會今天邀請中研院院長廖俊智列席報告業務概況，並備質詢，也審查明年度中研院預算案。

廖弘源會前受訪表示，此語言模型的計畫是大型語言模型，大型語言模型就相當於人的腦袋，人的腦袋是由很多腦神經單元所組成的，腦神經單元之間是用腦神經連結，要經過訓練才能把知識訓練到腦神經的連結裡面。

廖弘源進一步說明，現在的AI其實有一個腦袋，就是希望用電腦來模擬人腦的運作，為了加以訓練，就會有需要資料集的問題。

對於惹出爭議的CKIP-Llama-2-7b，廖弘源表示，負責此計畫的年輕研究員先前參與一個國科會語言模型的計畫，該計畫從去年8月到今年7月，經費也僅有70多萬。到了今年1月起，該研究員負責中研院數位文化中心關於明清歷史人物時空關係的計畫，因此想透過新的科技加以應用。

廖弘源表示，因為在製作階段缺乏足夠資料，所以研究員想到，對岸跟我們使用相同語言，因此直接使用對岸的資料集，再把簡體字轉成繁體字，然後用於訓練系統，但卻造成一些價值觀也被加入系統中。

廖弘源強調，該研究員的目的是要解決明清的歷史人物的相關知識，混入其他知識並不是他的本意。

爆料網址：reporting.nextapple.com

爆料信箱：news@nextapple.com

★加入《壹蘋》Line，和我們做好友！

★下載《壹蘋新聞網》APP

★Facebook 按讚追蹤

☞壹蘋娛樂粉專 ☞壹蘋新聞網粉專

文章標籤

點擊閱讀下一則新聞

漸凍症、阿茲海默症治療新思路　中研院團隊以「雙醣分子」減緩神經元退化

【記者林則澄／台北報導】在台又稱「漸凍症」的肌萎縮性脊髓側索硬化症（Amyotrophic Lateral Sclerosis, ALS），其與額顳葉失智症（Frontotemporal Dementia, FTD）都是好發於中年人口的神經退化性疾病。中央研究院基因體研究中心陳韻如研究員近期率領團隊，利用化學合成胜肽，首次發現並建立新毒理模型，以及一種可以增加腦神經細胞的存活率的雙醣分子，幫助減少神經元的退化，有望提供科學界更多神經退化性疾病的治療線索。上述研究成果已於2月23日發表於國際頂尖期刊《科學前緣》（Science Advances）。

生活

2024/03/18 15:08

中研院估2024年經濟成長率3.02%　整體情勢「雪融春暖偶寒風」

【記者王良博／台北報導】中央研究院經濟研究所今（22）日發布「2024年台灣經濟情勢總展望」，中研院形容，明年經濟情勢是「雪融春暖偶寒風」，預估明年實質經濟成長率為3.02%。物價方面，中研院指出，明年物價漲勢將較今年和緩，預期明年消費者物價指數（CPI）成長率仍達1.90%，逼近通膨警戒線的2%。

生活

2023/12/22 17:00

中研院士王汎森獲德國宏博研究獎　創我國人文領域先例

【記者王良博／台北報導】中央研究院院士、歷史語言研究所特聘研究員王汎森，榮獲德國宏博基金會頒發2023年宏博研究獎（Humboldt Research Award），肯定王汎森對學術及教育的貢獻，是台灣人文學領域首位獲得此殊榮的學者，將於明年6月由德國總統頒獎。

生活

2023/12/04 12:50

中研院年度「院區開放」落幕　恢復疫前盛況！上萬人搶參加

【記者王良博／台北報導】邁入第26年的中央研究院「OPEN HOUSE院區開放活動」今（21）日展開，中研院表示，今年院區開放活動恢復疫情前的盛況，全台有近50間學校、團體事先報名，包團、包車前來，最多的是新北市裕德高中有581人，統計有上萬民眾，湧入南港院區參加今年院區開放活動。

生活

2023/10/21 17:40

中研院副研究員院內輕生　補破網！主管學辨識情緒波動、輕生傾向

【記者王良博／台北報導】今年8月中研院生醫所牟姓副研究員在院內輕生，立委萬美玲、陳秀寶今（12）日在立法院關切此事，中研院院長廖俊智表示，對此事非常惋惜、錯愕，會持續關懷院內研究人員。中研院國際事務處處長孟子青則說，事發後已在院內成立工作坊，讓各單位主管學習如何辨識同仁的情緒波動跟輕生傾向。

生活

2023/10/12 11:29

中研院AI用中國資料庫「簡轉繁」　院長廖俊智：研究人員求快心切

【記者王良博／台北報導】中央研究院日前推出繁體中文的語言模型CKIP-Llama-2-7b，此語言模型類似Chat-GPT，但遭抓包採用中國資料「簡轉繁」，引發爭議。對此，中研院長廖俊智今（12）日表示，此為研究人員求快心切，把尚未完全測試完畢的軟體放上網。他也說，此計畫是做明清人物研究，但有機會用新技術才會加以進行，原計畫沒有要做生成式AI。

生活

2023/10/12 10:45

做火箭、預測下一代長相　中研院300場科普活動下周起報名

【記者王良博／台北報導】中央研究院「院區開放」（Open House）活動邁入第26屆，今年首度於10月14日加碼舉辦「兒童科普日」，打造專屬學齡兒童的科學遊樂園，10月21日「院區開放日」則持續瞄準國高中生、社會大眾。連續兩個周六共有近300場科普活動，部分活動有限定參與人數，採預約登記抽籤制，將於9月18日至10月1日開放報名登記。

生活

2023/09/11 15:32

中研院第34屆院士提名開跑！新制須載明「國籍」　不溯及既往

【記者林芳如／台北報導】中研院第34屆院士候選人提名將自7月17日起受理，至10月17日截止，為了避免重演國籍爭議，中研院從第34屆開始修改提名表，新增「國籍」欄位，新院士必須具備中華民國國籍，包含雙重國籍，但不溯及既往。

生活

2023/07/08 14:11

蜥蜴斷尾「受傷越重再生越快」　中研院團隊解開250年謎團

【生活中心／台北報導】為什麼會再生的動物，再生速度總是跟受傷程度成正比？這是一個困擾生物學家超過250年的奇特現象。中央研究院細胞與個體生物學研究所陳振輝副研究員及物理研究所林耿慧副研究員組成跨領域團隊，發現斑馬魚利用「機械波」及時偵測受傷發生的位置，以調控相對應的傷口癒合和再生反應。此研究成果於今（112) 年6月刊登於國際期刊《自然物理》(Nature Physics)。

生活

2023/06/21 19:59

Mercedes-Benz星動樂園登場　三芒星品牌體驗巡迴全台

【記者林浩昇／台北報導】延續 2024 年「Mercedes-Benz FUN 電星樂園」吸引超過三萬名參與者的熱烈迴響，台灣賓士今年再度升級舉辦【Mercedes-Benz 星動樂園】活動，規模與內容全面擴大，將於北、中、南三地陸續展開。以品牌象徵三芒星所代表的「陸、海、空」（LAND、SEA、AIR）為概念，打造三大互動主題展區，讓民眾能近距離體驗 Mercedes-Benz 的創新科技與設計精神。

車市

2025/11/09 00:03