中研院AI用中國資料庫「簡轉繁」　院長廖俊智：研究人員求快心切

2023/10/12 10:45 記者良博綜合報導

【記者王良博／台北報導】中央研究院日前推出繁體中文的語言模型CKIP-Llama-2-7b，此語言模型類似Chat-GPT，但遭抓包採用中國資料「簡轉繁」，引發爭議。對此，中研院長廖俊智今（12）日表示，此為研究人員求快心切，把尚未完全測試完畢的軟體放上網。他也說，此計畫是做明清人物研究，但有機會用新技術才會加以進行，原計畫沒有要做生成式AI。

中研院長廖俊智出席立法院教育及文化委員會，進行業務概況報告並備質詢。王良博攝

中央研究院先前推出語言模型CKIP-Llama-2-7b，與Chat-GPT一樣採用問答方式，可用於文案生成、語言翻譯等。不過，專家發現，此語言模型採用中國資料「簡轉繁」，因此有不少問答內容，都以中國文化回答，用語也是中國用語。

後續中研院將系統下架，中研院也說，此為個人小型研究，希望將明清人物的生平進行自動化分析，建構自動化的歷史人物、事件等事理圖譜，民眾的提問超出原始研究範疇，導致語言模型產生的內容出乎預期，未來研究及成果釋出會更加謹慎。中研院也稱，將規劃成立「生成式AI風險研究小組」，深入了解AI對社會的衝擊，提供研究人員相關指引，避免類似事件再度發生。

立法院教育及文化委員會今天邀請中研院院長廖俊智列席報告業務概況，並備質詢，也審查明年度中研院預算案。多位立委在質詢時，關切CKIP-Llama-2-7b出包爭議。

對於事發原因，廖俊智在立委質詢時表示，此語言模型是一名研究人員求快心切，把尚未完全測試完畢的軟體，以開源精神放上網，請大家一同測試。

廖俊智也說，此計畫並非針對生成式AI，而是做明清人物相關研究，後來發現有機會可以用新技術，研究人員才拿這些經費去做，原來的計畫並沒有要做到生成式AI。

廖俊智坦言，把尚未完全測試完畢的軟體放上網有待商榷，該研究人員也深切反省，而此事件也讓中研院體認到繁體中文語言詞彙很重要，且需要大家一起來做。

立委萬美玲詢問，中研院研究人員在研究出爐後就放上網給大家測試，廖俊智是否知道？對此廖俊智坦言是事後才知道有對外發布。萬美玲直言，中研院發布出去的東西就是代表中研院，管理上要更嚴謹。

另外，中研院先前表示，將成立「生成式AI風險研究小組」，了解AI對社會的衝擊，提供研究人員相關指引，立委張廖萬堅質詢時詢及此事。

廖俊智表示，中研院「生成式AI風險研究小組」正在規劃當中，會盡快進行，因為AI帶來的衝擊是未知數，全世界都在學習當中。

廖俊智也強調，除了風險管控之外，也要整合全國力量，建置台灣的繁體中文詞彙資料庫，這是刻不容緩也需要大力投入。

立委黃國書質詢時則說，目前中研院有6個類似ChatGPT的生成式AI研究計畫，經費最高達到1200萬，要求廖俊智說明是否使用到中國資料庫。

廖俊智回應，目前了解沒有使用到中國資料庫，他也說，未來會配合國科會計畫，開發台灣自己的資料庫。

廖俊智強調，在「生成式AI風險研究小組」做出給研究人員的指引之前，相關研究不會暫停，因為仍有資料庫以外的層面需要處理，但會提醒研究人員需要多加注意。

爆料網址：reporting.nextapple.com

爆料信箱：news@nextapple.com

★加入《壹蘋》Line，和我們做好友！

★下載《壹蘋新聞網》APP

★Facebook 按讚追蹤

☞壹蘋娛樂粉專 ☞壹蘋新聞網粉專

文章標籤

點擊閱讀下一則新聞

漸凍症、阿茲海默症治療新思路　中研院團隊以「雙醣分子」減緩神經元退化

【記者林則澄／台北報導】在台又稱「漸凍症」的肌萎縮性脊髓側索硬化症（Amyotrophic Lateral Sclerosis, ALS），其與額顳葉失智症（Frontotemporal Dementia, FTD）都是好發於中年人口的神經退化性疾病。中央研究院基因體研究中心陳韻如研究員近期率領團隊，利用化學合成胜肽，首次發現並建立新毒理模型，以及一種可以增加腦神經細胞的存活率的雙醣分子，幫助減少神經元的退化，有望提供科學界更多神經退化性疾病的治療線索。上述研究成果已於2月23日發表於國際頂尖期刊《科學前緣》（Science Advances）。

生活

2024/03/18 15:08

中研院估2024年經濟成長率3.02%　整體情勢「雪融春暖偶寒風」

【記者王良博／台北報導】中央研究院經濟研究所今（22）日發布「2024年台灣經濟情勢總展望」，中研院形容，明年經濟情勢是「雪融春暖偶寒風」，預估明年實質經濟成長率為3.02%。物價方面，中研院指出，明年物價漲勢將較今年和緩，預期明年消費者物價指數（CPI）成長率仍達1.90%，逼近通膨警戒線的2%。

生活

2023/12/22 17:00

中研院士王汎森獲德國宏博研究獎　創我國人文領域先例

【記者王良博／台北報導】中央研究院院士、歷史語言研究所特聘研究員王汎森，榮獲德國宏博基金會頒發2023年宏博研究獎（Humboldt Research Award），肯定王汎森對學術及教育的貢獻，是台灣人文學領域首位獲得此殊榮的學者，將於明年6月由德國總統頒獎。

生活

2023/12/04 12:50

中研院年度「院區開放」落幕　恢復疫前盛況！上萬人搶參加

【記者王良博／台北報導】邁入第26年的中央研究院「OPEN HOUSE院區開放活動」今（21）日展開，中研院表示，今年院區開放活動恢復疫情前的盛況，全台有近50間學校、團體事先報名，包團、包車前來，最多的是新北市裕德高中有581人，統計有上萬民眾，湧入南港院區參加今年院區開放活動。

生活

2023/10/21 17:40

中研院副研究員院內輕生　補破網！主管學辨識情緒波動、輕生傾向

【記者王良博／台北報導】今年8月中研院生醫所牟姓副研究員在院內輕生，立委萬美玲、陳秀寶今（12）日在立法院關切此事，中研院院長廖俊智表示，對此事非常惋惜、錯愕，會持續關懷院內研究人員。中研院國際事務處處長孟子青則說，事發後已在院內成立工作坊，讓各單位主管學習如何辨識同仁的情緒波動跟輕生傾向。

生活

2023/10/12 11:29

中研院AI用對岸資料庫　資訊所長曝原因：明清歷史人物研究缺乏資料

【記者王良博／台北報導】中央研究院日前推出繁體中文的語言模型CKIP-Llama-2-7b，此語言模型類似Chat-GPT，但上線不久即遭抓包採用中國資料「簡轉繁」，導致諸多用語、問答內容都以中國文化回答，引發爭議。對此，中研院資訊所所長廖弘源今（12）日表示，此為研究員要進行明清歷史人物時空關係的計畫，因缺乏足夠資料集，才使用對岸的資料集，但卻造成一些價值觀也被加入系統中。

生活

2023/10/12 10:30

做火箭、預測下一代長相　中研院300場科普活動下周起報名

【記者王良博／台北報導】中央研究院「院區開放」（Open House）活動邁入第26屆，今年首度於10月14日加碼舉辦「兒童科普日」，打造專屬學齡兒童的科學遊樂園，10月21日「院區開放日」則持續瞄準國高中生、社會大眾。連續兩個周六共有近300場科普活動，部分活動有限定參與人數，採預約登記抽籤制，將於9月18日至10月1日開放報名登記。

生活

2023/09/11 15:32

中研院第34屆院士提名開跑！新制須載明「國籍」　不溯及既往

【記者林芳如／台北報導】中研院第34屆院士候選人提名將自7月17日起受理，至10月17日截止，為了避免重演國籍爭議，中研院從第34屆開始修改提名表，新增「國籍」欄位，新院士必須具備中華民國國籍，包含雙重國籍，但不溯及既往。

生活

2023/07/08 14:11

蜥蜴斷尾「受傷越重再生越快」　中研院團隊解開250年謎團

【生活中心／台北報導】為什麼會再生的動物，再生速度總是跟受傷程度成正比？這是一個困擾生物學家超過250年的奇特現象。中央研究院細胞與個體生物學研究所陳振輝副研究員及物理研究所林耿慧副研究員組成跨領域團隊，發現斑馬魚利用「機械波」及時偵測受傷發生的位置，以調控相對應的傷口癒合和再生反應。此研究成果於今（112) 年6月刊登於國際期刊《自然物理》(Nature Physics)。

生活

2023/06/21 19:59

Mercedes-Benz星動樂園登場　三芒星品牌體驗巡迴全台

【記者林浩昇／台北報導】延續 2024 年「Mercedes-Benz FUN 電星樂園」吸引超過三萬名參與者的熱烈迴響，台灣賓士今年再度升級舉辦【Mercedes-Benz 星動樂園】活動，規模與內容全面擴大，將於北、中、南三地陸續展開。以品牌象徵三芒星所代表的「陸、海、空」（LAND、SEA、AIR）為概念，打造三大互動主題展區，讓民眾能近距離體驗 Mercedes-Benz 的創新科技與設計精神。

車市

2025/11/09 00:03