閩南語也能通！Meta發布第一個全新AI技術支援的非書寫語音翻譯系統

明演習北部登場！桃機出入境影響一次看

台電人員搶修遭電擊　職安署：未戴絕緣手套將依法開罰

被罷免不能喊告急？　吳宗憲：知恥近乎勇，不知恥近乎李進勇

中國蜜瓜季「全部隨地大小便」　親中女星都忍不了：經過就想吐

著作成考題「作者答案被說是錯的」　PTT反諷：只是寫書懂個屁

桃園警追酒駕遭撞　開5槍擊斃女乘客！確定無罪

抽血換學分｜台師大女足隊教練涉強制罪？　北檢出手！分案派民生專組偵辦

抽血12天全紀錄！台師大女忍痛「阿姨反覆插同一洞」　眾人不忍看：好心疼

2022/10/20 12:30 壹蘋新聞網 / 蕭文康綜合報導

【記者蕭文康／台北報導】Meta指出，閩南語是華裔群眾廣泛使用的語言，但缺少標準書寫文字系統。Meta的技術可讓使用閩南語的人士與使用英語的人士對話。

閩南語使用地區與人口數。Meta提供

至今為止，AI 翻譯主要著重於各種書寫語言，但在全球超過 7,000 種的現存語言中，將近半數主要是以口語表達，而沒有標準或廣泛使用的書寫文字系統。這導致無法使用標準技術為這類語言打造機器翻譯工具，因為標準技術需有大量的書寫文字來訓練AI模型。為克服這項挑戰，Meta為主要以口語表達的「閩南語」打造了一個史無前例的人工智慧技術翻譯系統。

該開放原始碼的翻譯系統是 Meta Universal Speech Translator（UST，或譯：通用語音翻譯工具）專案的一部分，該專案致力於開發新的 AI 方法，希望最終能為所有現存語言進行即時語音翻譯，包括主要以口語表達的語言。Meta相信口語溝通有助於打破隔閡，拉近人們之間的距離，無論身在何處，甚至在元宇宙中也不例外。

為開發這個只有語音的全新翻譯系統，Meta AI 研究人員必須克服許多來自傳統機器翻譯系統的挑戰，包括資料蒐集、模型設計，以及準確度評估。在將 UST 擴展至更多語言之前，還有很多工作要做。但能夠輕鬆地與使用任何語言的人們溝通的能力，是Meta長久以來追尋的夢想，因此Meta很高興能向這個目標更邁進了一步。

Meta不只會開放閩南語翻譯模型的原始碼，也會公開評估資料集和研究報告，讓他人能夠重製並以我們的工作成果為基礎建立模型。 Meta著手打造閩南語翻譯系統時，面臨的一個重大障礙就是是否能夠蒐集到足夠的資料。閩南語是所謂的資源匱乏語言，這意味著與西班牙文或英文等語言相比，該語言尚未有足夠的訓練資料。此外，將英語翻譯成閩南語的翻譯人員相對來說很少，因此更難以蒐集資料並加上註解來訓練模型。

Meta利用中文作為中間語言，以建立偽標籤和人工翻譯，意思是我們先將英語（或閩南語）語音翻譯成中文文字，接著再翻譯成閩南語（或英語），然後新增至訓練資料中。此方法利用了資源充足的相似語言的資料，藉此大幅改善了模型成效。

另一個產生訓練資料的作法是語音探勘。Meta使用預先訓練好的語音編碼器，便能透過編碼方式將閩南語語音嵌入內容加入到其他語言的相同語意空間中，而無須取得閩南語的書寫文字。閩南語語音可以和擁有相似語意嵌入內容的英語語音和文字配對。

接著從文字來合成英文語音，產生平行的閩南語和英語語音。許多語音翻譯系統依賴轉譯內容，或依賴語音轉文字系統。但由於主要以口語表達的語言並沒有標準書寫文字形式，因此Meta就無法將翻譯的文字製作成翻譯內容輸出。因此，Meta聚焦於語音轉語音翻譯。

Meta使用語音轉單元翻譯（speech-to-unit translation，S2UT）系統，直接在先前由Meta開創的路徑中，將輸入的語音翻譯成一系列聲學單元，然後從這些單元中生成波形。此外，我們針對二次解碼機制採用UnitY，讓第一階段的解碼器產生相關語言（中文）的文字，然後讓第二階段的解碼器製作單元。

語音翻譯系統通常會使用稱為ASR-BLEU 的衡量指標來評估，首先需使用自動語音識別系統（ASR）將翻譯後的語音轉譯成文字，然後將轉譯後的文字與人工翻譯的文字比較，以計算BLEU分數（標準機器翻譯衡量指標）。但評估主要以口語表達的語言（例如閩南語）時，評估語音翻譯的挑戰之一就是沒有標準的書寫文字系統。為啟動自動評估程序，Meta開發了稱為 Tâi-lô 的系統，將閩南語語音轉譯成標準化的拼音符號。這項技術讓我們能以音節為單位計算 BLEU 分數，並能夠很容易地比較不同方法下的翻譯品質。

除了開發方法以評估閩南語與英語語音翻譯的準確度，也根據名為Taiwanese Across Taiwan的閩南語語音語料庫，建立第一個閩南語與英語雙向的語音翻譯基準資料集。Meta將開放此基準資料集的原始碼，以鼓勵其他研究人員合作進行閩南語語音翻譯，並一同在該領域中取得進一步進展。

展望翻譯的未來，在目前的階段中，Meta的作法能夠讓使用閩南語的人士與使用英語的人士對話。雖然該模型仍在開發中，而且每次只能翻譯一個完整句子，但已朝著未來實現為各種語言提供同步翻譯的目標邁開一步。 Meta首創用於閩南語的各項技術，可以擴展至許多其他有書寫系統和無書寫系統的語言。

為此，Meta將發布 SpeechMatrix（暫譯語音矩陣），這是由 Meta 的創新資料探勘技術支援的大型語音翻譯語料庫，稱為 LASER，能讓研究人員建立自己的語音翻譯（S2ST）系統，並以Meta的工作成果為基礎，展開研究及開發工作。

最新、最好看的娛樂新聞都在《壹蘋娛樂》臉書粉絲專頁。

★快點加入《壹蘋》Line，和我們做好友！

★FB按讚追蹤《壹蘋新聞網》各大臉書粉絲團，即時新聞到你手，不漏任何重要新聞！

壹蘋娛樂粉專

壹蘋新聞網粉專

2025台灣文博會8月回歸台北！650品牌、IP搶進　人潮估破65萬

【記者張綵茜／台北報導】2025台灣文博會將於8月2-11日重回台北，主題定為「水風景」，以海島川流孕育的文化生態為靈感，串聯松菸與南港展館雙展區，規模創新高；展會將匯聚逾650家國內外品牌、超過50場表演與360場媒合，打造國內最大文創與IP交易平台。

生活

2025/07/16 17:29

大元認婚後重心放自己身上　花6位數蒐集上百顆「龍蛋」

【記者王思穎／台北報導】大元今年2月宣布和歌手鼓鼓登記結婚，愛情長跑12年開花結果，目前還處於新婚期的大元，今（16）日加碼宣布喜訊，簽入「抓馬文化」經紀公司，成為方志友師妹，將繼續朝戲劇努力。新婚5個月兩人最大改變，是從黏踢踢變成花更多世間在自己身上，因為開始注重個人身心靈，迷上天使療癒、水晶、和阿卡西前世今生回溯。她現場秀出購買的可愛龍蛋水晶照片，自曝買了100多顆，最貴的水晶可達7000多元，但自己單顆花費最貴5000多元，招認在水晶的總花費一定有破6位數。

娛樂時尚

2025/07/16 17:28

權恩妃「水炸彈」來啦！將在悍將大巨蛋秀性感舞　搶票時間曝光

【記者廖柏璋／綜合報導】韓國女星權恩妃近日穿著白色比基尼蹦出側乳晃不停，引起網友熱議，而中職富邦悍將今天也宣布，今年8月17日在大巨蛋的主場，將邀來權恩妃演出。

體育

2025/07/16 17:23

投手大谷對上打者翔平誰會贏？本人親口給答案了

【記者廖柏璋／綜合報導】日籍「二刀流」球星大谷翔平今天將連續第5年在明星賽亮相，他在受訪時表示，今年復出之後的投球狀況很好，始果對上自己，有信心可以投出三振。

體育

2025/07/16 17:21

「城鎮韌性防空演習」明北部登場！桃園機場出入境、聯外交通影響一次看

【記者莊偉祺／台北報導】這次「城鎮韌性防空演習」明（17日）將在北部地區登場，屆時桃園機場將配合演習進行警報傳遞與發放、疏散避難及交通管制等演練。桃機今（16日）提早針對出入境旅客做出不同指引提醒，同時聯外交通包含客運巴士、計程車，以及觀景台也將受到影響。

生活

2025/07/16 17:15

台電人員搶修遭電擊　職安署：未戴絕緣手套將依法開罰

【施養正／綜合報導】丹娜絲颱風加上數日風雨重創中南部，台電人員積極搶修拚復電。然而15日嘉義一名台電人員進行搶修工程時遭電擊，送往台南奇美醫院急救，目前仍在加護病房急救觀察。勞動部職安署16日前往現場勞檢，發現該員未戴絕緣手套，因此不慎遭電擊，目前已經讓現場停工，後續也會依法對台電開罰。

社會

2025/07/16 17:10

批罷團亂扣紅帽子！洪孟楷喊：「反共、反台獨」捍衛中華民國

【記者邱筠媜／台北報導】新北第1選區立委洪孟楷罷免案電視說明會今（16日）登場，罷團領銜人方柏翔批評洪亂提案、亂砍預算，推動掏空中央、架空離島等高度爭議法案。洪孟楷則反擊對方扣紅帽子，強調自己是台灣人，愛中華民國，共產黨或台獨勢力要消滅中華民國，他都堅決反對，並指自己推動多項福國利民法案，絕不接受不實指控。

政治

2025/07/16 17:07

抽血換學分｜台師大女足隊教練涉強制罪？　北檢出手偵辦了

【記者張欽／台北報導】台灣師範大學女足隊驚爆出教練周台英強逼球員「抽血配合研究」，若有人不從就以扣學分或退學威脅，而校方卻不積極處理、道歉，社會譁然，遭台大校友痛批「狼心狗肺」，因案情升溫，輿論撻伐，北檢今天下午主動分他字案偵辦，將教練周台英列強制罪嫌被告，由民生專組檢察官了解是否涉及不法。據悉，檢察官將盡速向台師大、教育部及國科會等單位調閱資料，並約談相關教練等人進行調查。

社會

2025/07/16 17:06

被罷免不能喊告急？　吳宗憲：知恥近乎勇，不知恥近乎李進勇

【劉育良／綜合報導】大罷免將於7月26日投票，今天開始已經不得發布、轉述、引用各類型民調。至於能否提及「預估掉幾席、誰選情告急、催票率不夠」等字眼？中選會主委李進勇表示，這些字眼若具民調外觀，依法也是禁止，但必須就個案認定。藍委吳宗憲痛批，罷免連告急都不能說，「果然知恥近乎勇，不知恥近乎李進勇！」

政治

2025/07/16 17:06