僅有80億參數！輝達發表全新語言模型　體積小巧又有先進精確度

雲云董座曾志新狂刺技術長奪命！吞刀自戕獲救　殺人罪起訴

爆包庇「百億大亨」蓋違法渡假村！台東縣府說話了

壹蘋10點強打｜主播王乃伃特斯拉內約會90分鐘！被機師男友甜撲（狗仔直擊）

美國「出兵協防台灣」已成共識　雷根中心民調：兩黨超過70%全力支持

范瑋琪「災難性破音」被罵臭頭　喊告網友！惡補歌喉求復活

可能的「雙颱」模擬路徑！專家曝侵台機率　這2天恐今年最熱

趙怡翔驚傳辭北市議員！最快「這時間」轉戰國安會

街頭見「這大樓案名」超困惑　網愣：4字都認識合起來看不懂

館長喊「台灣人性命由中國14億人決定」　網炸鍋：黃安化了

2024/08/22 17:17 壹蘋新聞網 / 呂承哲綜合報導

【記者呂承哲／台北報導】生成式人工智慧（AI）的開發者通常得面臨要取捨模型大小還是精確度的難題，不過，輝達（NVIDIA）最新發表的全新語言模型兼具兩者之長，不僅模型體積小巧，又有著最先進的精確度， NVIDIA 與Mistral AI 在上個月共同發表開放式 Mistral NeMo 12B 模型的縮小版Mistral-NeMo-Minitron 8B可以在 NVIDIA RTX 驅動的工作站上運行，同時在由 AI 支援的聊天機器人、虛擬助理、內容產生器和教育工具的多項基準測試中，表現依然十分出色。

輝達提供

NVIDIA則是使用開發客製化生成式 AI 的端對端平台 NVIDIA NeMo 蒸餾（distillation）出Minitron 模型。NVIDIA 應用深度學習研究部門副總裁 Bryan Catanzaro 表示，「我們將兩種最佳化AI的方法加在一起。這包括以剪枝的方式將 Mistral NeMo 的 120 億個參數縮減為 80 億個，並且採用蒸餾方式提高精確度。這麼一來便能降低 Mistral-NeMo-Minitron 8B 的運算成本，又可以提供媲美原始模型的精確度。」

小型語言模型可以即時在工作站和筆記型電腦上執行，這一點跟大型語言模型不同。此舉使得資源有限的組織更容易在基礎設施中部署生成式 AI 功能，又能取得最佳的成本、運作效率和能源使用程度。由於無需從邊緣裝置將資料傳送到伺服器，在邊緣裝置上以本機端的方式運行語言模型另外有著安全性方面的優勢。

開發人員可以透過包裝成有著標準應用程式介面（API）的 NVIDIA NIM 微服務使用Mistral-NeMo-Minitron 8B，或從 Hugging Face 下載模型。此NVIDIA NIM也即將開放下載，可以在數分鐘內部署在任何 GPU 加速系統上。

與類似大小的模型相比，Mistral-NeMo-Minitron 8B 模型在九個熱門的語言模型基準測試均處於領先地位。這些基準涵蓋各種任務，包括語言理解、常識推理、數學推理、總結、編碼以及產生真實答案的能力。

Mistral-NeMo-Minitron 8B 模型包裝成 NVIDIA NIM 微服務，並且最佳化至最佳狀態，有著低延遲的特色，能加快回應使用者的速度，並有高輸送量以降低生產環境的運算成本。

開發人員在某些情況下可能想要使用更小的模型，以便在智慧型手機或機器人等嵌入式裝置上運行。他們為此可以下載有著 80 億個參數的模型，並針對企業特定的應用程式使用 NVIDIA AI Foundry 剪枝和蒸餾出較小且最佳的神經網路。

AI Foundry 平台與服務為開發人員提供完整堆疊解決方案，協助他們客製化基礎模型，並且將其包裝成 NIM 微服務。AI Foundry 平台與服務提供熱門的基礎模型、NVIDIA NeMo 平台與 NVIDIA DGX Cloud 上的專用容量。使用 NVIDIA AI Foundry 的開發人員同樣能夠使用 NVIDIA AI Enterprise，這個提供安全性、穩定性及支援部署到生產環境的軟體平台。

由於原版的 Mistral-NeMo-Minitron 8B 模型一開始就有著最先進的精確度，因此使用 AI Foundry 瘦身後的版本依舊只要極少的訓練資料與運算基礎設施，就能達到高精確度的表現。

研究團隊用剪枝加上蒸餾的方法，讓較小的模型達到高精確度表現。剪枝會去除掉對精確度影響最小的模型權重（weight），以縮小神經網路的規模。研究團隊在蒸餾模型時，會在一個小資料集上重新訓練這個修剪過的模型，以大幅提升在修剪過程中降低的精確度。

這項技術代表只要使用原始資料集的一小部分，就能訓練一系列相關模型裡每個額外的模型，這跟從頭訓練一個較小的模型相比，剪枝和蒸餾一個較大的模型可以省下高達 40 倍的運算成本。

NVIDIA 在本週還發表了另一個小型語言模型 Nemotron-Mini-4B-Instruct，這個模型針對NVIDIA GeForce RTX AI PC 與筆記型電腦上低記憶體使用率與更快回應時間最佳化。這個模型以 NVIDIA NIM 微服務形式提供，讓開發人員可以部署到雲端與裝置上。而它也是 NVIDIA ACE 的一部分，NVIDIA ACE 是一套製作數位人類的技術，提供由生成式 AI 支援的語音、智慧與動畫。透過瀏覽器或 ai.nvidia.com 上的 API，體驗這兩個包裝成 NIM 微服務的模型。

輝達 AI 語言模型

點擊閱讀下一則新聞

TISA帳戶7月上路！國泰投信2檔招牌基金將開賣、只要千元就能入手

【記者呂承哲／台北報導】為提升國人資產管理意識，金管會推動「臺灣個人投資儲蓄帳戶（Taiwan Individual Savings Account, TISA）」制度，鼓勵中長期穩健投資。國泰投信響應政策，率先宣布旗下「國泰台灣高股息基金」及「國泰泰享退2049目標日期組合基金」新增TISA級別，已於6月27日公告，7月1日起於基富通開賣。

財經股市

2025/06/30 10:21

日圓今出現「0.2046」　哈日族比2個月前多賺6張東京迪士尼門票

【記者許麗珍／台北報導】非美貨幣看升，新台幣今在亞幣表現相對強勢，新台幣今（30日）於亞洲貨幣中表現強勢，以台灣銀行日圓現鈔賣出價，9點開盤出現「0.2049」之後，一度掛出「0.2046」，若今天換日圓，要比2個月前多賺6張東京迪士尼門票。

財經股市

2025/06/30 09:33

川普對等關稅7/9大限不打算延長　台股開盤小跌62.52點　台積電跌10元

【記者許麗珍／台北報導】美國總統川普29日表示對等關稅7月9日大限不打算延長，此話一出，台股今開盤小跌62.52點或0.28%，暫報22,517.56點，成交金額105.02億元。權值股台積電小跌10元，暫報1070元。法人指出，若對等關稅恢復徵收，將增加台廠供應鏈成本壓力，須密切關注國際政策動向。

財經股市

2025/06/30 08:59

砍到見骨！新車價「不用23萬」　車廠促銷突喊卡

【國際中心／綜合報導】中國電動車大廠比亞迪出招，宣布旗下22款車祭出高達34%優惠，新車價下殺至22.64萬台幣，震撼市場。不過官方日前突公告7月1日起促銷「全部作廢」，引發熱議。

國際

2025/06/30 07:43

TikTok要賣了！川普：買家超有錢「習近平也會點頭」

【國際中心／綜合報導】短影音平台TikTok在美國被禁，尋覓賣家一波三折，美國總統川普透露，他已經為TikTok找到買主，是一群「非常富有的人」。

國際

2025/06/30 06:39

台股仍有追趕空間！法人：7月市場變數多　建議避開這類股

【記者呂承哲／台北報導】台股經歷四、五兩月的下洗上沖，六月出乎預料強勢走高，一舉突破22000點整數關卡與年線壓力，顯示多頭動能遠超預期。永豐投顧指出，台積電領軍攻高，加上AI題材延燒，推升投資信心與市場熱度，令原先預估的盤整月變成強漲月。不過，台股至今仍落後全球主要市場表現，且七月將面臨「對等關稅」暫緩期屆滿與美股財報登場的雙重考驗，操作上建議聚焦AI核心股，避開漲多投機股，指數區間暫看21500至23500點。

財經股市

2025/06/30 00:25

英國貿易政策部長訪台主持台英經貿對話　見證ETP三項合作協議

【記者呂承哲／台北報導】英國商業貿易部貿易政策暨經濟安全部長艾禮遜（Douglas Alexander）於6月28日抵達台灣，於29至30日在台期間主持第27屆台英年度經貿對話會議（UK-Taiwan Trade Talks），期盼拓展英國企業在台灣這個全球關鍵市場的合作機會。

財經股市

2025/06/29 22:42

嘉義115MWp案場啟動！Lightsource bp與星星電力簽署綠電購售協議

【記者呂承哲／台北報導】全球再生能源專案開發商Lightsource bp（台灣天和能源）與泓德能源（6873）旗下售電業者星星電力於26日簽署購電協議（PPA），預計將嘉義布袋地區總裝置容量達115MWp的漁電共生太陽能案場所生綠電，100%全數轉售予企業市場。該案已於今年6月動工，並預計於2026年完工，年發電量約達1.8億度，可供應約4.1萬戶家庭年用電需求，工程期間也將創造750個就業機會。

財經股市

2025/06/29 22:26

AI會搶工程師飯碗？群聯潘健成這樣看　推「邊緣AI訓練師」課程培育人才

【記者呂承哲／台北報導】AI浪潮讓推論與模型訓練需求日益攀升，但AI GPU設備昂貴、實作環境稀缺與人才缺口，尤其在大專與職訓體系更為嚴峻，為此，NAND Flash控制IC廠群聯電子（8299）執行長潘健成指出，要讓AI真正普及，必須從平價化設備與技術教育普及兩大方向下手。為此，群聯推出「aiDAPTIV+」記憶體擴展方案，搭配10至12萬元的AI Training PC（AI TPC），並自辦「邊緣AI訓練師」課程，希望建立一套完整的AI訓練與創業生態系。

財經股市

2025/06/29 17:13

遊日勿喝！經典飲料「恐混入金屬碎片」　全家回收227萬瓶

【國際中心／綜合報導】日本全家便利商店宣布，門市販售的瓶裝「茉莉花茶」可能混入金屬碎片，正全面自主回收227萬瓶。

國際

2025/06/30 10:43

日頭赤熱熱！北市縮短740紅燈秒數　顧機車族免當人肉鐵板燒

【記者張綵茜／台北報導】夏季高溫來襲，悶熱天氣讓騎士成了「行動烤箱」，引擎熱氣、柏油蒸騰，等紅燈彷彿站在鐵板上烤。台北市交工處今（30日）宣布，將縮短740處路口號誌紅燈秒數，減少等候時間。

生活

2025/06/30 10:43

7人闖新竹秘境上坪溪泛舟　38歲男翻船！慘遭暗流吸入溺斃

【記者江孟謙／新竹報導】38歲廖姓男子等7人昨天（29日）上午前往新竹縣五峰鄉上坪溪泛舟，未料發生翻舟意外，廖男嘗試自救未果，慘遭水下暗流捲入，同行友人最終在下游200公尺處發現廖男，已經無生命跡象，經送醫後宣告不治；由於上坪溪早被新竹縣政府列為「危險水域禁止活動及遊憩」，消防局呼籲民眾從事泛舟、輕艇等活動時應選擇合法合格水域，以確保自身安全，避免悲劇再次發生。

社會

2025/06/30 10:34

37歲吉他手私訊14歲少女遭開除　知名樂團停工謝罪

【吳惠菁／綜合報導】日本知名重金屬樂團「Crossfaith」正在歐洲巡演，因37歲吉他手Daiki爆出和14歲少女私訊含有不適當的內容，Crossfaith取消剩餘4場演唱會，並於28日開除Daiki，今（30日）則宣布樂團暫停活動。

娛樂時尚

2025/06/30 10:32

台74線BMW釀3車追撞6輕傷　這車下來4名妹子好吸晴

【記者鮮明／台中報導】台中1輛BMW轎車昨天（30日）晚間行經台74線快速道路北屯路段，不知何故先是擦撞內側護欄，再追撞前方現代轎車，還波及另輛本田轎車，共造成6人輕傷。畫面被網友PO網，有人懷疑BMW酒駕或毒駕，但更多人關注本田轎車下來的長靴熱褲等4名辣妹。警方表示，相關駕駛未飲酒，車內未發現異狀，肇事原因有待進一步釐清。

社會

2025/06/30 10:29

雲云董座曾志新狂刺技術長奪命！吞刀自戕獲救　殺人罪起訴

【記者張欽/台北報導】雲云科技公司董事長曾志新因不滿梁姓技術長在公司群組發文控訴他領導無方，決定離職，今年3月7日在會議室與盧姓人資長利用辦理交接時要求梁男收回群組發文，梁男答應後又拒絕，曾男惱羞成怒痛下殺手，突然掏出預藏的主廚刀猛刺梁男後頸等處後，隨即吞刀自戕，住院治療11日後出院坦承「就是要殺他」！北檢今天偵查終結依殺人罪起訴曾男，並將全案移送北院國民法官庭審理。

社會

2025/06/30 10:25

TISA帳戶7月上路！國泰投信2檔招牌基金將開賣、只要千元就能入手

財經股市

2025/06/30 10:21

你們的稅率將是？川普：對等關稅7/9大限不延長　個別通知各國結果

【周恩華／綜合外電】「恭喜，我們允許你們將商品銷售到美國，你們將支付25%關稅，或35%或50%或10%。」這就是7月9日美國對等關稅90天大限到來時，全球多數國家將會收到美國寄出的通知。

國際

2025/06/30 10:21

宜蘭五結碾米廠火警！恐怖黑煙衝天際　現場畫面曝光

【記者葉先鵬／宜蘭報導】一處位於宜蘭五街相符合二路的碾米工廠，今天（30日）上午突然傳出火警，警消趕抵時工廠內已陷入火海並伴隨大片黑濃煙，所幸現場無人受困，目前警消正全力搶救中。

社會

2025/06/30 10:19