創鑫智慧執行長劉景慈 (Ken Lau) 表示:「在德國 2025 年嵌入式世界展覽會 (Embedded World) 的超恩展位 (Hall 3, #3-449),將可看到 Viper AI 加速卡的獨特功能,包括在平均僅 45W 功耗下支持 120 億參數模型。在高登智慧 ShareGuru SLM 解決方案基礎下,輔以創鑫智慧與超恩工業邊緣 AI 計算系統的協助,將可提供安全且高效的 AI 處理,以滿足現代工業環境資安相關要求。此一完整解決方案能為企業主管提供即時的業務洞察,協助他們以更低的營運成本做出更快速的決策。」  

專注於大語言模型 (LLM) 和生成式 AI 晶片設計的創鑫智慧,與超恩所合作開發的高能效解決方案,將分別整合雙方 Viper 系列 LLM 加速卡與邊緣 AI 運算系統,其中創鑫智慧提供的是企業級離線 AI 解決方案,搭載 Raptor N3000 LLM 加速晶片。這一戰略合作可望帶給企業高精準度且可信賴的解決方案,加速生成式 AI 發展與企業部署。  

超恩 ECX-3100 RAG 超強固工作站採用 Intel Core™ i9/i7/i5/i3 處理器搭載工作站等級 Intel R680E PCH,內建 96GB DDR5 高速記憶體,是一款精巧整合式生成式 AI 推論平台,具備 10G USB、2.5G 網路以及 5G/WiFi/BT/4G/LTE/GPRS/UMTS 無線傳輸等多種高速資料傳輸介面,並支援 DC 12V 至 50V 寬範圍電源輸入、車用電源控制功能及超堅固設計,可滿足邊緣端生成式 AI 應用的多樣化需求。  

超恩執行副總黃聖凱表示:「隨著生成式 AI (Generative AI; GenAI) 應用的發展,市場對 GenAI 的需求正快速增長。超恩與創鑫智慧合作開發以 RAG (Retrieval-Augmented Generation) 為主的先進 Gen AI 專用軟硬體整合解決方案,讓企業用戶無需額外訓練即可利用自然語言提取企業資料庫與商業智慧 (BI) 的最新分析,從而提供更關鍵、高品質的圖表化結果,加快企業決策流程。相較於傳統以雲端為基礎的 GPU 解決方案,GenAI 工作站提供更具成本效益、穩定的推論效能及低功耗優勢。」  

劉景慈指出,Viper AI LLM 加速卡展現創鑫智慧在生成式 AI 市場上的敏捷應變能力,為高登智慧 ShareGuru QA 2.0 自然語言轉換資料庫查詢 (Natural Language to SQL) 方案提供動力。在極為節能與高容量記憶體配置下,提供企業級語言模型能力,透過此一戰略整合,ShareGuru QA 2.0 是一個與 SLM 配合運作的 SQL Agent,並充分利用 Mistral-Nemo (120 億參數模型) 的能力,僅在單張 Viper 卡上高效運行,功耗僅 45W,實現安全的本地 AI 處理,無需傳統基礎設施的複雜性與高成本。  

高登智慧技術長林志哲博士表示,高登智慧先進的自然語言處理解決方案,與 Viper 原生 BF16 結構化語言模型支持的協同,使用原生模型,無需額外壓縮處理,即可提供高精度的資料庫轉換生成結果。這不僅為尋求 AI 驅動數據庫分析的組織提供強大解決方案,同時也能確保數據安全並降低運營成本。這種軟硬體整合展示了功率效率、處理能力和安全性的完美平衡,特別適合需要本地處理與能源效率的工業與企業應用。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
聯電宣布配息2.85元!殖利率達6.5% 員工酬勞平均可得34.7萬元