外媒《The Information》報導,知情人士透露DeepSeek(深度求索)即將推出最新模型R2,不過由於執行長梁文鋒仍對表現不滿意,將調整優化至梁文鋒認可後才會放行,日期未定。

報導指出,就算R2發布後的表現優於其他開源模型,中國雲端服務供應商恐怕也無法應付客戶需求,主因在於客戶目前多半是透過雲端上部署的輝達(NVIDIA)降規版AI晶片H20來運行上一代模型R1,但這些雲端服務供應商正面臨輝達晶片日益短缺問題。

報導指出,在美國一步步收緊對AI晶片的出口限制下,DeepSeek以相對受限的運算資源實現模型效率、R1模型年初推出後掀起外界對中國技術突破重圍的討論,但是美國4月針對輝達H20晶片祭出出口管制的效果正在發酵,凸顯中國仍高度依賴美國技術。

R1發布後,中國雲端服務供應商、開發者、國營企業、政府機構競相使用,這款模型以輝達的硬體和軟體進行訓練,在輝達晶片上運行表現最好,使R1和H20成了絕配。

為滿足需求,阿里巴巴、字節跳動、騰訊等中國企業今年前3個月訂了約120萬顆、總值高達160億美元(約4800億新台幣)的H20晶片;不過,美國出口管制粉碎了中國企業想要囤積更多H20的希望。輝達執行長黃仁勳曾表示須認列高達55億美元損失。

據中國雲端服務供應商員工的說法,DeepSeek和中國企業保持著聯繫、提供技術規格以協助企業規劃如何使用即將發布的R2模型,包含須「準備足夠數量的H20晶片」。

根據中央社,中國企業目前僅能仰賴現有的H20庫存,這將限縮R2的使用。儘管華為和中國其他晶片商提供了輝達晶片的替代方案,但由於輝達晶片和DeepSeek模型的相容性,中國雲端服務供應商若改用中國製晶片,不僅模型效率會降低,管理上也將更為不易。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
韭菜出國當砲灰?中國擬派600士兵赴俄受訓