CNBC報導,China 的 DeepSeek 推出其 AI 模型供商業免費使用,並公開了從零開始構建該模型的技術細節。該公司表示,在開發該模型時,僅在 AI 晶片上的花費約 600 萬美元(約 1.9 億元台幣)。
雖然一些人對這一數字的準確性提出質疑,但相較於美國科技公司投入數億甚至數十億美元開發 AI 模型,這一成本顯得極具競爭力。
這一進展可能開啟了印度 AI 模型研發的起點,因為以往訓練大型語言模型通常需要數千顆耗能高且昂貴的 AI 晶片。此外,這可能也為印度科技企業帶來重大轉折點,像是 Infosys 這類公司過去主要依賴美國科技公司開發的 AI 模型。
商業轉型公司 WNS 表示,DeepSeek 的 AI 模型對於印度科技企業而言是一項「關鍵進展」。這種低成本研發模式將使印度能夠訓練新的 AI 模型,以支援印度各地區語言。
目前市面上的大型語言模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,主要支援有限幾種語言。
但現在透過運用 DeepSeek 的技術創新,這些企業可以顯著降低成本,加快市場推廣速度。」
產業調查顯示,資料隱私與高昂成本是企業遲遲不採用 AI 技術的主要因素之一。如果 DeepSeek-R1 的優勢能夠得到驗證,將可迅速消除這些顧慮,並解決更多 AI 應用的難題。
印度政府目前也在推動 AI 晶片的補助計畫,以幫助學術界與新創企業發展 AI 模型。
此外,印度 IT 服務公司也可能間接受益於 DeepSeek。分析師預計,這些 IT 公司的大型企業客戶可能會將部分預算從 AI 研發轉向其他 IT 領域。