中央社報導,中國的DeepSeek因標榜低成本也能訓練出強大AI模型,顛覆AI訓練不能沒有精密昂貴晶片的刻板印象,引發科技類股恐慌,輝達27日收盤重挫17%,創美股上市公司史上單日最大跌幅。


● 美科技類股慘遭血洗


華爾街日報指出,以科技類股為主的那斯達克綜合指數(Nasdaq Composite)下跌3.1%;標普500指數(S&P 500)上週締造歷史新高後下跌1.5%。許多公司損失達雙位數。甲骨文(Oracle)股價下跌14%,美超微(Super Micro Computer)下跌13%,晶片製造商博通(Broadcom)重挫17%。


道瓊斯市場數據(Dow Jones Market Data)顯示,27日的市場大浴血讓美國股市蒸發約1兆美元。美股今天的跌勢堪稱突如其來的逆風,因為自川普當選以來美股即處於歷史高位,投資人押寶新政府親商政策,同時享受AI類股漲勢的紅利。


● DeepSeek是什麼


紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦與經營的新創公司,目標是打造出與OpenAI的ChatGPT、Google的Gemini等相近的人工智慧(AI)科技。

DeepSeek在中國以吸引年輕AI人才著稱,提供高薪和參與尖端研究計畫機會,招攬頂尖大學的研究人員,幻方量化與DeepSeek均為中國企業家梁文鋒所經營。


● DeepSeek何以如此震撼


DeepSeek去年12月26日推出DeepSeek-V3這款大型語言模型,性能已可與OpenAI和Google等美企旗下優秀的聊天機器人媲美,單這點已讓外界驚艷。然而DeepSeek在一份說明技術構建的研究論文裡稱他們訓練AI所用晶片數量遠少於其他美企後,猶如引發地震。


全球一些頂尖企業用超級電腦訓練聊天機器人時動輒得用上至少1.6萬片晶片,然而DeepSeek工程師們說他們僅使用約2000片輝達(Nvidia)晶片。


此外,自從2022年底OpenAI掀起旋風以來,「不動輒重砸數十億美元沒法訓練出強大AI系統」始終是主流觀點,也予人唯有像微軟、Google、Meta等科技巨擘才玩得起先進AI、輝達這類AI晶片廠將一片光明的印象。

然而DeepSeek稱他們僅花費約560萬美元和相對原始的運算能力訓練自家系統,這比Meta建構旗下最新AI所花資金便宜約10倍,引來AI產業反思是否真有必要砸天文數字的資金、AI產業是否將泡沫化等。


● DeepSeek是如何辦到使用較少晶片


美國的頂尖AI工程師們表示,DeepSeek的研究論文提出一些讓人印象深刻的巧思來降低晶片使用量,簡言之就是種讓晶片分析數據時更有效率。


先進AI系統需歸納文字、圖片、影音等大量數據來學習技能,DeepSeek則把這些數據分析工作分配給多個不同模型,每個模型負責特定領域,如此一來維持高效數據處理的同時還縮短運算時間。這種方法之前不是沒有人用過,只是沒法像DeepSeek用更少的運算能力做到。


精通建構高效AI系統的卡內基美隆大學(CMU)電腦科學教授戴特摩斯(Tim Dettmers)說:「現在看顯然除OpenAI這類公司外,其他人也能玩。DeepSeek使用的方法人人都能依樣畫葫蘆。」


● DeepSeek技術真能媲美OpenAI、Google嗎


根據一些標準基準測試,DeepSeek-V3一如市場現有的同類產品,即能有效地答覆詢問、解決邏輯問題並自行做編程。


就在DeepSeek公布自身技術前,OpenAI才揭櫫一款名為OpenAI o3的新系統,效能似乎比DeepSeek-V3更強,只是還沒對外推出。OpenAI o3的設計是能對數學、科學和電腦程式等問題「推理」;一些專家認為,DeepSeek還不具備這種未來AI趨勢的推理能力。


然DeepSeek旋即在1月20日發布自家推理模型DeepSeek-R1,終於引發投資圈和其他人因意識到DeepSeek帶來的影響性而於這週末陷入恐慌。

 

DeepSeek創辦人梁文鋒(右)。翻攝CCTV
DeepSeek創辦人梁文鋒(右)。翻攝CCTV

● 對DeepSeek的質疑


華爾街日報指出,幾名晶片分析師今天對DeepSeek能以如此低的成本構建出與美國先進AI模型相匹敵產品的說法提出質疑。研究機構伯恩斯坦(Bernstein)分析師瑞斯岡(Stacy Rasgon)仍不認為「DeepSeek是以500萬美元打造出OpenAI」。


花旗(Citi)分析師馬里克(Atif Malik)則表示「雖然DeepSeek的成就具突破性,但我們對它能在不使用先進GPU進行優化下依然能繳出成果的說法抱持懷疑」。


此外,美國財經新聞網CNBC指與其他中國聊天機器人一樣,DeepSeek在被問及某些敏感話題時有侷限性,例如問它關於中國領導人習近平一些政策時,DeepSeek似乎會迴避。


● 美國的晶片禁令難道沒用嗎


為維持美國在全球AI競賽領先地位,之前拜登政府限制向中國和其他競爭對手出售高性能晶片。DeepSeek的表現引發外界質疑,會否這些限制手段反迫使中國研究人員利用網上各種免費工具發揮創意。


有些專家依然支持美國做法,稱很多限制措施是近期才上路,遏止住中國研發AI的效果會隨時間益發增強。


但DeepSeek的突破仍給川普新政府一道難題:得考慮是否不僅要維繫拜登政府後期推動的晶片禁令,甚至還要加大掐脖力道,像是連輝達降階版的H20晶片都不能賣給中國。美國一些國會議員今天已呼籲川普政府實施更嚴格的出口管制,進一步限縮中國在AI取得進展。


● 何謂開源AI


與許多公司一樣,DeepSeek也把自身最新的AI系統「開源」(open sourced),即把支撐AI的運算代碼公開給其他企業和研究人員,讓所有人都能使用這些技術來建構、推廣自己的產品。DeepSeek與其他中國企業能如此迅速拿出具競爭力的AI產品,部分也是受惠於他人開源。


開源於AI世界興起是在2023年,Meta免費分享名為Llama的系統。當時許多人認為只有像Meta這種擁有靠專門晶片支撐大數據庫的公司繼續分享,開源生態才能蓬勃。但DeepSeek證明,就算沒有美國科技巨擘,開源生態照樣能有聲有色。


不少專家認為美國大公司不該開源自身技術,以免被用於散播假訊息或造成其他嚴重損害;一些美國議員已在探究立法設限的可行性。


但另有專家認為,如果在美限制開源,中國反將獲益,因為若好的開源技術都來自中國,日後反變成美國的研究人員和公司靠中國的技術發展自身系統。長此以往會讓中國成為AI研發領域的核心,進一步加速北京全面構建AI,包括無人武器等軍事系統。


● DeepSeek讓美警覺 其他國家則受鼓舞


華爾街日報指出,並非所有人都認為DeepSeek將顛覆AI產業。分析師瑞斯岡表示,儘管DeepSeek可能找出降低AI訓練成本的方法,但隨AI需求持續飆升,科技公司仍需更多的算力,不愁晶片賣不出,「DeepSeek會是AI產業生態的末日嗎,我們不覺得」。


不過DeepSeek的成功,可能重塑AI發展的全球競爭格局,讓美國以外的國家感到振奮。


像法國政府今天就表示,DeepSeek證明只要業者靈活具備巧妙技術,縱使資金少或無法獲得頂級晶片,照樣能在AI世界逐鹿中原。法國的官員就認為,不僅中國有機會,歐洲和世界其他地區也有機會追上矽谷。

 


點擊閱讀下一則新聞 點擊閱讀下一則新聞
OpenAI:已掌握證據顯示DeepSeek盜用其訓練模型