反倒是HPC晶片,由於本次禁令管制範圍擴張至A800、H800及L40S,預估中國大型雲端業者(CSP)ByteDance、Baidu、Ali及Tencent(BBAT)對NVIDIA的高階AI伺服器需求量將由原先大約占整體AI伺服器的5~6%;禁令後預估將進一步降低至3~4%以下。
需求面來看,TrendForce認為,儘管對中國CSP對高階AI伺服器需求被迫縮減,但短期內可能促使BBAT在緩衝期積極備貨庫存,而NVIDIA也會設法將目前緊缺的產能,如H800先設法挪給中國客戶使用。
長期來看,觀察美國自2022年連續祭出的AI晶片禁令,會加速具規模或技術能力的中國業者發展自主晶片的趨勢,如阿里巴巴旗下平頭哥發展ASIC、華為投入昇騰系列發展中國在地生態系等。此外,針對邊緣AI小型模型及推論晶片方面,相對效能需求較低,中國晶片業者如平頭哥、寒武紀等亦有加快投入趨勢。
從供應面來看,TrendForce預期,AI晶片業者(如NVIDIA、AMD等)亦將規劃符合美國禁令新規定的相關產品需求。未來在新規的驅動下,可能促晶片商發展更多元方案以因應全球地緣政治的侷促變化,例如發展更多TF16、TF32較中低階TFLOPS運算能力產品線,抑或往較大單顆晶圓面積(die size)發展,以降低如美國此波新禁令效能密度(Performance Density)需求。
此外,新禁令亦可能促中國主要客戶如BBAT或相關學研實驗室單位,可能將AI訓練運算資源透過租用中國以外地區模式,完成LLM模式基礎,另外在中國當地完成小型模型訓練或優化或AI推論等應用。此亦可能促NVIDIA更積極主推以A或H100 AI server為基礎的DGX cloud訂閱租賃模式,或拓展到如L40S其他的雲端服務,以提供給中國客戶,當然也能提供其他潛在有地緣政治風險地區的客戶使用。
爆料信箱:news@nextapple.com
★加入《壹蘋》Line,和我們做好友!
★下載《壹蘋新聞網》APP
★Facebook 按讚追蹤