每日經濟新聞 2025-01-27 17:43:41
近期,DeepSeek力壓ChatGPT登頂美區(qū)App Store免費榜;1月25日,AMD宣布全新的DeepSeek-V3模型已集成至AMD Instinct GPU上。受此影響,今日國內DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領漲;算力硬件股持續(xù)走低。分析認為,DeepSeek的低成本意味著大模型對算力投入的需求可能會從訓練側向推理側傾斜,這可能會對英偉達等硬件商的市場地位和戰(zhàn)略布局產生影響。
每經記者 楊建 每經編輯 趙云
今日A股市場迎來龍年收官戰(zhàn),三大指數(shù)走勢分化明顯,收盤滬指跌0.06%,創(chuàng)業(yè)板指跌2.73%,收報2063.82點。滬深兩市成交額達到11179億元,較上周五縮量1041億。
值得注意的是,一邊是DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領漲。另一邊,算力板塊的銅高速連接、CPO等方向則紛紛領跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
這是為何?
據了解,上述反常現(xiàn)象背后,主要源于“國產AI之光”的大模型DeepSeek力壓ChatGPT,登頂美區(qū)App Store免費榜,在國內App Store免費榜同樣位居第一。在美區(qū)App Store免費榜Top100中,DeepSeek和ChatGPT躋身前三。DeepSeek霸榜美國應用商店,展現(xiàn)出中國應用程序驚人的影響力。
據悉,DeepSeek推理大模型DeepSeek-R1發(fā)布已經過去近一周時間,開源模型DeepSeek-V3也已經發(fā)布了近一個月。DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數(shù)模型的訓練,成本僅為557.6萬美元,遠低于其他頂級模型如GPT-4的10億美元。
受此利好影響,國內DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領漲,甚至連與DeepSeek關聯(lián)的股東、合作伙伴都被市場挖掘出來炒作一番。
對此,排排網財富研究部副總監(jiān)劉有華告訴《每日經濟新聞》記者,AI大模型領域近年來吸引了大量資本投入,盡管大模型在性能上取得了突破,但仍面臨技術瓶頸與應用落地方面的挑戰(zhàn)。大模型訓練需要巨額算力支持,而當前市場中算力資源的過剩使得成本問題凸顯。國際競爭與政策影響,這進一步加劇了AI產業(yè)鏈的不確定性。AI應用后期的投資機會廣泛且多樣,從算力基礎設施到行業(yè)應用,再到生成式AI和端側AI,均展現(xiàn)出強勁的增長潛力。
1月25日,英偉達的“競爭對手”AMD火速為DeepSeek“站臺”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。DeepSeek-V3模型的突破顯著降低了AI培訓成本,使AMD GPU成為比英偉達更具有成本效益的替代品。
國內A股市場也迅速做出反應,今日算力硬件股持續(xù)走低,銅高速連接、CPO等方向領跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
OpenAI的成功是以規(guī)模作為大模型的制勝法寶,但是這種“軍備競賽”型的模式,帶來了驚人的訓練成本,不少公司難以為繼。甚至連臉書母公司Meta也來偷師學藝,據澎湃新聞報道,1月27日,臉書母公司Meta成立了四個專門研究小組來研究量化巨頭幻方量化旗下的國產大模型DeepSeek的工作原理,并基于此來改進旗下大模型Llama。
黑崎資本首席戰(zhàn)略官陳興文告訴記者,DeepSeek的低成本意味著大模型對算力投入的需求可能會從訓練側向推理側傾斜,即未來對推理算力的需求將成為主要驅動力。而英偉達等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓練側,這可能會對其市場地位和戰(zhàn)略布局產生影響。DeepSeek此次大規(guī)模開源行動引發(fā)的行業(yè)震動,本質上是技術浪潮對傳統(tǒng)AI研發(fā)范式的結構性沖擊。
陳興文指出,DeepSeek通過MIT協(xié)議開源8個核心模型并全鏈路公開訓練細節(jié),其以“技術裸奔”姿態(tài)重構了行業(yè)競爭規(guī)則——開源生態(tài)的透明性不僅打破閉源體系的技術黑箱壟斷,更通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級迭代能力。這種開源策略直接顛覆硅谷“算力軍備競賽”邏輯,使得DeepSeek低成本大模型對算力投入的需求可能會從訓練側向推理側傾斜,即未來對推理算力的需求將成為主要驅動力。而英偉達等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓練側,這可能會對其市場地位和戰(zhàn)略布局產生影響。
模型在557萬美元超低成本下實現(xiàn)性能突破,證明算法創(chuàng)新可對沖硬件劣勢,為算力受限地區(qū)開辟新路徑。尤其在地緣技術博弈加劇的背景下,DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,結合強化學習替代監(jiān)督微調的技術突破,成功將硬件約束轉化為算法創(chuàng)新驅動力,這種逆境突圍重新定義了全球AI競爭格局,這種技術范式的轉變正在催生產業(yè)鏈價值重構。
在算力基建層面,模型訓練從粗放型算力堆砌轉向精細化能效管理,倒逼數(shù)據中心向綠色高效轉型。數(shù)據要素價值隨之凸顯,特定領域的行為數(shù)據、專業(yè)語料庫成為模型優(yōu)化的戰(zhàn)略資源,驅動數(shù)據采集、清洗、標注產業(yè)升級。更深遠的影響體現(xiàn)在AI應用生態(tài):開源模型大幅降低技術準入門檻,使得中小企業(yè)能快速部署智能客服、自動化文檔處理等輕量化應用,而模型輕量化與邊緣計算結合,正加速AI能力向物聯(lián)網終端滲透,為智能家居、工業(yè)物聯(lián)網等場景創(chuàng)造落地條件。
陳興文表示,當前全球算力市場正陷入“結構性過剩與短缺并存”的困境。中國市場中,大量跨界資本涌入智算中心建設,導致2024年全國建成超1.3萬個智算中心,但平均利用率不足30%,千卡集群年虧損達2700萬元。這種過剩本質上是低端算力(如A100芯片集群)的盲目擴張與高端智能算力(H100/H800)短缺的疊加結果——實際需求端,大模型訓練所需的智能算力缺口達53%,更深層矛盾在于技術迭代速度遠超硬件建設周期,當企業(yè)耗時18個月建成智算中心時,市場主流芯片已從A100升級至H800,設備貶值率超40%。
這種粗放式擴張反襯出DeepSeek技術路線的顛覆性:其僅用2048塊H800顯卡、557萬美元成本便訓練出性能對標GPT-4o的模型,通過MLA架構和強化學習飛輪機制,將訓練效率提升至Meta Llama3的11倍,百萬Token推理成本壓至0.55美元(僅為OpenAI的3.6%)。這種“算法優(yōu)化對沖硬件約束”的模式,不僅證明尖端AI發(fā)展無需依賴無限堆砌算力,更直接動搖了美國技術霸權的根基。
陳興文表示,DeepSeek的崛起之所以被稱為“美股最大威脅”,源于其對美國AI商業(yè)邏輯與芯片霸權的雙重解構。技術層面,其開源策略(MIT協(xié)議開放8個模型權重及全鏈路訓練細節(jié))形成全球開發(fā)者協(xié)同創(chuàng)新的“開源飛輪”,相較OpenAI閉源模式展現(xiàn)出指數(shù)級迭代優(yōu)勢,吸引Meta、Google工程師反向研究其RL技術框架。
產業(yè)層面,其通過算法創(chuàng)新實現(xiàn)低算力依賴,削弱了英偉達高端GPU的不可替代性,導致市場重估英偉達估值邏輯,引發(fā)其股價單日暴跌5.8%,連帶日本芯片測試設備商Advantest市值蒸發(fā)8.6%。
地緣博弈層面,DeepSeek驗證了中國AI企業(yè)“用架構創(chuàng)新壓縮技術代差”的可能性,紐約時報評價其“使美國芯片封鎖淪為戰(zhàn)略敗筆”,周鴻祎更直言這是“中國突破硅谷技術鐵幕的里程碑”。資本市場對此劇烈反應:納斯達克期貨下跌1.9%,反映投資者重新評估全球AI產業(yè)權力結構。
陳興文表示,這場變革的本質是AI競爭從“資本密集型”向“創(chuàng)新密集型”的范式遷移。短期算力過剩實則是低端產能出清的前奏,DeepSeek的技術路徑預示未來算力市場將兩極分化:通用算力加速淘汰,智能算力向算法優(yōu)勢企業(yè)集中。
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP