要聞

專訪FutureLabs首席專家胡延平：DeepSeek沖擊下算力需求反而會增強，智能體將“井噴”，電腦手機端側模型已數以億計

每日經濟新聞 2025-02-13 14:51:58

近日，中國AI初創公司深度求索（DeepSeek）訓練出性能可與海外頭部企業模型相媲美的模型，吸引全球目光。該模型降低了算力需求，但FutureLabs未來實驗室首席專家胡延平在接受每經記者采訪時指出，算力與硬件仍在增強。他同時提到，低成本、高效能的技術創新，促使思考和重估算力基礎設施投資，AI應用進入快速導入期。未來，AI將走向內生智能和自主智能。

每經記者宋欣悅每經編輯蘭素英

近日，中國AI初創公司深度求索（DeepSeek）用“白菜價”的成本，訓練出性能可與海外頭部企業OpenAI和谷歌旗下頂尖模型相媲美的模型，成功吸引了全球的目光。

百度創始人李彥宏在World Governments Summit 2025峰會上稱，如今，每12個月，大模型的推理成本就可以降低90%以上。OpenAI首席執行官薩姆·奧爾特曼（Sam Altman）表示，隨著AI成本的持續下降，AI將得到更頻繁的使用。

目前，包括華為、榮耀、OPPO、魅族在內的眾多國產手機均已官宣接入DeepSeek-R1。此外，吉利、極氪、寶駿等車企也宣布完成與DeepSeek模型的深度融合。

盡管DeepSeek在提高AI模型效率方面取得了突破，但李彥宏仍然堅持認為，持續投資AI基礎設施對于保持競爭力至關重要。奧爾特曼也表示，對AI基礎設施進行大規模投資“仍然很重要”。

DeepSeek有哪些創新點？隨著模型訓練成本的降低，AI應用開發是否將迎來類似“安卓時刻”的爆發？未來的AI發展又將走向哪些方向？

胡延平圖片來源：受訪者供圖

針對上述疑問，《每日經濟新聞》記者（以下簡稱NBD）專訪了FutureLabs未來實驗室首席專家胡延平。他認為，Deepseek幾乎每一個有所突破的方向都不是首創，但DeepSeek在這幾個重要方向都有進一步創新。

他提到，盡管DeepSeek的模型降低了算力需求，但胡延平強調，算力與硬件不僅沒有被削弱，反倒在增強，總體趨勢是算力需求依然呈現大幅增長。

對于DeepSeek及其他低成本、高效能、開源模型帶來的影響，胡延平指出，以基座模型為基礎，后訓練、微調以及與檢索增強生成（RAG）、智能體（Agent）等結合的個性化垂類模型及其應用場景，很快將成為一個數量龐大的后市場。

對于AI的未來發展方向，胡延平認為，通用人工智能（AGI）、超級人工智能（ASI）不是終極目標，也不是根本目的。如果以更長的時間尺度來看，目前的AI，未來將走向內生智能（EI），更遠的將來是自主智能（II）。

DeepSeek沖擊下算力需求反而會增強

NBD：DeepSeek旗下模型因低算力訓練和強推理能力引發了熱議。從技術上來講，您認為DeepSeek有哪些創新？

胡延平：DeepSeek幾乎每一個有所突破的方向都不是首創，但DeepSeek在這幾個重要方向都有進一步創新。

一是全球最大體量的開源混合專家模型（MoE），且內置中樞小模型；二是預訓練FP8與FP32混合精度，既節約算力又確保了模型的高性能；三是采用結果激勵，而不是過程激勵的強化學習后訓練機制，催生了模型的長思考多步推理能力；四是高效蒸餾技術；五是多頭注意力機制；六是多Token預測；七是匯編PTX（并行線程執行），提高算力效率。

DeepSeek的V3和R1處在大語言模型（LLM）AI 2.0初始周期的一線水平，追平了OpenAI的GPT-4o，具備o1的部分能力。但不及o3系列，且沒有多模態能力，也不能進行語音交互等，所以還不算是全球領先水平。

NBD：您認為DeepSeek低成本、高效能的技術創新，將對英偉達等依賴高端GPU的公司產生怎樣的影響？

胡延平：大語言模型的單位智能的訓練和推理成本一直在持續降低，DeepSeek的貢獻是這個趨勢的一部分，促使思考和重估算力基礎設施投資。英偉達股價受到影響，已經有所下調，但是正在到來的多模態、時空智能、面向物理現實世界的模型更吃算力。實質上，包括DeepSeek在內的AI大模型的用戶數量正在大幅增長，AI應用進入快速導入期，推理這個部分的算力需求呈現增長。

算力與硬件不僅沒有被削弱，反倒在增強。總體趨勢是算力需求依然呈現大幅增長，AI賦能導致硬件復興。具備一定算力和聯網能力的智能終端正在成為AI超級入口。

圖片來源：視覺中國

NBD：隨著DeepSeek-V3等低成本大模型的問世，傳統的大規模數據中心和高投入大模型訓練是否仍然值得繼續推進？

胡延平：AI數據中心（AIDC）建設應需而建，整體上依然在增加。

AI大模型的發展表現為兩條曲線，一條向上，數據資源投入增加、原理進化、從LLM走向基于感知理解的物理現實世界模型，帶來更強的智能，是走向AGI、ASI的必由之路。另一條曲線向下，芯片能效比、模型量效比變化等，帶來訓練和推理的單位智能的產生與使用成本下降。

但是由于智能水準提升，擁有更強、更好、更多的智能，總體上意味著算力能源等總體消耗上升。AI大模型發展的“雙曲線”特征，不僅是AI經濟學，也是AI大模型技術產品市場演進的底部規律之一。

后訓練、智能體等后市場將“井噴”

NBD：目前，DeepSeek-R1在GitHub上的開發者點贊數量已經超過Llama。DeepSeek激發創新競爭之后，您認為AI應用開發是否將迎來類似“安卓時刻”的爆發？

胡延平：AI大模型不再只來自頭部少數幾家企業。以基座模型為基礎，后訓練、微調以及與檢索增強生成（RAG）、智能體（Agent）等結合的個性化垂類模型及其應用場景，很快將成為一個數量龐大的后市場。不同開源模型相互結合的變體也會有一堆。之前主要是為數不多的幾家頭部模型。在后市場，很快會看到產業腰部的出現和長尾的涌現，生態成型，涌現在即。

NBD：花旗研報認為，DeepSeek和其他中國模型的高效低成本將有助于加速全球AI應用開發，并可能在全球引發更多技術創新，從而推動今年AI應用的拐點。現在，經過R1微調的70億參數小模型能夠在個人筆記本中運行，這是否意味著開發者可以更輕松地進行本地化部署，推動更多創新型應用的誕生？

胡延平：實際上我就在電腦里安裝運行了R1-Distill-Llama-70B，我安裝的體量最大的模型是Mistral-123B，只不過速度比較慢。

開源端側模型同等體量下的智能水平越來越高，不僅使得各行業和企業更有積極性部署在各自業務場景，也使得個人用戶的普遍使用成為可能。實際上，個人手機、電腦里的端側模型已經數以億計。這些模型賦能各類應用，生發出極有活力的創新場景。

圖片來源：視覺中國-VCG41N1472123004

AI的下一站：內生智能，現實、感知會越來越重要

NBD：在您看來，未來的AI發展將走向哪些方向？

胡延平：從2020~2050年，如果以更長的時間尺度來看，目前的AI，未來將走向內生智能（EI），更遠的將來是自主智能（II）。AI學習知識、AI開始思考、AI睜開眼睛和AI感知世界，是AI發展的四進階。AI的生成能力、工作能力和行為能力將基于以上四個方面進化。現實、感知會變得越來越重要。

通用人工智能（AGI）、超級人工智能（ASI）不是終極目標，也不是根本目的。模型完成新任務的能力，Agent完整執行工作流的能力，智能體內生自主的理解現實的行為能力，是智能進化所追求的方向。提升智能本身的水準，發展腦能力，始終是智能發展到第一性原理。原理意味著原力，原力領域會有真正的創新。

NBD：您剛才提到大模型發展的“雙曲線”理論，向上是追求通用智能，向下是優化算力和效率。您認為AI進化中的“向下曲線”和“向上曲線”各自面臨哪些挑戰？

胡延平：向下的曲線是有下限的，曲線向下的走勢主要取決于這兩方面的變化，芯片算力的能效比、模型的量效比。而推動向上的曲線，有賴于模型新原理探索、芯片算力的摩爾定律、模型訓練的規模法則（Scaling Law）以及感知智能的到來。

智能汽車等從自動駕駛走向場景智能，機器人等具身智能領域，可能更加會促使視覺理解走向現實、感知智能，比LLM這條線一路走來的AIGC派更可能激發時空智能，催生出未來的物理世界模型。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。