亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

專訪FutureLabs首席專家胡延平:DeepSeek沖擊下算力需求反而會增強,智能體將“井噴”,電腦手機端側模型已數以億計

每日經濟新聞 2025-02-13 14:51:58

近日,中國AI初創公司深度求索(DeepSeek)訓練出性能可與海外頭部企業模型相媲美的模型,吸引全球目光。該模型降低了算力需求,但FutureLabs未來實驗室首席專家胡延平在接受每經記者采訪時指出,算力與硬件仍在增強。他同時提到,低成本、高效能的技術創新,促使思考和重估算力基礎設施投資,AI應用進入快速導入期。未來,AI將走向內生智能和自主智能。

每經記者 宋欣悅    每經編輯 蘭素英    

近日,中國AI初創公司深度求索(DeepSeek)用“白菜價”的成本,訓練出性能可與海外頭部企業OpenAI和谷歌旗下頂尖模型相媲美的模型,成功吸引了全球的目光。

百度創始人李彥宏在World Governments Summit 2025峰會上稱,如今,每12個月,大模型的推理成本就可以降低90%以上。OpenAI首席執行官薩姆·奧爾特曼(Sam Altman)表示,隨著AI成本的持續下降,AI將得到更頻繁的使用。

目前,包括華為、榮耀、OPPO、魅族在內的眾多國產手機均已官宣接入DeepSeek-R1。此外,吉利、極氪、寶駿等車企也宣布完成與DeepSeek模型的深度融合。

盡管DeepSeek在提高AI模型效率方面取得了突破,但李彥宏仍然堅持認為,持續投資AI基礎設施對于保持競爭力至關重要。奧爾特曼也表示,對AI基礎設施進行大規模投資“仍然很重要”。

DeepSeek有哪些創新點?隨著模型訓練成本的降低,AI應用開發是否將迎來類似“安卓時刻”的爆發?未來的AI發展又將走向哪些方向?

胡延平 圖片來源:受訪者供圖

針對上述疑問,《每日經濟新聞》記者(以下簡稱NBD)專訪了FutureLabs未來實驗室首席專家胡延平。他認為,Deepseek幾乎每一個有所突破的方向都不是首創,但DeepSeek在這幾個重要方向都有進一步創新。

他提到,盡管DeepSeek的模型降低了算力需求,但胡延平強調,算力與硬件不僅沒有被削弱,反倒在增強,總體趨勢是算力需求依然呈現大幅增長。

對于DeepSeek及其他低成本、高效能、開源模型帶來的影響,胡延平指出,以基座模型為基礎,后訓練、微調以及與檢索增強生成(RAG)、智能體(Agent)等結合的個性化垂類模型及其應用場景,很快將成為一個數量龐大的后市場。

對于AI的未來發展方向,胡延平認為,通用人工智能(AGI)、超級人工智能(ASI)不是終極目標,也不是根本目的。如果以更長的時間尺度來看,目前的AI,未來將走向內生智能(EI),更遠的將來是自主智能(II)。

DeepSeek沖擊下算力需求反而會增強

NBD:DeepSeek旗下模型因低算力訓練和強推理能力引發了熱議。從技術上來講,您認為DeepSeek有哪些創新?

胡延平:DeepSeek幾乎每一個有所突破的方向都不是首創,但DeepSeek在這幾個重要方向都有進一步創新。

一是全球最大體量的開源混合專家模型(MoE),且內置中樞小模型;二是預訓練FP8與FP32混合精度,既節約算力又確保了模型的高性能;三是采用結果激勵,而不是過程激勵的強化學習后訓練機制,催生了模型的長思考多步推理能力;四是高效蒸餾技術;五是多頭注意力機制;六是多Token預測;七是匯編PTX(并行線程執行),提高算力效率。

DeepSeek的V3和R1處在大語言模型(LLM)AI 2.0初始周期的一線水平,追平了OpenAI的GPT-4o,具備o1的部分能力。但不及o3系列,且沒有多模態能力,也不能進行語音交互等,所以還不算是全球領先水平。

NBD:您認為DeepSeek低成本、高效能的技術創新,將對英偉達等依賴高端GPU的公司產生怎樣的影響?

胡延平:大語言模型的單位智能的訓練和推理成本一直在持續降低,DeepSeek的貢獻是這個趨勢的一部分,促使思考和重估算力基礎設施投資。英偉達股價受到影響,已經有所下調,但是正在到來的多模態、時空智能、面向物理現實世界的模型更吃算力。實質上,包括DeepSeek在內的AI大模型的用戶數量正在大幅增長,AI應用進入快速導入期,推理這個部分的算力需求呈現增長。

算力與硬件不僅沒有被削弱,反倒在增強。總體趨勢是算力需求依然呈現大幅增長AI賦能導致硬件復興。具備一定算力和聯網能力的智能終端正在成為AI超級入口。

圖片來源:視覺中國

NBD:隨著DeepSeek-V3等低成本大模型的問世,傳統的大規模數據中心和高投入大模型訓練是否仍然值得繼續推進?

胡延平:AI數據中心(AIDC)建設應需而建,整體上依然在增加。

AI大模型的發展表現為兩條曲線,一條向上,數據資源投入增加、原理進化、從LLM走向基于感知理解的物理現實世界模型,帶來更強的智能,是走向AGI、ASI的必由之路。另一條曲線向下,芯片能效比、模型量效比變化等,帶來訓練和推理的單位智能的產生與使用成本下降。

但是由于智能水準提升,擁有更強、更好、更多的智能,總體上意味著算力能源等總體消耗上升。AI大模型發展的“雙曲線”特征,不僅是AI經濟學,也是AI大模型技術產品市場演進的底部規律之一。

后訓練、智能體等后市場將“井噴”

NBD:目前,DeepSeek-R1在GitHub上的開發者點贊數量已經超過Llama。DeepSeek激發創新競爭之后,您認為AI應用開發是否將迎來類似“安卓時刻”的爆發?

胡延平:AI大模型不再只來自頭部少數幾家企業。以基座模型為基礎,后訓練、微調以及與檢索增強生成(RAG)、智能體(Agent)等結合的個性化垂類模型及其應用場景,很快將成為一個數量龐大的后市場。不同開源模型相互結合的變體也會有一堆。之前主要是為數不多的幾家頭部模型。在后市場,很快會看到產業腰部的出現和長尾的涌現,生態成型,涌現在即。

NBD:花旗研報認為,DeepSeek和其他中國模型的高效低成本將有助于加速全球AI應用開發,并可能在全球引發更多技術創新,從而推動今年AI應用的拐點。現在,經過R1微調的70億參數小模型能夠在個人筆記本中運行,這是否意味著開發者可以更輕松地進行本地化部署,推動更多創新型應用的誕生?

胡延平:實際上我就在電腦里安裝運行了R1-Distill-Llama-70B,我安裝的體量最大的模型是Mistral-123B,只不過速度比較慢。

開源端側模型同等體量下的智能水平越來越高,不僅使得各行業和企業更有積極性部署在各自業務場景,也使得個人用戶的普遍使用成為可能。實際上,個人手機、電腦里的端側模型已經數以億計。這些模型賦能各類應用,生發出極有活力的創新場景。

圖片來源:視覺中國-VCG41N1472123004

AI的下一站:內生智能,現實、感知會越來越重要

NBD:在您看來,未來的AI發展將走向哪些方向?

胡延平:從2020~2050年,如果以更長的時間尺度來看,目前的AI,未來將走向內生智能(EI),更遠的將來是自主智能(II)。AI學習知識、AI開始思考、AI睜開眼睛和AI感知世界,是AI發展的四進階。AI的生成能力、工作能力和行為能力將基于以上四個方面進化。現實、感知會變得越來越重要

通用人工智能(AGI)、超級人工智能(ASI)不是終極目標,也不是根本目的。模型完成新任務的能力,Agent完整執行工作流的能力,智能體內生自主的理解現實的行為能力,是智能進化所追求的方向。提升智能本身的水準,發展腦能力,始終是智能發展到第一性原理。原理意味著原力,原力領域會有真正的創新。

NBD:您剛才提到大模型發展的“雙曲線”理論,向上是追求通用智能,向下是優化算力和效率。您認為AI進化中的“向下曲線”和“向上曲線”各自面臨哪些挑戰?

胡延平:向下的曲線是有下限的,曲線向下的走勢主要取決于這兩方面的變化,芯片算力的能效比、模型的量效比。而推動向上的曲線,有賴于模型新原理探索、芯片算力的摩爾定律、模型訓練的規模法則(Scaling Law)以及感知智能的到來。

智能汽車等從自動駕駛走向場景智能,機器人等具身智能領域,可能更加會促使視覺理解走向現實、感知智能,比LLM這條線一路走來的AIGC派更可能激發時空智能,催生出未來的物理世界模型。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

模型 Ai DeepSeek 人工智能 算力

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0