亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

DeepSeek公開大模型高效訓練又一秘訣!這家公司盤中直線拉升7.5%,背后有什么聯系?

每日經濟新聞 2025-02-25 16:58:44

2月25日,DeepSeek宣布開源其DeepEP代碼庫,這是首個用于混合專家模型訓練和推理的開源專家并行通信庫。雖然EP技術能以較低的通信成本完成模型訓練,但中金認為,這種通信設計技術的進展并不一定會使高速通信的需求減少。值得注意的是,DeepEP代碼庫開源后半小時,兆龍互連股價一度拉升7.53%。這背后有無關聯?

每經記者 岳楚鵬    每經編輯 蘭素英    

2月25日,DeepSeek開源周第二波來襲。

DeepSeek宣布開源DeepEP的代碼庫。DeepEP是首個用于混合專家(MoE)模型訓練和推理的開源專家并行 (EP)通信庫。

和昨日開源的FlashMLA是核心技術MLA(多頭潛在注意力)的改進版本一樣,DeepEP也是DeepSeek-V3核心技術EP的改進版本。它提供高吞吐量和低延遲的全對全GPU內核,適用于MoE的分發(dispatch)和合并(combine)操作。 

DeepSeek聲稱,DeepEP的特點包括高效的全員溝通;節點內和節點間均支持NVLink和RDMA;用于訓練和推理預填充的高吞吐量內核;用于推理解碼的低延遲內核;原生FP8調度支持;靈活的GPU資源控制,實現計算-通信重疊。

 

圖片來源:X

DeepSeek的官方解釋不免有些技術流,《每日經濟新聞》記者邀請了DeepSeek模型來深入淺出地介紹下這一技術。

雖然EP技術能以較低的通信成本完成模型訓練,但中金在最新的研報中認為,這種通信設計技術的進展并不一定會使高速通信的需求減少。

中金認為,由于張量并行(TP)和專家并行(EP)的通信開銷比較沒有絕對的多少之分,受制于多種因素限制,因此在張量或專家并行的選擇上,需要具體問題具體分析,本質上都是現有硬件條件下的平衡。通信方面大量使用專家并行而減少張量并行并不能證明高速互聯需求在更強基礎模型訓練中呈下降趨勢。

值得注意的是,在DeepSeek宣布開源DeepEP軟件庫后半個小時,兆龍互連(300913.SZ)的股價直線拉升7.53%,但隨后回落,截至收盤,兆龍互聯報收于每股60.57元,下跌1.5%。

兆龍互連是一家什么樣的公司?和DeepSeek的開源有沒有關聯?

針對這一問題,每經記者使用了每日經濟新聞App的“問投資”功能尋找答案。

記者輸入兆龍互連的公司名后,頁面就彈出了股票趨勢、資金、機構和概念等十大維度。

記者點擊“概念”維度后,發現兆龍互連是一家涉足高速通信設備(銅纜高速連接)的公司。不過,DeepSeek認為兆龍互連的盤中快速反彈,是受短期情緒驅動的,并沒有直接證據表明兆龍互連的股價和這項技術的開源有聯系。


不得不說,在每日經濟新聞App里使用DeepSeek非常絲滑,不會碰見“服務器繁忙”的情況。目前使用量已經超14萬次了! 

咋用呢?超簡單!

先下載每日經濟新聞App

http://www.uoper.xyz/corp/2016app/index.html

再往下看

一、 在每日經濟新聞App首頁,點擊“DeepSeek”圖標或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。 

二、 進入“每經大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。 

最近,每經“136計劃”還增加了新功能: 

大模型解讀投資熱榜。  

只需點擊投資熱榜中的任意新聞。

立即就能得到大模型的全面分析。

還能一鍵生成圖片分享給朋友。


告別“服務器繁忙” 

快用每日經濟新聞App吧!

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

DeepSeek 模型 兆龍互連 銅纜高速連接

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

2

0