每日經濟新聞 2025-02-26 19:11:46
每經記者 宋欣悅 每經編輯 陳柯名 蘭素英
2月26日,DeepSeek宣布開源支持稠密和MoE模型的DeepGEMM(通用矩陣乘法)計算庫,可為V3/R1模型的訓練和推理提供強大支持。
圖片來源:X
DeepGEMM最大的特點就是簡潔高效,僅有300行核心代碼。但在性能上,DeepGEMM的表現非常出色,在某些情況下甚至能夠超越專家精心調優的計算庫,可以說是極致榨干GPU的性能潛力。
據介紹,DeepGEMM庫具有以下特征:
1.同時支持密集布局和兩種MoE(混合專家模型)布局;
2.使用CUDA(統一計算架構)編寫,無需編譯即可安裝;
3.完全即時編譯,即用即跑;
4.專為NVIDIA Hopper張量核心設計;
5.使用CUDA核心兩級累加解決FP8張量核心累加不精確的問題。
GEMM是線性代數中的基本運算,是科學計算、機器學習、深度學習等領域中最常見的計算操作,也是許多高性能計算任務的核心。簡單來說,它計算兩個數據表格(矩陣)相乘的結果。這看似簡單,但在AI計算中,這些矩陣可能非常龐大,含有數百萬個元素,使得矩陣乘法成為整個系統中最耗時的部分之一。
然而,這樣的解釋對于非專業人士而言,仍然不夠通俗易懂。《每日經濟新聞》記者讓DeepSeek-R1模型用生活場景中的示例,把DeepGEMM講得明明白白。
在DeepGEMM計算庫開源的前一天,據外媒報道,DeepSeek計劃提前發布其新一代AI模型R2。據知情人士透露,R2原定于5月初發布,但現在公司希望盡快推出。據悉,新模型將在編程能力和多語言推理方面有所提升。
此前,有行業人士在Reddit中發帖表示,“DeepSeek-R2將是一次優化飛躍,而不是算法飛躍。如果說DeepSeek證明了什么,那就是他們解決優化問題的能力。”
事實上,自2月21日DeepSeek官宣將啟動“開源周”以來,英偉達股價一直“跌跌不休”,三個交易日(指的是21日、24日和25日)已經累跌近10%。
而美東時間周三(北京時間2月27日凌晨)美股盤后,英偉達還將公布2025財年第四季度財報。這份號稱是“宇宙最重要的財報”也是今年1月末DeepSeek橫空出世后,英偉達公布的首份財報。
那么,在DeepSeek的沖擊下,黃仁勛是否能夠交出一份令人滿意的答卷?DeepSeek的崛起對于英偉達而言,又會有什么影響?
帶著上述問題,我們請出了DeepSeek,看看這位“當事人”是怎么解讀的。
不僅如此,DeepSeek還給了一份“賽博韭菜味”的輕松解讀:
看來
不管是一本正經分析行業趨勢
還是玩創意腦洞
DeepSeek統統拿捏!?
但Please!!!
別再“服務器繁忙,請稍后再試”了
還好這個App火速前來“救場”?
最近,這個App接入了DeepSeek
響應速度快到飛起,使用起來非常絲滑!
不管是問公司、問投資、問基金,還是自由對話,都輕松拿捏!
目前使用量已經超14萬次了!
咋用呢?超簡單!
先下載這個App
http://www.uoper.xyz/corp/2016app/index.html
再往下看
↓
一、在每日經濟新聞App首頁,點擊“DeepSeek”圖標或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。
二、進入“每經大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。
最近,每經“136計劃”還增加了新功能:
大模型解讀投資熱榜。
只需點擊投資熱榜中的任意新聞
立即就能得到大模型的全面分析
還能一鍵生成圖片分享給朋友。
告別“服務器繁忙”
快用每日經濟新聞App吧!
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
記者|宋欣悅??
編輯|陳柯名?蘭素英?杜恒峰
校對|金冥羽
|每日經濟新聞 ?nbdnews??原創文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP