華泰證券：DeepSeek有望加速模型訓練與CUDA解耦

每日經(jīng)濟新聞 2025-02-21 08:03:02

每經(jīng)AI快訊，華泰證券研究認為，DeepSeek在V3中使用了相比CUDA更底層的PTX 來優(yōu)化硬件算法，PTX是CUDA編譯的中間代碼，在CUDA和最終機器碼之間起到橋梁作用。而NSA則使用了OpenAl提出的Triton編程語言高效編寫GPU代碼，Triton的底層可調用CUDA，也可調用其他GPU語言，包括AMD的rocm以及國產(chǎn)算力芯片語言，如寒武紀的思元590芯片和海光信息的深算一號（DCU）內(nèi)置的HYGON ISA指令集。LLM的訓練短期內(nèi)雖未完全脫離CUDA 生態(tài)，但DeepSeek NSA的推出使其初步呈現(xiàn)出與CUDA解耦的趨勢，并為后續(xù)適配更多類型的算力芯片奠定基礎。以異騰為代表的國產(chǎn)算力已經(jīng)很好的適配了DeepSeek-R1 等國產(chǎn)模型，并取得了高效推理的效果，華泰證券認為，伴隨海外算力的受限，針對國產(chǎn)算力的優(yōu)化或將有持續(xù)進展，值得重視。

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。