每日經濟新聞 2025-02-07 08:34:20
每經AI快訊,中信建投研報稱,1)DeepSeek在保持模型優異性能指標的同時大幅降低訓練和推理成本。DeepSeek-V3使用2048塊H800GPU完成了6710億參數的訓練,訓練成本為557.6萬美元,DeepSeek-R1模型的每百萬輸出tokens為16元,均顯著低于同等水平的模型成本。利用DeepSeek模型生成的數據樣本實現小參數量的模型蒸餾,提升模型性能。2)高性能、輕量化、低成本的模型能力將顯著推動端側AI產業發展。端側硬件設備是將大模型能力進行實物化輸出落地的關鍵環節,近日OpenAI的CEO Sam Altman在接受媒體采訪時也透露OpenAI將開發可替代手機的生成式AI專用終端。國內物聯網模組廠商在端側AI領域具備先發優勢,并積極進行產業布局。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP