導(dǎo)語(yǔ):國(guó)產(chǎn)開(kāi)源大模型DeepSeek-V3近日在全球AI行業(yè)引發(fā)廣泛關(guān)注與熱議。該模型的預(yù)訓(xùn)練成本很低,但表現(xiàn)卻極為突出。不少AI大佬,如OpenAI創(chuàng)始成員Andrej Karpathy和英偉達(dá)高級(jí)研究科學(xué)家Jim Fan都下場(chǎng)點(diǎn)贊。但也有人質(zhì)疑該模型是基于ChatGPT輸出內(nèi)容訓(xùn)練,是現(xiàn)有優(yōu)化技術(shù)的集成。《每日經(jīng)濟(jì)新聞》采訪到多名業(yè)內(nèi)人士,對(duì)這款國(guó)產(chǎn)模型背后的技術(shù)進(jìn)行詳細(xì)解析。(封面圖:AI生成)