要聞

“閃電模型”接棒“耐力賽” 李開復(fù)：零一萬物絕不會放棄預(yù)訓(xùn)練模型工作

每日經(jīng)濟新聞 2024-10-16 23:11:58

◎10月16日，零一萬物正式發(fā)布了新的預(yù)訓(xùn)練模型Yi-Lightning（直譯為閃電模型）。選擇在此時發(fā)布新產(chǎn)品，或許是為了用實際行動回應(yīng)市場猜測。，零一萬物創(chuàng)始人兼CEO李開復(fù)在新品發(fā)布后接受包括《每日經(jīng)濟新聞》記者在內(nèi)的媒體采訪時表示，零一萬物絕不會放棄預(yù)訓(xùn)練模型工作。

每經(jīng)記者趙雯琪每經(jīng)編輯楊夏

發(fā)布千億參數(shù)模型Yi-Large 5個月后，零一萬物創(chuàng)始人兼CEO李開復(fù)再次帶著新產(chǎn)品公開亮相。

10月16日，零一萬物正式發(fā)布了新的預(yù)訓(xùn)練模型Yi-Lightning（直譯為閃電模型）。選擇在此時發(fā)布新產(chǎn)品，或許是為了用實際行動回應(yīng)市場猜測。前段時間，國內(nèi)大模型創(chuàng)業(yè)公司“六小虎”（智譜AI、百川智能、零一萬物、月之暗面、Minimax、階躍星辰）均受到不同程度的質(zhì)疑，零一萬物更是被直指放棄了預(yù)訓(xùn)練。

對此，零一萬物創(chuàng)始人兼CEO李開復(fù)在新品發(fā)布后接受包括《每日經(jīng)濟新聞》記者在內(nèi)的媒體采訪時表示，零一萬物絕不會放棄預(yù)訓(xùn)練模型工作。值得一提的是，在To B（企業(yè)端）戰(zhàn)略下，零一萬物首次發(fā)布了針對零售和電商等場景的行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人，并已在彈幕互動、商品信息提取、實時話術(shù)生成等環(huán)節(jié)接入了Yi-Lightning。

進入2024年，中國大模型行業(yè)從狂奔進入到了“長跑階段”。從技術(shù)側(cè)和產(chǎn)業(yè)側(cè)都引發(fā)了行業(yè)的進一步思考，頭部企業(yè)也開始探索更多商業(yè)化方向。今年8月，月之暗面創(chuàng)始人楊植麟開始將一部分精力放到B端業(yè)務(wù)上，他們正式發(fā)布了Kimi企業(yè)級API，以探索在B端的商業(yè)模式。百川智能則與國家兒童醫(yī)學(xué)中心北京兒童醫(yī)院簽署戰(zhàn)略合作協(xié)議，雙方計劃共同推出“一大四小”五款A(yù)I醫(yī)療產(chǎn)品。

李開復(fù)表示，中國大模型產(chǎn)業(yè)進入到了“耐力賽”階段，如何讓大模型賦能千行百業(yè)，提升企業(yè)新質(zhì)生產(chǎn)力是一個重要的命題。這不僅將牽涉到“大模型＋行業(yè)”的未來發(fā)展方向，甚至?xí)绊懯澜绲膭?chuàng)新版圖。

預(yù)訓(xùn)練成本一次三四百萬美金 “但零一萬物絕不會放棄”

據(jù)李開復(fù)分享，在LMSYS盲測競技場總榜（用戶對一組大模型回答進行盲投的榜單）上，零一萬物最新發(fā)布的Yi-Lightning位列第六，僅次于OpenAI的GPT-4o、o1系列，以及Google的Gemini 1.5 pro系列，并且與馬斯克xAI旗下Grok-2打平。這是中國大模型廠商目前在該榜單上取得的最好成績。

而這個新預(yù)訓(xùn)練模型的發(fā)布，也是李開復(fù)對于“零一萬物放棄預(yù)訓(xùn)練”市場傳言的回?fù)簟?/p>

他表示，GPT新發(fā)布o(jì)1之后，給零一萬物團隊帶來了新靈感，“一年半以前大家覺得大模型最厲害的地方就是預(yù)訓(xùn)練，一年以后發(fā)現(xiàn)Post train（后訓(xùn)練）也是同樣重要，感謝OpenAI點醒我們這一點。”不過，李開復(fù)提到，后訓(xùn)練的重要性變高，不代表要徹底放棄預(yù)訓(xùn)練。

根據(jù)公開信息，大模型預(yù)訓(xùn)練是在大規(guī)模數(shù)據(jù)集上進行的初步訓(xùn)練，旨在讓模型學(xué)習(xí)通用的語言知識和模式。而后訓(xùn)練則是在預(yù)訓(xùn)練的基礎(chǔ)上，針對特定任務(wù)進行的進一步優(yōu)化和調(diào)整，以使模型在該任務(wù)上表現(xiàn)更加出色。

李開復(fù)表示，他認(rèn)為做好預(yù)訓(xùn)練模型是一個技術(shù)活，而且是要非常多有才華的人在一起工作，慢工出細(xì)活，需要有懂芯片的人，懂推理的人，懂基礎(chǔ)架構(gòu)的人，懂模型的人，有很好的算法同學(xué)，一起做出來。不過他也坦言，不是每家公司都可以做這件事情，做這件事情的成本也比較高，以后可能會越來越少的大模型公司做預(yù)訓(xùn)練。他明確表態(tài)，零一萬物絕不放棄預(yù)訓(xùn)練。

《每日經(jīng)濟新聞》記者也發(fā)現(xiàn)，今年以來，有一批大模型公司停下了研發(fā)的腳步。據(jù)經(jīng)濟觀察網(wǎng)統(tǒng)計，截至2024年10月9日，在188個通過網(wǎng)信辦生成式人工智能備案的大模型中，超過三成的大模型在通過備案后未進一步公開其進展情況，僅有約一成的大模型仍在加速訓(xùn)練，接近一半的大模型轉(zhuǎn)向了AI應(yīng)用的開發(fā)。

據(jù)李開復(fù)透露，做預(yù)訓(xùn)練的Production Run（投產(chǎn)運行）的訓(xùn)練成本是一次三四百萬美金。“‘六小虎’的融資額度都是夠的，這個錢也是頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才，如果有想做預(yù)訓(xùn)練的決心，資金和芯片算力都不是問題。”李開復(fù)表示。

將在國內(nèi)尋找ToB商業(yè)空間在海外側(cè)重C端產(chǎn)品

值得一提的是，創(chuàng)業(yè)一年，李開復(fù)也帶領(lǐng)零一萬物也開始加速探索商業(yè)化落地和更多賺錢的機會。

圖片來源：直播截圖

曾公開宣布不打價格戰(zhàn)的李開復(fù)將Yi-Lightning定價在0.99元/百萬tokens，對此，李開復(fù)表示，這并不是一個虧本的價格，公司仍有相對理想的利潤空間。除此之外，零一萬物也首次對外發(fā)布其To B（企業(yè)端）戰(zhàn)略下的首發(fā)行業(yè)應(yīng)用產(chǎn)品AI 2.0數(shù)字人，聚焦零售和電商等場景，將最新版旗艦?zāi)Ｐ蚘i Lightning實踐于具體行業(yè)解決方案。

圖片來源：受訪企業(yè)供圖

據(jù)零一萬物透露，目前零一萬物數(shù)字人的合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等，均取得了顯著的GMV提升。其中某頭部酒旅企業(yè)在接入Yi-Lightning全新加持的數(shù)字人直播后，GMV（商品交易總額）較此前上升170%。

除直播外，零一萬物也為數(shù)字人客戶準(zhǔn)備了AI 2.0門店短視頻解決方案。客戶可通過極簡流程，隨時生成、超低成本和高品質(zhì)營銷視頻，解決了傳統(tǒng)真人短視頻的成本和制作周期問題。短視頻與直播內(nèi)容相互配合，為商品提供持續(xù)曝光，提升轉(zhuǎn)化率。

這也意味著，在通用大模型產(chǎn)品迭代之外，零一萬物也在探索更多的商業(yè)化落地方向。《每日經(jīng)濟新聞》記者了解到，零一萬物今年下半年開始在To B解決方案上加速布局，6月以來，零一萬物相繼宣布與阿里云、360、順豐科技、飛書、釘釘、鈦動科技等頭部企業(yè)達成合作。

實際上，不僅是零一萬物，經(jīng)過一年多的“百模大戰(zhàn)”，大部分大模型公司都從技術(shù)浪漫走到落地求生的階段。《每日經(jīng)濟新聞》記者根據(jù)公開信息發(fā)現(xiàn)，今年以來，月之暗面、百川智能、智譜AI等大模型公司都在探索商業(yè)化和B端運用場景。

李開復(fù)感嘆，一個大模型公司同時做To B和To C（用戶端）是很辛苦的，需要多元化的管理方式，因為兩個團隊的基因不一樣，做事的方法和衡量KPI（關(guān)鍵績效指標(biāo)）的方法都不太一樣，不過零一萬物則根據(jù)不同的市場特性進行海內(nèi)外市場的商業(yè)化布局。

具體來說，零一萬物將C端產(chǎn)品商業(yè)化重心放在海外市場，因為“國內(nèi)流量越來越貴，而國外的C端產(chǎn)品，獲客成本和變現(xiàn)能力能算得過帳”。在國內(nèi)，零一萬物優(yōu)先尋找B端機會，李開復(fù)表示，零一萬物已經(jīng)找到了破局的空間，就是用數(shù)字人做零售和餐飲等領(lǐng)域的直播和短視頻，做完整的解決方案。

李開復(fù)重申了此前“不做賠錢的To B”這一觀點，他稱零一萬物大模型To B的打法，首要任務(wù)是要尋找少數(shù)能夠按使用情況收費的方法，拿到高利潤率的訂單，而不是項目定制的方法。他同時透露，除了已經(jīng)發(fā)布的AI 2.0數(shù)字人、API之外，零一萬物目前還有AI Infra解決方案、私有化定制模型等其他To B業(yè)務(wù)，會在近期正式對外發(fā)布。

不用執(zhí)著于縮短與美國頂尖大模型時間差

提到國內(nèi)大模型有一個永遠(yuǎn)繞不開的問題，就是中國與美國頂尖大模型技術(shù)的差距有多大，經(jīng)過過去一年的百花齊放，中美大模型差距是否縮小？如何追趕國外頂尖大模型？

對此，李開復(fù)給出一個具體數(shù)字：GPT-4o在5月13日發(fā)布，Yi-Lightening在10月把它打敗，零一萬物和美國頂尖模型之間的差距是5個月，而在5個月前發(fā)布千億參數(shù)Yi-Large閉源模型時，李開復(fù)的答案是6個月，在他看來，這已經(jīng)是全體國內(nèi)創(chuàng)業(yè)者努力的最好結(jié)果。

當(dāng)被問及中國大模型如何繼續(xù)和美國大模型縮短時間差時，李開復(fù)坦言，繼續(xù)縮短時間差非常困難，“我不預(yù)測我們可以縮短這個時間差”。

“因為畢竟人家是用十萬張GPU（圖形處理器）訓(xùn)練出來，我們用的是兩千張GPU訓(xùn)練出來，我們時間差能縮小到5個月是因為我們模型、AI infra（人工智能基礎(chǔ)設(shè)施）等團隊都熱心聰明，去使用和理解對方做出來的東西，再加上我們自己每家的研發(fā)有特色，比如數(shù)據(jù)處理、訓(xùn)推優(yōu)化等。”李開復(fù)表示。

據(jù)他透露，零一萬物目前的成熟方法論就是，通過創(chuàng)新加上自己的特長，關(guān)注OpenAI和其他公司發(fā)布的新技術(shù)，盡快了解這些技術(shù)的核心重要性，然后把它的能力在自己的產(chǎn)品里面發(fā)揮出來。

“我覺得用這套方法將中美大模型差距保持在六個月左右，而且國內(nèi)不僅是零一萬物，也有其他公司做得差不多，已經(jīng)是很好的結(jié)果了，很多中美公司都在往GPT-o1的方向狂奔。”李開復(fù)表示。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。