要聞

“小火慢燉”京東言犀終“上桌” 但國產大模型已“烈火烹油”

每日經濟新聞 2023-07-13 22:25:44

◎產業大模型是通用域大模型的進階版。其同時需要通用大模型的常識能力，和各個產業側的know-how。京東云已經基于內部實踐構建了通用大模型；到今年年底這段時間，京東將經由高復雜場景大規模訓練，迭代出產業服務；預計在2024年初，會將大模型能力向外部嚴肅商業場景開放。

每經記者王郁彪每經編輯劉雪梅

預熱多時，京東大模型“這盤菜”終于端上桌。

7月13日，2023京東全球科技探索者大會上，京東千億級參數言犀大模型正式亮相。中國大模型已“狂飆”半年，京東如今“交卷”顯得姍姍來遲。

不過拉長時間軸，從2021年十億級大模型“K-PLUG”，到2022年百億級大模型Vega，京東在大模型上一直在不間斷地探索與嘗試。

“京東不會把一盤色香味不俱全的菜端上桌。”京東集團CEO許冉在現場如此回應。因為面向產業，是京東大模型區別于市面絕大多數競品的“特色選項”。

這一方面源于部分產業數據的補足?！睹咳战洕侣劇酚浾攥F場注意到，京東言犀大模型有70%的數據來自通用領域，剩下的30%則來自不同產業板塊，如，13.6%來自零售，6.7%來自健康等。

另一方面，一個編造得并不準確的GPT式回答，可能并不會給使用者造成多大影響，但在嚴肅的商業場景下，一個小數點的偏差，恐會造就無法挽回的損失。所以，面向產業的大模型，京東認為需要“小火慢燉”。

但國產大模型的爭端，更是在牌桌之上。上半年，各家入場，多方角力，但下半年，商業場景的落地與規模應用，很快會被提上日程。新一代人工智能的多面性與先進性，讓長期All in變得篤定，但最終仍然需要市場“投票”。

“大模型不該只是聊天、寫詩、作畫的玩具”

“這幾個月，一直有人問我，京東怎么還不發大模型。顯得比我都急迫。”京東集團技術委員會主席、京東云事業部總裁曹鵬現場笑稱，“雖然對話類通用大模型產品時下很熱，但我認為這不應該是全部，大模型也不應該只是拿來聊天、寫詩、作畫的玩具。”

中國大模型“狂飆”半年，好像所有人都以一種“時不我待”的姿態沖了進來。科技部《中國人工智能大模型地圖研究報告》顯示，截至今年5月，中國研發的10億參數規模以上大模型已發布79個，位居全球第二。在7月上旬剛剛結束的2023世界人工智能大會上，據不完全統計，有24款大模型新品在大會上發布或宣布即將發布。

“百模大戰”開啟序章。從模式角度而言，在如今國內大模型的語境下，對“通用大模型”和聚焦各細分應用場景的“垂類大模型”的爭論不斷，兩方也各有支持者，但究竟哪條路更易跑通，更易搶占先機，仍無定論。

但從技術角度出發，絕大部分企業均為基于transformer做大規模預訓練，并不斷地進行調優。“我相信國內的大模型在中文方向將很快超越國外的對話產品。”京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬如此預測。

但他同時認為，產業大模型是通用域大模型的進階版。其同時需要通用大模型的常識能力，和各個產業側的know-how。

這幾乎是兩方的深度結合，和更具廣度的覆蓋。這當然是最具價值，也是難度最大的一條路。

《每日經濟新聞》記者現場注意到，發布大模型的同時，京東也更新了后續大模型的進程。目前，京東云已經基于內部實踐構建了通用大模型；到今年年底這段時間，京東將經由高復雜場景大規模訓練，迭代出產業服務；預計在2024年初，會將大模型能力向外部嚴肅商業場景開放。目前，京東已經走到了第二步。

何曉冬公布京東言犀大模型三步走進程。圖片來源：企業供圖

“某種意義上，我們的大模型相當于既做了通識教育，又讀了四年專業性的本科教育”，何曉冬如此比喻。

雖然大模型的難點，會慢慢從技術突破轉向產業縱深的突圍，但若想真正深入千行百業，“本科學歷”或許還只是入場券。

一次更苛刻的“嘗試”

“所有行業都值得用大模型再做一次”雖已成為行業共識，但背后必然需要技術平臺與產業側的多方協同。而協同多方，才是最難的事。

釋出大模型的同時，京東官宣“言犀AI開發計算平臺”，支持一站式大模型開發。這是京東給出的又一種思路。言犀AI開發計算平臺除支持言犀大模型外，同時還支持其他主流開源模型。

記者了解到，在言犀AI開發計算平臺上，匯有京東零售、物流、健康、金融等行業知識，部署100多種訓練和推理優化工具，結合低代碼應用平臺，可以提供數據建設、模型應用等服務。

“1到2個算法人員在此環境中，不到一周就能完成數據準備、模型訓練和模型部署，造一個垂直大模型出來。”曹鵬對比稱，“此前這一工作，需10余人的科學家團隊協作完成。”何曉冬則補充說，京東的數據是“鮮活的”，京東每年產生數百億的交互數據，這保證了模型的持續迭代和優化。

產業大模型的B面，則需要更嚴謹的輸入與輸出，精準是最為重要的追求之一。公開數據顯示，目前通用大模型85%左右的準確率，之于普通用戶已經足夠，但在嚴肅的商業場景下，失之毫厘，差之千里。

一個編造的GPT式回答可能只會讓使用者付之一笑，但產業大模型的數據偏頗，需要更嚴肅的審定。

何曉冬此前曾舉例稱，“一個大模型回答143開平方，給出的答案是11.5，但實際應約為11.96，如果在嚴肅商業場景的應用中，這個細微偏差的答案，將會帶來無法計量的損失。”他認為，大模型走向產業的難題是知識深度、內容準度、模型迭代、安全可控等。

大模型的下半場，印證著新的AI三要素：場景、產品和新型算力。從ChatGPT的“引爆”，到“百模齊放”，再到“通用模式”與“垂直模式”之爭，新一代人工智能的發展隨著浪潮波動起伏，但他終會向各行各業滲透去。

一場嚴肅的技術革命，需要真實的應用與落地。需要時間、投入，需要數據在場景中歷練。大模型下半場之爭，當然需要一盤“色香味俱全”的菜肴上桌，但一如細微偏差造就完全不同的答案，新的選擇也將在兩難中，最終揭曉。

封面圖片來源：企業供圖

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

深交所向香農芯創發出關注函

返回每經網首頁

下一篇文章

蘇美蘭就任新三板創新層公司廣珠物流職工監事

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

“小火慢燉”京東言犀終“上桌” 但國產大模型已“烈火烹油”

“大模型不該只是聊天、寫詩、作畫的玩具”

一次更苛刻的“嘗試”

“大模型不該只是聊天、寫詩、作畫的玩具”