每日經濟新聞 2023-07-13 22:25:44
◎產業大模型是通用域大模型的進階版。其同時需要通用大模型的常識能力,和各個產業側的know-how。京東云已經基于內部實踐構建了通用大模型;到今年年底這段時間,京東將經由高復雜場景大規模訓練,迭代出產業服務;預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。
每經記者 王郁彪 每經編輯 劉雪梅
預熱多時,京東大模型“這盤菜”終于端上桌。
7月13日,2023京東全球科技探索者大會上,京東千億級參數言犀大模型正式亮相。中國大模型已“狂飆”半年,京東如今“交卷”顯得姍姍來遲。
不過拉長時間軸,從2021年十億級大模型“K-PLUG”,到2022年百億級大模型Vega,京東在大模型上一直在不間斷地探索與嘗試。
“京東不會把一盤色香味不俱全的菜端上桌。”京東集團CEO許冉在現場如此回應。因為面向產業,是京東大模型區別于市面絕大多數競品的“特色選項”。
這一方面源于部分產業數據的補足?!睹咳战洕侣劇酚浾攥F場注意到,京東言犀大模型有70%的數據來自通用領域,剩下的30%則來自不同產業板塊,如,13.6%來自零售,6.7%來自健康等。
另一方面,一個編造得并不準確的GPT式回答,可能并不會給使用者造成多大影響,但在嚴肅的商業場景下,一個小數點的偏差,恐會造就無法挽回的損失。所以,面向產業的大模型,京東認為需要“小火慢燉”。
但國產大模型的爭端,更是在牌桌之上。上半年,各家入場,多方角力,但下半年,商業場景的落地與規模應用,很快會被提上日程。新一代人工智能的多面性與先進性,讓長期All in變得篤定,但最終仍然需要市場“投票”。
“這幾個月,一直有人問我,京東怎么還不發大模型。顯得比我都急迫。”京東集團技術委員會主席、京東云事業部總裁曹鵬現場笑稱,“雖然對話類通用大模型產品時下很熱,但我認為這不應該是全部,大模型也不應該只是拿來聊天、寫詩、作畫的玩具。”
中國大模型“狂飆”半年,好像所有人都以一種“時不我待”的姿態沖了進來。科技部《中國人工智能大模型地圖研究報告》顯示,截至今年5月,中國研發的10億參數規模以上大模型已發布79個,位居全球第二。在7月上旬剛剛結束的2023世界人工智能大會上,據不完全統計,有24款大模型新品在大會上發布或宣布即將發布。
“百模大戰”開啟序章。從模式角度而言,在如今國內大模型的語境下,對“通用大模型”和聚焦各細分應用場景的“垂類大模型”的爭論不斷,兩方也各有支持者,但究竟哪條路更易跑通,更易搶占先機,仍無定論。
但從技術角度出發,絕大部分企業均為基于transformer做大規模預訓練,并不斷地進行調優。“我相信國內的大模型在中文方向將很快超越國外的對話產品。”京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬如此預測。
但他同時認為,產業大模型是通用域大模型的進階版。其同時需要通用大模型的常識能力,和各個產業側的know-how。
這幾乎是兩方的深度結合,和更具廣度的覆蓋。這當然是最具價值,也是難度最大的一條路。
《每日經濟新聞》記者現場注意到,發布大模型的同時,京東也更新了后續大模型的進程。目前,京東云已經基于內部實踐構建了通用大模型;到今年年底這段時間,京東將經由高復雜場景大規模訓練,迭代出產業服務;預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。目前,京東已經走到了第二步。
何曉冬公布京東言犀大模型三步走進程。圖片來源:企業供圖
“某種意義上,我們的大模型相當于既做了通識教育,又讀了四年專業性的本科教育”,何曉冬如此比喻。
雖然大模型的難點,會慢慢從技術突破轉向產業縱深的突圍,但若想真正深入千行百業,“本科學歷”或許還只是入場券。
“所有行業都值得用大模型再做一次”雖已成為行業共識,但背后必然需要技術平臺與產業側的多方協同。而協同多方,才是最難的事。
釋出大模型的同時,京東官宣“言犀AI開發計算平臺”,支持一站式大模型開發。這是京東給出的又一種思路。言犀AI開發計算平臺除支持言犀大模型外,同時還支持其他主流開源模型。
記者了解到,在言犀AI開發計算平臺上,匯有京東零售、物流、健康、金融等行業知識,部署100多種訓練和推理優化工具,結合低代碼應用平臺,可以提供數據建設、模型應用等服務。
“1到2個算法人員在此環境中,不到一周就能完成數據準備、模型訓練和模型部署,造一個垂直大模型出來。”曹鵬對比稱,“此前這一工作,需10余人的科學家團隊協作完成。”何曉冬則補充說,京東的數據是“鮮活的”,京東每年產生數百億的交互數據,這保證了模型的持續迭代和優化。
產業大模型的B面,則需要更嚴謹的輸入與輸出,精準是最為重要的追求之一。公開數據顯示,目前通用大模型85%左右的準確率,之于普通用戶已經足夠,但在嚴肅的商業場景下,失之毫厘,差之千里。
一個編造的GPT式回答可能只會讓使用者付之一笑,但產業大模型的數據偏頗,需要更嚴肅的審定。
何曉冬此前曾舉例稱,“一個大模型回答143開平方,給出的答案是11.5,但實際應約為11.96,如果在嚴肅商業場景的應用中,這個細微偏差的答案,將會帶來無法計量的損失。”他認為,大模型走向產業的難題是知識深度、內容準度、模型迭代、安全可控等。
大模型的下半場,印證著新的AI三要素:場景、產品和新型算力。從ChatGPT的“引爆”,到“百模齊放”,再到“通用模式”與“垂直模式”之爭,新一代人工智能的發展隨著浪潮波動起伏,但他終會向各行各業滲透去。
一場嚴肅的技術革命,需要真實的應用與落地。需要時間、投入,需要數據在場景中歷練。大模型下半場之爭,當然需要一盤“色香味俱全”的菜肴上桌,但一如細微偏差造就完全不同的答案,新的選擇也將在兩難中,最終揭曉。
封面圖片來源:企業供圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP