每日經(jīng)濟(jì)新聞 2023-12-20 16:05:40
◎王小川認(rèn)為,通用大模型可以在大部分場景下替代行業(yè)大模型,通用大模型+搜索增強(qiáng)可以解決99%企業(yè)知識(shí)庫的定制化需求。
◎在應(yīng)用領(lǐng)域,王小川認(rèn)為,今年是中國大模型發(fā)展的元年,明年中國各家公司都會(huì)有相應(yīng)的成績出來。
每經(jīng)記者 可楊 每經(jīng)編輯 梁梟
大模型熱潮一年,落地應(yīng)用成為行業(yè)關(guān)注的焦點(diǎn)。
12月19日,百川智能宣布開放基于搜索增強(qiáng)的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超長上下文窗口的基礎(chǔ)上,還增加了搜索增強(qiáng)知識(shí)庫的能力。即日起,API(即應(yīng)用程序接口)用戶可上傳文本資料來創(chuàng)建自身專屬知識(shí)庫,從而根據(jù)自身業(yè)務(wù)需求打造更完整、高效的智能解決方案。
這是百川智能在商業(yè)化層面的一步探索。談及大模型的落地應(yīng)用,百川智能創(chuàng)始人、CEO王小川在交流會(huì)上表示:“光靠模型本身做得再大都是不夠的,大模型+搜索才能構(gòu)成完整的技術(shù)棧。”
“大模型走向?qū)嵱?,都呼吁模型落地,在今天,尤其從國?nèi)來看,搜索增強(qiáng)是大模型走向?qū)嵱玫牡谝徊?,甚至是最關(guān)鍵的一步。沒有搜索增強(qiáng)的大模型在企業(yè)里是沒法落地的。”王小川認(rèn)為。
盡管大模型是劃時(shí)代的技術(shù)突破,但現(xiàn)階段大模型并不完美,幻覺、時(shí)效性差、缺乏專業(yè)領(lǐng)域知識(shí)等問題,是其落地千行百業(yè)必須面對(duì)的挑戰(zhàn)。
王小川表示,眾所周知,在大型模型研究領(lǐng)域,存在幾個(gè)關(guān)鍵詞。首先是大型模型的幻覺,大家通過更大的模型去減少幻覺,成本會(huì)隨之上升,畢竟幻覺問題沒有止境。其次是大模型本身的時(shí)效性較差,大模型是靜態(tài)的知識(shí)庫,需要不斷升級(jí)。尤其是在垂直領(lǐng)域的實(shí)際商業(yè)應(yīng)用中,需要解決企業(yè)自身的數(shù)據(jù)、公開網(wǎng)絡(luò)數(shù)據(jù)以及垂直領(lǐng)域的數(shù)據(jù)三大問題。
對(duì)于解決這些問題,王小川認(rèn)為,光靠模型本身做得再大都是不夠的,大模型+搜索才能構(gòu)成完整的技術(shù)棧。“當(dāng)技術(shù)增強(qiáng),我們能實(shí)現(xiàn)互聯(lián)網(wǎng)與垂直領(lǐng)域知識(shí)、全網(wǎng)知識(shí)的全線鏈接,這個(gè)完整的技術(shù)棧有利于我們讓大模型真正去落地應(yīng)用。”
“我們知道做模型的時(shí)候,不代表每次效果都會(huì)提升,搞不好(會(huì))下降,是不穩(wěn)定的事情。即便大模型公司也需要非常多的經(jīng)驗(yàn)積累,才能提升它的效果。”王小川認(rèn)為,行業(yè)大模型大路徑,不僅人才、算力要求高,穩(wěn)定性、可靠性都會(huì)低很多,與此同時(shí),一旦數(shù)據(jù)或者算法更新,企業(yè)就得重訓(xùn)一次。“因此用行業(yè)大模型解決企業(yè)應(yīng)用,概念大家聽著很開心,但今天并沒有良好實(shí)踐,面臨很多問題。”
王小川認(rèn)為,通用大模型可以在大部分場景下替代行業(yè)大模型,通用大模型+搜索增強(qiáng)可以解決99%企業(yè)知識(shí)庫的定制化需求。
王小川表示,更大的內(nèi)存、更強(qiáng)的處理器依然不能解決幻覺問題,也不能解決外部知識(shí)引入和時(shí)效性的問題。“我們認(rèn)為需要通過搜索增強(qiáng)把互聯(lián)網(wǎng)實(shí)時(shí)的信息和企業(yè)完整的知識(shí)庫,像硬盤一樣裝進(jìn)去。讓大模型外掛這樣一個(gè)外部知識(shí),外掛外部硬盤,這是搜索增強(qiáng)做到的工作。有了搜索增強(qiáng)以后,大模型加上外掛硬盤的即插即用,使得在絕大多數(shù)領(lǐng)域里面模型變得更加實(shí)用。”
“這次跟上次不一樣,上一波由于模型能力,主要是圖像處理,因?yàn)椴粔蛲ㄓ?,不夠通用帶來兩個(gè)問題:首先是大家都擠在一個(gè)賽道里,都去做安防,不能賦能千行百業(yè),也不能進(jìn)一步降低企業(yè)的使用成本。其次是賽道很窄,每個(gè)項(xiàng)目都很重,今天美國證明大模型在很多行業(yè)都可以做,而且實(shí)施成本會(huì)比原來低很多,所以這一波我覺得是可行的。”談及這一年的大模型熱潮與此前的區(qū)別,王小川表示。
回溯今年以來的大模型競速,王小川將其分為了三個(gè)不同階段。第一個(gè)是恐慌期,“OpenAI有了之后看中國公司還不行,數(shù)據(jù)飛輪美國先跑起來,是不是通用人工智能要來了,大家有這個(gè)探討。”第二階段,大家開始火熱地工作,所有人的關(guān)注都在這里;第三階段,技術(shù)迭代加速,“我們的技術(shù)人員每天都要跟進(jìn)最新的東西,要把自己(的成果)不斷迭代不斷改進(jìn),行業(yè)中的發(fā)展速度其實(shí)超出外界媒體和資本圈的看法,目前還是在快速迭代。”
而在應(yīng)用領(lǐng)域,王小川認(rèn)為,今年是中國大模型發(fā)展的元年,明年中國各家公司都會(huì)有相應(yīng)的成績出來。“今年確實(shí)大家太需要把精力放在模型本身,應(yīng)用在今天我認(rèn)為還是在初期狀態(tài),這會(huì)兒談應(yīng)用早一點(diǎn),明年會(huì)差不多。”
封面圖片來源:視覺中國-VCG41N1462568496
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP