每日經濟新聞 2023-03-16 22:43:04
每經編輯 蒙錦濤
一闕《青玉案·元夕》,辛棄疾用時間制造了順理成章的浪漫。八百多年后,由詞化名的科技公司百度,用大語言模型開啟了“生成式AI”時代。通過文心一言,“眾里尋他”只需要幾秒鐘的時間。
3月16日,百度召開新聞發布會。從百度創始人、董事長兼首席執行官李彥宏現場演示的demo效果上看,文心一言具備文學創作、商業文案創作、數理推算等大語言模型較常見的優勢和能力,還在中文理解、多模態生成能力上更具特色。
不過,文心一言、ChatGPT背后的技術邏輯,與通過海量無標注數據訓練的大模型之間差異鮮明,即需要人的參與。整體而言,這類大語言模型還未到發展完善的階段,部分場景足夠驚艷,但一些場景下也有bug出現,存在很大進步空間。
人類向往科技,是期待它更好地理解人類意圖,生成符合人類價值觀、表達習慣的回復。這一點上,唯有真實的體驗才能帶給用戶驚喜。從技術發展趨勢上,大語言模型和生成式AI成為新的技術范式已毋庸置疑,百度方面透露,已有超650家合作伙伴宣布加入生態,如李彥宏所說,AI的長期價值,對千行百業的顛覆性改變,才剛剛開始。
“十年分娩,一朝懷胎”
今起開放首批測試
ChatGPT出現后,一向走在創新路上的百度立刻官宣了對標產品文心一言。看似突然,但李彥宏介紹,百度在過去十幾年間一直在AI研發上持續投入,文心大模型的第一個版本在2019年就發布了,此后每一年都要發布一個新的版本。
最新的版本在新聞發布會現場亮相,李彥宏與文心一言在5個場景展開了問答互動。
在文學創作場景中,文心一言根據對話問題將知名科幻小說《三體》的核心內容進行了總結,并提出了五個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。面對《三體》電視劇演員于和偉和張魯一“有哪些共同點”“誰更高”這類問題,文心一言也基于推理能力得出了準確答案。
除了文學創作,商業文案也是用戶使用較為廣泛的場景。在這一創作場景中,李彥宏對文心一言下達了“如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什么公司名”“數智云圖這個名稱不錯,給我起一個公司的服務Slogan,表達共贏的概念”“幫我生成一篇公司成立的新聞稿,數智云圖以共贏的服務理念用大模型服務中小企業數字化升級,字數600字”等指令。
搜索業務的基因是文心一言的基石。
李彥宏介紹,文心一言大模型的訓練數據包括萬億級網頁數據,數十億搜索數據和圖片數據,百億級語音日均調用數據,及5500億事實的知識圖譜,是數據規模發生的“智能涌現”。而在百度搜索中,問答和生成類的搜索請求占比極高,因此文心一言在自然語言問答和創意內容的生成上有相對突出的表現。
值得關注的是,過去的幾個月,讓AI自行展開創作,“一本正經地胡說八道”是用戶最頭疼的問題。在這方面,文心一言表現如何?根據李彥宏的介紹,為減少錯誤率,百度對文心一言做了知識增強和檢索增強,大幅度提升了事實性問題的準確率。
此外,李彥宏介紹,文心一言具備一定的思維能力,能夠學會數學推演及邏輯推理等相對復雜任務。面對“雞兔同籠”這類鍛煉人類邏輯思維的經典題,文心一言能理解題意,并有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。
不過,李彥宏也直言,現階段文心一言的準確率還不是100%,需要更多的時間學習和成長。
發布產品細則的同時,百度也公布了文心一言的邀請測試方案:3月16日起首批用戶即可通過邀請測試碼,在文心一言官網嘗鮮。企業方面,百度智能云企業客戶也可開始預約申請加入文心一言云服務測試。
根植本土文化
支持多模態拓展
文學創作、商業文案寫作、數理邏輯推算是大語言模型相對常見的優勢和能力。被李彥宏稱為“十年分娩,一朝懷胎”的文心一言,還有哪些特殊之處?
首先,作為扎根于中國市場的大語言模型,文心一言具備中文領域極先進的自然語言處理能力,在中文語言和中國文化上有較好的表現。
為展示文心一言的中文表達能力,李彥宏現場就“洛陽紙貴”的典故輸入了以下問題:洛陽紙貴是什么意思?當時洛陽的紙到底有多貴?這個成語在現在的經濟學原理里,對應的理論是什么?用洛陽紙貴四個字寫一首藏頭詩。
文心一言所作藏頭詩如下:“洛陽城里春光好,陽艷無雙不負賞。紙貴漫天詩詞賦,貴比黃金樂未央。”秀了一波中文優勢后,李彥宏也直截了當地表示,目前文心一言對英文語種、代碼場景的訓練還不夠多,表現還不夠好,未來會加緊訓練,完善上述能力。
值得一提的是,對于生成式AI,用戶還有一個期待,即多模態生成。李彥宏也強調,多模態是生成式AI一個明確的發展趨勢。
從現場展示來看,文心一言具備生成文本、圖片、音頻和視頻的能力。
有趣的是,文心一言還能生成四川話等方言語音。據李彥宏透露,每日有幾萬篇文章正通過該能力轉成視頻內容并在百度分發。不過,受成本限制,現階段視頻生成功能還未對全部用戶開放。在李彥宏的設想里,通過定向微調,文心一言將在百度內外部各類產品上逐步展示出親和力,拉近產品和用戶的距離。
回應市場需求
在反饋中迭代進步
從宣布存在到此次上線,百度用了一個月時間。
最近一段時間,李彥宏接到最多的提問是:“你們真的ready了嗎?”對此,李彥宏直言:“也不能說完全ready了,畢竟文心一言對標的是ChatGPT甚至是CGT-4,門檻還是很高的。無論哪家公司,都不可能靠突擊幾個月就做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。”
截至目前,盡管官宣推進此類產品的企業不少,但在國內,百度是第一個“吃螃蟹的人”。從內在因素上看,文心一言是百度過去多年努力成果的延續。自從進入人工智能時代,IT技術的技術棧發生了根本性變化,從過去三層到“芯片-框架-模型-應用”四層,百度是為數不多、在四層進行全棧布局的人工智能公司。
而文心一言,就是百度在ERNIE及PLATO系列模型的基礎上所研發,其關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。其中前三項為大語言模型普遍采用技術,后三項則是百度已有技術優勢的再創新。
萬眾矚目下交出成品,百度也沒有避諱問題。在應對媒體采訪時,李彥宏多次提到,自己在測試的過程中感覺到,(文心一言)還有很多不完美的地方。選擇在此時推出,是因為市場有龐大的需求。
“百度的很多產品,從搜索到智能云、自動駕駛,再到小度,都是在市場需求下誕生的。從我們承認文心一言的存在到今日上線,一個月的時間里已有超過650家合作伙伴宣布加入文心一言生態,大家都希望能早一點用上先進的大語言模型。”
在李彥宏看來,上線意味著大量的用戶反饋,將加速文心一言的迭代速度,通過真實、及時的反饋倒逼大模型、深度學習框架和芯片的優化,給用戶“士別三日,當刮目相看”的驚喜。
綜合文心一言的整體表現,從某種程度上看它確實具有對人類意圖的理解能力,回答的準確性、邏輯性、流暢性,都逐漸接近人類水平。但文心一言與ChatGPT背后,實際都是SFT(模型微調)、RLHF(強化學習)、Prompt(真實的用戶指令)等技術邏輯,這些方法與通過海量無標注數據訓練的大模型有明顯差距,需要人的參與。
目前來看,這類大語言模型還未到發展完善的階段,部分場景足夠驚艷,但一些場景下也還有bug,存在很大的進步空間。人類向往科技,是期待它能更好地理解人類意圖,生成符合人類價值觀、表達習慣的回復。這一點上,唯有真實的體驗才能帶給用戶驚喜。
編輯|蒙錦濤
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP