每日經濟新聞 2023-05-29 16:53:21
◎王海峰告訴《每日經濟新聞》記者,一個大模型要得到更好的效果,通常人工智能的算法、算力、數據方面都會起很大作用,但更重要的是三者需要進行聯合優化。
每經記者 張蕊 每經編輯 陳旭
5月25日,2023中關村論壇在北京開幕,論壇將持續到5月30日。
人工智能大模型發展論壇現場 每經記者 張蕊 攝
在本次論壇的“人工智能大模型發展”平行論壇上,百度首席技術官王海峰以《文心一言,讀書破萬億》為題發表了主旨演講,并通過演講展示了百度全新一代知識增強大語言模型文心一言在知識問答、寫文稿、作詩、生成視頻、推理計算以及工作場景中智能總結等多方面的能力。
王海峰表示,得益于百度在人工智能技術領域的全面布局和技術積累,尤其是飛槳深度學習平臺和文心大模型的聯合優化,文心一言在一個多月時間推理性能提升了近10倍,效率更高,效果更好。目前,飛槳深度學習平臺已凝聚了535萬開發者,服務20萬家企事業單位,基于飛槳創建了67萬個模型,位居中國深度學習平臺市場綜合份額第一。
對于大模型產業化面臨的挑戰,王海峰認為,當前出現了類似芯片代工廠的模式,一些具有算法、算力和數據綜合優勢的企業可以將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務。
論壇上,王海峰回答了《每日經濟新聞》記者關于影響AI模型效果的因素有哪些、大模型的核心競爭壁壘是什么、是否每個企業都需要構建自己的大模型的提問。
百度首席技術官王海峰 圖片來源:主辦方
王海峰告訴《每日經濟新聞》記者,一個大模型要得到更好的效果,通常人工智能的算法、算力、數據方面都會起很大作用。“簡單地說,算法有更好的算法,數據有更多的數據,或者有更多算力,但這還不夠,更重要的是三者其實是在聯合優化的。”
“就算力而言,剛才我說到4層架構,算力是基礎,而算力很大程度上實際上是在跟框架平臺這一層打交道。”王海峰說,比如像飛槳這樣一個深度學習框架平臺,它跟幾乎所有國際或國內的主流芯片都有適配。“而算法當然是很核心的,很多進步最終還是靠算法。”他說,算法的進步效率更高,一個算法的改進可能就是多少倍甚至是成數量級的提升。
而數據意味著什么?在王海峰看來,數據很大程度上其實是意味著應用場景等。建構一個基礎的預訓練大模型時數據會特別多,這就意味著它有一個基本的通識知識了,但應用于各種場景時,每一個場景都會帶來自己的數據,當一個場景要用這種大模型時,往往是針對這個場景的需求標注很好的數據,就會得到事半功倍的效果。
“所以我們如果說日常工作,其實這幾方面都在優化,而且是在聯合優化,不斷地相互影響、互相迭代。”王海峰說。
封面圖片來源:主辦方
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP