亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

微眾銀行人工智能首席科學家范力欣:基于內容嚴謹的數據庫查詢和校驗,可防范大模型“幻覺”

每日經濟新聞 2024-07-04 20:51:45

每經記者 張宏    每經編輯 廖丹    

7月2日,微眾銀行“大模型時代AI前沿與金融應用”主題活動在北京舉辦。

會上,微眾銀行人工智能首席科學家范力欣表示,模型越大,能力越強,隨之而來的問題是高成本,盡管現在“百模大戰”,用戶成本可能越來越低,但使用和訓練大型模型的成本實際上并沒有降低,這為大模型應用落地帶來挑戰。

會后,《每日經濟新聞》記者(以下簡稱“NBD”)就如何防范和糾正大模型“幻覺”、銀行業大模型落地面臨的挑戰、數據要素與大模型之間的關系等問題專訪了范力欣。

圖片來源:每經記者 張宏 攝

基于內容嚴謹的數據庫查詢和校驗可防范大模型“幻覺”

NBD:在金融機構中,數據精準度至關重要,因此有人認為生成式AI不適合應用在金融機構的核心部門。針對生成式AI可能出現的“幻覺”問題,你認為可以如何進行防范和糾正?

范力欣:在技術層面,可以基于內容嚴謹的數據庫查詢和校驗。目前,這一過程已經在實際應用中得到實施。

首先,在生成內容之前,(生成式人工智能)需要先查詢信息。當查詢來源為網絡時,信息的可靠性參差不齊,查詢結果的準確性并非總是能夠得到保證。但在(金融機構的)實際應用中,所依賴的是內容嚴謹的數據庫,這構成了第一層保障。

其次,生成的內容需要再次與數據庫進行校驗,以確保生成的內容與數據庫之間不存在矛盾。這是技術層面上的第二層校驗。

在流程層面上,我們的系統并不直接面向實時生成業務。以客服為例,客服背后有一個龐大的數據庫支撐。以往遇到的問題是,數據庫中一個問題對應一個答案。隨之而來的難點是如何將同一問題千變萬化的問法與數據庫中的答案對應。現在,(有了生成式人工智能)可以擴展問題的表述范圍,使其能夠覆蓋用戶未來可能的表述,從而達到答案與問題的“多對一”匹配。由于數據庫是離線的,并且可以人工審核,從應用層面避免了“模型幻覺”問題。

NBD:剛剛你提到的數據庫是銀行內部的私域數據庫嗎?

范力欣:是的。實際上,包含兩個數據庫:第一個是事實材料庫,也稱為背景庫,它用于查詢和聯合校驗。第二個數據庫是面向服務端客服的問答庫。這個問答庫原本是一問一答的模式,現在已經發展為多問一答的模式。

NBD:校驗的過程由模型完成,還是由人工完成?模型在校驗過程中會不會出現“幻覺”?

范力欣:大模型校驗。但最終會由人工審核,就像一支人機混合的足球隊,大模型是前鋒,攻城拔寨,人工審核是后衛守門員,保證不失一球。

投入產出比為大模型應用落地帶來挑戰

NBD:人工智能的發展對金融機構人員專業占比有沒有影響?

范力欣:微眾銀行擁有超過50%的科技人員。在這些科技人員中,涵蓋了我們通常所說的ABCD各個方面,即人工智能(AI)、區塊鏈(Blockchain)、云計算(Cloud)以及大數據(Big Data)。目前,這些技術領域已經基本融合。

NBD:大模型落地目前還面臨哪些挑戰?

范力欣:雖然大模型在技術上有廣闊的想象空間,但我們必須考慮投入產出比。小型模型可能能力不足,而大模型可能具有質的飛躍,但隨之而來的問題是成本也可能有質的飛躍。銀行是高度數字化和信息化的,理論上完全可以使用該技術。然而,銀行必須計算投入產出,許多小企業也同樣關注這一比率。任何企業首先考慮的是生存問題,而成本控制是首要的考慮因素。

目前,大模型帶來的微小收益可能已經被其額外的成本所抵消。因此,現階段我們只能篩選那些產出大于投入的業務。對于其他業務,我們可能會進行簡單的嘗試或評估,以確定是否可行。當大模型到達另一個階段,能力更強、成本更低的時候,將有更多可能的業務亟待拓展。

NBD:目前哪些應用在投入產出比上有優勢?

范力欣:目前在投入產出比上具有優勢的應用主要包括生成視頻、生成圖像以及營銷領域。除此之外,還有對客戶進行評估和判斷的相關應用。這些都是可以進一步開發的領域,但有時候不一定要使用大模型。

NBD:你提到聯邦大模型,借助聯邦大模型似乎可以達到數據可用不可見。數據要素市場建設有沒有可能與人工智能相融合形成1+1>2的效果?

范力欣:我們的理解是,關鍵不在于數據要素,而在于模型要素。為什么這么說呢?數據本身如同原油,可以提煉為柴油、汽油等多種形態,只有當數據被納入一個有效的模型中,數據才具有可用性。雖然這個比喻可能略顯粗糙,但可以理解為,原始數據有多種潛在用途,在具體用途不明確的情況下,我們無法對數據進行準確的定價,只能根據數據的規模和大致質量進行初步估計。

然而,更精確的定價應當面向應用。只有當我們明確了數據的使用目的,以及它在實際應用中帶來的幫助,我們才能評估其真正的價值。否則,同樣的數據對某些人可能毫無價值,而對另一些人可能非常有用。

這種應用價值的評估需要通過模型來實現,即通過訓練或微調,使數據得以有效利用,從而揭示其真正的價值。從這個角度來看,實際上是模型賦予了數據價值,就像羊吃了草之后,我們是對羊定價,并向客戶提供羊的使用價值。

封面圖片來源:視覺中國-VCG41N1419339719

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

數據 模型 人工智能 銀行

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0