每日經濟新聞 2025-02-05 21:57:46
2月5日,有股份制銀行IT部門人士透露,他們已著手測試AI大模型Deepseek在智能客服和內部辦公等業務場景中的應用效果。近年來,銀行為自研金融大模型投入巨大,包括購買GPU卡及聘請專業人才,導致研發成本高昂。而Deepseek憑借較低的數據訓練成本和算力要求,為中小銀行提供了新的研發路徑,有望縮小與大型銀行的技術差距。有城商行也在春節期間討論基于Deepseek開源模型研發金融大模型的可行性。
每經記者 陳植 每經編輯 張益銘
AI大模型Deepseek的面世,正悄然影響銀行的金融大模型研發應用策略。
一位股份行IT部門人士向記者透露,2月5日,他們內部已著手對Deepseek進行初步測試,觀察它在智能客服、內部辦公等業務場景,相比其他大模型是否產生更強的降本增效作用。
“圍繞大模型在金融場景中的應用,我們做過不少嘗試,包括購買GPU卡自研金融大模型,以及在其他通用大模型的基礎上研發金融小模型,但這兩種方式都花費不少。”他告訴記者。如今Deepseek在數據訓練方面的較低操作成本,讓他們看到金融大模型研發應用方面的投入產出比有望進一步上升。
一位城商行銀行IT部門人士向記者透露,春節期間,他們IT團隊已討論在Deepseek開源大模型基礎上研發自己的金融大模型。
他透露,由于中小銀行在金融大模型研發方面的投入不高,數據訓練成本相對更低的Deepseek反而是中小銀行自研金融大模型的新突破口,一旦Deepseek在數據訓練成本、生成式內容準確性、投入產出比等方面具有更好效果,他們將重點圍繞Deepseek研發自己的金融大模型。
在這位城商行銀行IT部門人士看來,Deepseek的面世,有望縮小眾多中小銀行與少數大型銀行在金融大模型研發應用方面的“鴻溝”。
上海交通大學上海高級金融學院副院長李峰此前接受記者采訪時表示,隨著AI大模型在金融業務場景的應用日益廣泛,它能否真正推動金融行業高質量發展,關鍵在于它能否給金融機構帶來實質的降本增效。
前述股份行IT部門人士向記者透露,為了自研金融大模型,前些年銀行花費不少資金購買GPU卡搭建較高算力,導致金融大模型研發的實際投入成本較高。若Deepseek應用能令銀行在金融大模型研發過程的算力投入明顯減少,他們也樂意圍繞Deepseek研發金融大模型。
“尤其是AI Agent(智能體)正日益在更多金融場景得到應用,銀行正面臨更大的算力瓶頸,Deepseek對算力消耗的較低要求,無形間解決了銀行在AI Agent研發應用過程中的算力問題。”他告訴記者。這無形間將加快銀行推進AI Agent的研發應用。
近年,AI大模型技術在銀行業務場景的應用日益廣泛。無論是普惠金融、風控、客戶營銷、支付,還是函證、跨境金融、票據融資、供應鏈金融等場景,都能看到AI大模型的身影。
在客服環節,AI大模型正幫助眾多銀行提升坐席人員工作效率——通過AI大模型的賦能,坐席人員能更精準地了解用戶意圖,迅速響應用戶的各種金融服務需求。
在信貸風控環節,AI大模型正推動銀行更高效精準地開展大數據分析,持續優化信貸風控引擎,快速給出更科學的信貸決策。尤其是在AI大模型支持下,部分中小銀行有底氣在客戶數據相對較少的情況下啟動新信貸業務,有效抵御黑灰產組織的攻擊。
在財富管理環節,AI大模型協助銀行客戶經理全面分析用戶以往的資產配置狀況,并結合用戶最新需求,給予更科學的財富管理解決方案,進一步提升財富管理的用戶滿意度。
為了進一步提升AI大模型應用成效與擴大應用場景,越來越多銀行紛紛根據自身業務特色自研金融大模型,進一步提升各項業務操作效率。
與此同時,銀行一面積極擁抱金融大模型,一面也面臨投入產出比的挑戰。
李峰向記者透露,AI大模型的研發成本相當高,進行一次數據訓練的費用或達到千萬美元。因此,相比大型金融機構擁有足夠財力支撐金融大模型自研應用,眾多中小金融機構往往會選擇成本更低的金融大模型研發路徑。
他透露,基于成本控制考慮,中小金融機構研發金融大模型主要采取三種路徑,一是與外部大模型服務商合作,借助后者的大模型技術,再結合自身的私域數據進行微調,形成適合自己業務場景的AI小模型,二是采取抱團取暖策略,即多家中小金融機構合作研發金融大模型,但數據的跨公司交流面臨較大的合規風險;三是通過行業性的公共平臺布局研發AI大模型技術。
上述股份制銀行IT部門人士告訴記者,這些年銀行自研金融大模型的投入不菲——除了花費不菲資金采購GPU卡,還需重金聘請熟諳大模型研發的專業人才。此外,即便金融大模型的數據訓練規模參數小于通用大模型,但每次數據訓練的實際耗費也超過百萬元。
“前些年大模型比較看重數據規模參數大小期間,我們額外增加了預算購買GPU卡,為了滿足百億級數據參數的金融大模型數據訓練。”他告訴記者,如此高的投入,也令銀行內部一直在討論金融大模型自研的投入產出比。畢竟,金融大模型在不同業務場景的使用成效不一,比如在智能客服、內部辦公等方面的應用效果相對較好,但在普惠金融、信貸風控、跨境業務等場景,由于涉及客戶數據信息保護等合規操作要求,其只能作為業務操作輔助工具,大量工作仍需人工完成。
在他看來,若Deepseek較低的算力投入要求與數據訓練成本能顯著降低銀行研發金融大模型的投入,并產生與其他大模型技術相當的AI生成式內容效果,它將對銀行大模型應用產生三大影響,一是Deepseek將成為中小銀行使用較低成本自研金融大模型的新突破口,令大型銀行與中小銀行在大模型應用的“差距”明顯縮小;二是越來越多銀行將傾向自研金融大模型,以往依托外部通用大模型進行私域數據微調研發金融小模型的做法或明顯減少;三是基于Deepseek大模型的開源特點,部分銀行大模型研發團隊有望結合自身的業務特點與業務創新需要,自研更契合銀行自身業務需求的專屬金融大模型。
清華大學金融科技研究院副院長薛正華此前表示,隨著大模型在銀行等金融場景的應用日益廣泛,金融機構對大模型能力的要求日益增加,具體表現在金融信息分類、抽取、計算、邏輯推理、圖文生成以及編程等能力,尤其是銀行在一些大模型高階領域,比如多輪分析推理、業務領域思維鏈、業務預測推演準確度、效率、投產比等方面的要求也在持續提升。
在他看來,針對嚴苛的金融業務合規操作要求,采用MoE混合專家模型或許是一條比較有效的金融大模型發展路徑,每個子領域或場景都有專業的Expert,負責做細、做深、做精、做準,達到或超過人類專家水平。對于綜合性問題,發揮MoE多專家協同的方式解決,效果往往更好。例如針對具體場景的客服、客戶營銷等,AI生成結果的顆粒度越細、越快、越專業、越精準,效果越好;針對綜合貸款方案設計、綜合理財方案等多場景融合業務,多模型協同往往帶來更好效果。
這位股份制銀行IT部門人士告訴記者,Deepseek的一項特點,是它通過算法優化,在使用很低的算力計算資源情況下充分調動混合專家MoE模型架構與AI深度學習能力,給出精準專業的AI生成式內容。這同樣契合銀行研發金融大模型的發展方向。
“目前,我們內部發起了一個工作組,復刻Deepseek開源大模型并進行數據訓練與金融場景應用測試,檢測其AI生成式內容效果是否與其他大模型相當,以及數據訓練成本是否明顯降低。”他告訴記者,若Deepseek的降本增效作用明顯增強,不排除他們會更多使用Deepseek研發自己的金融大模型,并應用在更多業務場景。
李峰表示,即便是大型金融機構自研大模型,由于AI大模型技術迭代需要耗費大量GPU卡,因此大型金融機構一面需注意GPU卡的較大損耗成本,一面要關注大模型技術的創新發展趨勢,通過“與時俱進”部署前沿AI科技,確保自身的金融大模型技術處于領跑地位。
隨著AI大模型技術快速迭代升級,如今AI Agent(智能體)在銀行業務場景的應用日益增多。
相比傳統AI大模型,AI Agent能自主感知環境,并開展自主決策、執行動作、反饋效果與迭代優化,令金融機構的運營效率與業務風險識別防范能力“更上一層樓”。
目前,部分歐美大型銀行機構已嘗試使用AI Agent,自主回復用戶的各種金融業務疑問,進一步提升智能客服響應效率與降低坐席人工成本。
奇富科技CEO吳海生此前接受記者專訪時表示,已有金融機構嘗試在某些金融業務場景使用AI Agent。但它仍需具備三大條件:首先,金融機構的AI Agent底層技術需發展得足夠好;其次,金融機構需要找到適合AI Agent的業務場景,并形成相應的產品服務;第三,這項基于AI Agent的金融服務體驗是否足夠無感與優雅,讓用戶喜歡這個“小助手”。
上述城商行IT部門人士向記者透露,此前他們曾嘗試引入AI Agent技術應用在客服、內部辦公、客戶營銷等場景,但他們很快發現,算力瓶頸是制約國內中小銀行布局AI Agent技術的一大挑戰。相比AI大模型,由于AI Agent強調自主感知與自主決策,需要更多算力開展數據訓練與算法優化,從而確保AI Agent在用戶個性化金融服務需求面前做出準確專業的決策。這意味著銀行需要購買更多GPU卡以支持AI Agent研發應用。
“鑒于Deepseek的算力消耗要求與數據訓練成本較低,我們正考慮能否通過Deepseek訓練AI Agent。”他告訴記者。
記者多方了解到,盡管Deepseek有助于降低銀行研發AI Agent的算力束縛,但AI Agent能否快速應用在銀行部分業務場景,仍存在一定變數。究其原因,是相比開源的LLM大語言模型技術既可以在本地環境進行部署且能更好控制與管理數據以滿足監管要求,AI Agent技術尚未完全成熟,銀行如何做好數據隱私保護、數據加密和訪問控制等合規操作要求,仍需相關部門出臺具體細則。因此AI Agent主要在銀行內部某些基礎、簡單、通用、不涉及用戶數據外泄風險的業務場景使用。
李峰此前接受記者專訪時透露,盡管AI Agent發展速度相當快,但由于金融機構屬于強監管行業,相關部門是否允許AI大模型自主開展金融業務決策,仍是未知數。金融機構在使用AI Agent時,仍需高度關注合規操作風險。
上述股份制銀行IT部門人士告訴記者,隨著AI Agent技術日益成熟,加之數據加密調取技術持續進步、金融機構嘗試將AI Agent應用在部分金融業務場景,將是一種趨勢。畢竟,AI Agent能發揮更強的智能化服務與降本增效作用。但這項趨勢能否落地的一大前提,是銀行能否有效解決AI Agent等前沿大模型技術自身存在的風險,比如技術風險、運營風險、道德風險,以及對客戶隱私數據的保護風險等。
封面圖片來源:視覺中國-VCG41N1472123004
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP