要聞

每經專訪騰訊云天御首席科學家李超：金融機構更愿意使用大模型去構建更穩定的定制化模型

每日經濟新聞 2023-07-27 20:20:41

◎大模型是金融風控的新趨勢，每日經濟新聞記者專訪了騰訊云天御首席科學家李超，探討了金融風控大模型的技術原理、應用價值和發展前景。

◎金融風控大模型的應用效果是顯著的，相比傳統的風控建模方案，一般會有20%左右的反欺詐效果提升，建模時間也從2周縮短到2天。同時，大模型也能夠解決小樣本和泛化性的問題，提高模型的穩定性和可用性。

每經記者潘婷每經編輯張益銘

年初，ChatGPT的的橫空出世引發一系列AI領域的連鎖反應，大模型如何才能和各行業結合，解決產業難題成為各界關注的焦點問題。金融行業作為天然數據密集型行業，也是人工智能應用最早和最普遍的行業，加之金融機構從高利率高風險的運營模式轉化為精細化的運營模式，獲客方式、風控策略差異化加大，這也導致風控領域成為觀察大模型落地的重要場景。

金融風控由“規則對抗”進入“模型對抗”怎么理解？不同金融機構對大模型的接受程度如何？風控大模型對于金融機構風控性能的提升有沒有一些可以量化的指標來評判？風控大模型是如何嵌入金融機構場景的？帶著上述問題，每日經濟新聞記者專訪了騰訊云天御首席科學家李超，以下NBD代表每日經濟新聞。

騰訊云天御首席科學家李超受訪者供圖

金融機構不僅要敏捷迭代策略，還要迭代模型本身

NBD：金融風控由“規則對抗”進入“模型對抗”是怎么理解的？

李超：“模型應用，產業先行”正在成為大模型應用的共識，這在金融行業體現的尤為明顯。金融行業作為天然的數據密集型行業，又是人工智能應用最早和最普遍的行業，無疑是大模型落地的最佳場景。但金融行業對信息的高精度的要求和嚴苛的數據合規要求，讓行業大模型在金融場景的落地需要貼合自身發展現狀。

作為金融行業的“命門”，風控基本完成了從人工審核到智能風控的變化。由于貸款業務線上化、數字化以后，人工審批的效率遠遠不能滿足業務發展，于是以機器學習模型為代表的人工智能審核成為金融風控的重要手段和構成部分。風控模型就是把專家經驗抽象成一系列風控策略集，提升判斷風險的效率。譬如欺詐檢測模型、準入模型、風險定價模型、額度管理等貫穿金融信貸業務的全生命周期。可以說，風控模型是金融風控體系的技術核心。

傳統的風控模型主要依托于金融機構的歷史金融數據和專家經驗，呈現出“靜態模型+動態策略規則”的特征，即整體風控模型的框架不變，調整具體策略的閾值，例如以前針對有過三次逾期記錄的用戶申請不予通過，現在有可能根據欺詐態勢調整為有過一次逾期記錄的才不予通過。但在金融機構面臨的內外部趨勢變化下，金融機構不僅要敏捷迭代策略，還要迭代模型本身，構建以“動態模型+動態策略規則”為代表的“模型對抗”能力。

NBD：做大模型要有海量的數據，那我們的數據來源有哪些？是由金融機構授權后我們再去針對性的建模，還是會有一個普適性的模型去應對？

李超：關于大模型這件事，目前在行業里邊討論的比較多的是大語言模型（LLMS），就是ChatGPT，也是讓這件事情得到大家更深入的關注。ChatGPT本身是一個大語言模型，它是無監督的自然語言處理分析的模型，用來解決聊天機器人這樣一些場景。

今天我們討論的金融風控大模型，依托騰訊云行業大模型和騰訊安全20多年黑灰產對抗經驗沉淀，主要解決的問題并不是偏文本分析的場景，而是關于金融風控的欺詐識別大模型，本身是機器學習模型，并不是大語言模型。這個東西在訓練的時候，更多應用了金融風控場景里面特有的風控樣本。

我們最早做定制化服務的時候，其實并沒有通過大模型，也就是基于Foundation model+遷移學習的機制，客戶會根據自身客戶收集的樣本來去構建垂直場景的風控模型。雖然能夠實現定制化的欺詐模式識別，但是在這過程中也發現通常客戶自身積累的樣本能力和速度是非常局限的，單純用傳統的機器學習方式給客戶做模型的構建，很難去建設好既精準又穩定的風控模型。

基于我們在人工智能算法不斷的深入研究，開始用到遷移學習的機制，逐漸發展到成為新一代基于大模型的模型對抗范式。它最主要的特點就是能夠根據過往我們所積累的黑灰產一些樣式和一些模型，把其中有用的知識通過知識蒸餾的方式收取出來，通過技術的手段，把這些知識形成基礎模型，叫做Foundation model，Foundation model不同于一個通用模型，不需要直接去服務具體的場景，而是一個知識庫。在這個“知識庫”基礎上，客戶基于一些樣本提示，就能夠靈活地生成適配各個場景和不同金融機構的風控模型。

大模型助力金融機構風控建模：反欺詐效果提升20%，建模時間縮短90%

NBD：風控大模型對于銀行、消金、互金這些金融機構風控性能的提升有沒有一些可以量化的指標來評判？

李超：客戶通過金融風控大模型來構建風控模型相比傳統的風控建模方案，一般會有20%左右的反欺詐效果提升，建模時間也就是從樣本收集、模型訓練到部署上線的過程從以前的2周到現在僅需要2天。

另外，大模型讓定制建模變得更加可行。在客戶樣本非常少或者沒有的情況下，我們也能進行定制建模，同時這種定制建模的穩定性會比傳統模型更穩定、更可用。所以這種大模型的核心價值，更多是使定制建模成為可能。

以某金融客戶為例，建模效率提升60%。該金融機構自身渠道和客群變化比較快，客戶的風控團隊遵循風險動態治理的風控理念，需不斷根據風險的變化迭代風控模型。然而基于傳統的專家聯合建模方式在效率和成本上都難以滿足客戶需求，騰訊云助力該客戶實現了全流程自動化的風控建模，模型迭代周期從17天縮短到3天，風控模型迭代效率得到了極大的提升。

另外，某銀行客戶在小樣本條件下建模性能提升20.5%，該客戶因業務冷啟動階段欺詐樣本積累不足，在風控建模階段面臨小樣本訓練難題，傳統風控建模方式難以滿足客戶對模型性能的要求。使用金融風控大模型，客戶基于少量提示樣本就遷移得到適配自身業務場景的定制模型，相比于傳統的建模方式模型KS（Kolmogorov-Smirnov，區分度）性能提升20.5%，在跨場景的泛化性測試上性能提升53%。

NBD：這個模型具體是怎么運作的？怎么嵌入金融機構場景的？

李超：我們首先是用一種對抗學習的方式把所有模型里面的有用知識抽取出來，再通過知識蒸餾的方式把這些有用的知識融合進一個Foundation model，基于這個大基礎模型就能夠快速生產出來新的模型。

當過往的知識越來越多的時候，對于場景樣本的需求就會越來越少。大模型的整個邏輯，就是把過往所有知識全部加工在Foundation model里，這個Foundation model好比一個能夠自動生產模型的機器人，只需要給它小量的場景樣本提示，就能夠生產出來對應場景的專屬模型出來。生成的模型既有比較好的場景欺詐識別效果，又具備了通識能力，即模型泛化性。

從金融場景整體來看，目前更多場景是以貸前為主，貸中逐漸多了起來，貸后遇到的相對還是少一些。比較有代表性的是一些消金、互金公司，他們對審批流程做了很精細化的管理之后，在審批流程的很多環節都開始應用AI建模形式。因此也就有了定制建模的需求，貫穿在客戶風險審批整個生命周期，比如反欺詐、客戶分層、撈回、定額、定價，在很多環節都可以用大模型定制的方式。