2023-10-17 15:28:30
10月17日下午,百度世界·度小滿金融大模型前沿發展論壇在北京召開,中國工程院院士鄔賀銓在大會上表示“金融大模型改變了金融科技的范式,重塑金融行業的工作方式,改變了金融服務生態。”
中國工程院院士鄔賀銓發表主題演講
目前金融大模型已經應用在金融資訊、產品介紹內容的文本自動生成,構建虛擬客服在線交互等方面,給用戶提供更人性的服務,提升金融機構內容運營的效率。
鄔賀銓指出,金融大模型的發展需要全行業共同參與,合作開發,“基礎大模型多數從通用語料訓練生成,通識能力強,可作聊天對話,但缺少行業專業知識,需要大模型提供方與垂直行業合作開發行業大模型”。
以度小滿的開源金融大模型“軒轅”為例,它是將預訓練數據(一般預訓練、金融預訓練)和指令數據(一般指令、金融指令)隨機混洗到一個訓練數據中進行混合微調,通過多階段逐漸訓練緩解預訓練和微調間數據不匹配問題,提高模型的表達、理解、遷移和泛化能力。
度小滿CEO朱光表示,“未來五年,生成式AI在金融領域的應用,將成為度小滿最重要的戰略方向。度小滿將不斷加大金融垂類大模型及應用的布局和投入,和業界一起把握機遇,推動新一輪金融科技發展浪潮。”
鄔賀銓認為,金融大模型的發展目前仍面臨著三方面挑戰。首先是金融行業對數據安全性、隱私合規性都有著嚴格的要求。尤其是在風控方面,對時效性與精準性要求嚴格,而一般的基礎大模型透明性、可信性、專業性不足,很難直接遷移為金融大模型。
第二點是金融大數據在成本與質量上的平衡問題。由于金融行業內的數據難以共享,因此金融大模型的數據規模遠遠不及通用語料,導致金融大模型難以產生“智能涌現”的效果。
第三則是本地私有部署需要自建算力設施,對軟硬件產品有嚴格的信創要求,而且參數規模大則算力成本高。
對于金融大模型的落地應用途徑,鄔賀銓院士建議:一是從可控入手開發應用,例如智能客服、智能運營、寫文章、寫郵件等安全的領域出發。二是從人機混合智能切入,例如在初期階段先讓金融大模型與傳統模型共存,經應用考驗后再將金融大模型逐步替代傳統模型。同時還可以通過變換場景,豐富大模型的場景遷移學習能力,或加入反事實的數據來測試,改進AI的學習本質,提高模型的泛化能力。也可以在金融大模型訓練或微調時通過有監督學習思維鏈的模式,通過專家介入引導它一步一步地進行思維推理。
中國工程院院士鄔賀銓(左)與度小滿CEO朱光(右)交流
“此外,還需要建立專門的監控系統,例如微軟專門構建內容管理系統,它與語言模型協同工作,并使用特定算法檢測和監控可能發生的服務濫用或有害內容生成情況。”鄔賀銓院士指出。
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP