商訊推薦

度小滿發(fā)布“軒轅70B”金融大模型 C-Eval、CMMLU雙榜排名榜首

2023-09-22 16:16:37

9月22日，度小滿宣布“軒轅70B”金融大模型開源，所有用戶均可自由下載和試用，并公布了“軒轅70B”在C-Eval、CMMLU兩大權(quán)威大語言模型評測基準(zhǔn)的成績。數(shù)據(jù)顯示，在C-Eval榜單上，XuanYuan-70B的總成績達(dá)到71.9分；在CMMLU榜單中，以71.05分的高分位居榜首，在兩大權(quán)威榜單上的所有開源模型中排名榜首，也是國內(nèi)首個同時在兩大權(quán)威榜單排名榜首的金融大模型。

C-Eval榜單是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的綜合性考試評測集，幾乎囊括了所有國內(nèi)外的主流模型，覆蓋人文、社科、理工、其他專業(yè)四個大方向的52個學(xué)科，共有13948個多項選擇題和中學(xué)、本科、研究生、職業(yè)四個難度級別，是目前對模型潛力判斷極具權(quán)威性的大模型榜單之一。

CMMLU數(shù)據(jù)集是一個綜合性的中文評估基準(zhǔn)，由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出，專門用于評估語言模型在中文語境下的知識和推理能力，共涵蓋了67個主題，涉及自然科學(xué)、社會科學(xué)、工程、人文以及常識等。

金融行業(yè)場景豐富，數(shù)字化程度高，是大模型落地應(yīng)用的最佳場景之一。但金融又是一個高合規(guī)要求的行業(yè)，業(yè)務(wù)決策復(fù)雜，大模型真正在金融業(yè)務(wù)中做到實際應(yīng)用還面臨不少挑戰(zhàn)。

度小滿CTO許冬亮表示，“相比通用大模型，‘軒轅70B’金融大模型經(jīng)過度小滿業(yè)務(wù)場景中沉淀的海量金融數(shù)據(jù)訓(xùn)練，對金融知識理解更專業(yè)、更精準(zhǔn)，可控性、安全性更高。我們把大模型開源，希望能夠降低大模型在金融行業(yè)的部署和應(yīng)用門檻，促進(jìn)金融行業(yè)服務(wù)效率和服務(wù)體驗的突破性革新”。

“軒轅70B”將在社區(qū)同時開源金融大模型和50G高質(zhì)量金融語料，開源下載地址：https://github.com/Duxiaoman-DI/XuanYuan

今年5月份，度小滿開源了國內(nèi)首個千億參數(shù)的金融大模型，已經(jīng)有上百家金融機(jī)構(gòu)申請試用。本次發(fā)布的新版大模型相較于上一個版本能力全面提升：在增量預(yù)訓(xùn)練和指令微調(diào)階段，加入了度小滿業(yè)務(wù)場景中的海量金融數(shù)據(jù)，對金融問題回復(fù)更專業(yè)，金融知識理解能力提升明顯；同時在預(yù)訓(xùn)練階段，“軒轅70B”的模型上下文長度擴(kuò)充到8k，能夠處理更長的金融報告、研究和分析。

責(zé)編蒲禎

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。