2023-09-22 16:16:37
9月22日,度小滿宣布“軒轅70B”金融大模型開源,所有用戶均可自由下載和試用,并公布了“軒轅70B”在C-Eval、CMMLU兩大權(quán)威大語言模型評測基準(zhǔn)的成績。數(shù)據(jù)顯示,在C-Eval榜單上,XuanYuan-70B的總成績達(dá)到71.9分;在CMMLU榜單中,以71.05分的高分位居榜首,在兩大權(quán)威榜單上的所有開源模型中排名榜首,也是國內(nèi)首個同時在兩大權(quán)威榜單排名榜首的金融大模型。
C-Eval榜單是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的綜合性考試評測集,幾乎囊括了所有國內(nèi)外的主流模型,覆蓋人文、社科、理工、其他專業(yè)四個大方向的52個學(xué)科,共有13948個多項選擇題和中學(xué)、本科、研究生、職業(yè)四個難度級別,是目前對模型潛力判斷極具權(quán)威性的大模型榜單之一。
CMMLU數(shù)據(jù)集是一個綜合性的中文評估基準(zhǔn),由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出,專門用于評估語言模型在中文語境下的知識和推理能力,共涵蓋了67個主題,涉及自然科學(xué)、社會科學(xué)、工程、人文以及常識等。
金融行業(yè)場景豐富,數(shù)字化程度高,是大模型落地應(yīng)用的最佳場景之一。但金融又是一個高合規(guī)要求的行業(yè),業(yè)務(wù)決策復(fù)雜,大模型真正在金融業(yè)務(wù)中做到實際應(yīng)用還面臨不少挑戰(zhàn)。
度小滿CTO許冬亮表示,“相比通用大模型,‘軒轅70B’金融大模型經(jīng)過度小滿業(yè)務(wù)場景中沉淀的海量金融數(shù)據(jù)訓(xùn)練,對金融知識理解更專業(yè)、更精準(zhǔn),可控性、安全性更高。我們把大模型開源,希望能夠降低大模型在金融行業(yè)的部署和應(yīng)用門檻,促進(jìn)金融行業(yè)服務(wù)效率和服務(wù)體驗的突破性革新”。
“軒轅70B”將在社區(qū)同時開源金融大模型和50G高質(zhì)量金融語料,開源下載地址:https://github.com/Duxiaoman-DI/XuanYuan
今年5月份,度小滿開源了國內(nèi)首個千億參數(shù)的金融大模型,已經(jīng)有上百家金融機(jī)構(gòu)申請試用。本次發(fā)布的新版大模型相較于上一個版本能力全面提升:在增量預(yù)訓(xùn)練和指令微調(diào)階段,加入了度小滿業(yè)務(wù)場景中的海量金融數(shù)據(jù),對金融問題回復(fù)更專業(yè),金融知識理解能力提升明顯;同時在預(yù)訓(xùn)練階段,“軒轅70B”的模型上下文長度擴(kuò)充到8k,能夠處理更長的金融報告、研究和分析。
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP