每日經濟新聞 2024-04-16 23:30:56
每經記者 楊卉 每經編輯 梁梟
來自運營商的大模型正在加速進入市場。4月16日,《每日經濟新聞》記者從中國電信處獲悉,近日中國電信開源了12B參數規模星辰語義大模型TeleChat-12B。相較于1月開源的7B版本,內容、性能和應用等方面整體效果提升了30%。其中,多輪推理、安全問題等領域提升超40%。另外,據了解,中國電信將于年內開源千億級參數大模型。
根據中國電信提供的信息,TeleChat-12B將7B版本1.5T訓練數據提升至3T,此次開源提供基礎模型以及基于相應版本的對話模型,支持傳統的全量參數更新及LoRA等只更新部分參數的高效微調方法;支持Deepspeed微調、支持int8、int4量化和國產芯片訓練推理。中國電信方面表示,星辰語義大模型已應用于行文寫作、代碼編程、網絡故障分析以及經營分析等場景。行文寫作方面,平均生成字數超過1500字,有效采納率為85.7%。
同日,記者還從中國移動處獲悉,近日,國家互聯網信息辦公室發布第五批境內深度合成服務算法備案信息公告,中國移動客服大模型算法通過服務提供者備案,標志著可正式對外提供生成式人工智能服務,成為央企首個全自研、全備案的行業大模型。
據中國移動方面介紹,中國移動客服大模型主要應用于面向客戶的意圖識別與多輪應答,是以“中國移動九天通用大模型”為底座,應用客服領域專業數據訓練的客服行業專業大模型,具備百億參數大模型的通用交互能力和覆蓋中國移動全業務的專業客服能力。
去年以來,運營商切入大模型的意愿已經十分明顯。中國電信就在2023年年報中表示,2024年公司將把握以人工智能為代表的新一輪科技革命和產業變革趨勢;另據東湖國家自主創新示范區官方微信公眾號消息,中國移動九天人工智能團隊將于2024年底對標GPT-4完成多模態大模型訓練,含8款子平臺、287項核心算法能力、37項規模化應用,提供從智算基礎設施、核心算法能力到智能化應用的全棧人工智能服務,可服務政務、工業、教育、醫療等多個領域。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP