每日經濟新聞 2025-03-22 14:34:09
每經記者 黃婉銀 每經編輯 文多
3月21日,騰訊宣布推出自研深度思考模型“混元T1”正式版,并同步在騰訊云官網上線。
該模型以騰訊于3月初發布的“混元Turbo S”為基座打造,是一款能秒回、吐字快、擅長超長文處理的強推理模型。
通過大規模強化學習并結合專項優化,混元T1正式版進一步提升了推理能力。與此前已上線騰訊元寶的“混元T1-preview”模型相比,綜合效果明顯提升。
混元T1正式版沿用了混元Turbo S的創新架構,采用Hybrid-Mamba-Transformer融合模式。這是工業界首次將混合Mamba架構無損應用于超大型推理模型。
這一架構有效降低了傳統Transformer結構的計算復雜度,減少了KV-Cache(一種大模型推理性能優化技術)的內存占用,從而顯著降低了訓練和推理成本,讓混元T1實現首字秒出,吐字速度最快可達80tokens/s(Token意為處理文本的最小單元)。
目前,混元T1已在騰訊云官網上線,輸入價格為1元/每百萬tokens,輸出價格為4元/百萬tokens 。
封面圖片來源:每經記者 張建 攝(資料圖)
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP