要聞

騰訊混元上線AI生成視頻并全面開源，文生視頻領(lǐng)域仍處于技術(shù)打磨階段

每日經(jīng)濟(jì)新聞 2024-12-03 19:52:31

12月3日，騰訊在其混元大模型項(xiàng)目中宣布正式上線視頻生成能力，并開源此模型。騰訊混元相關(guān)負(fù)責(zé)人表示，用戶只需輸入一段文字描述，即可生成支持中英文、多尺寸、多清晰度的視頻。此模型現(xiàn)已上線騰訊元寶App的“AI視頻”板塊供用戶試用，同時(shí)通過騰訊云向企業(yè)客戶提供服務(wù)。

每經(jīng)記者黃婉銀每經(jīng)編輯張海妮

12月3日，騰訊混元大模型公布最新進(jìn)展：正式上線視頻生成能力，這是繼文生文、文生圖、3D生成之后的又一里程碑。與此同時(shí)，騰訊開源該視頻生成大模型，參數(shù)量130億，是當(dāng)前最大的視頻開源模型。

“用戶只需要輸入一段描述，即可生成視頻。”騰訊混元相關(guān)負(fù)責(zé)人透露，目前的生成視頻支持中英文雙語輸入、多種視頻尺寸以及多種視頻清晰度。目前該模型已上線騰訊元寶App，用戶可在AI應(yīng)用中的“AI視頻”板塊申請(qǐng)?jiān)囉谩Ｆ髽I(yè)客戶通過騰訊云提供服務(wù)接入，目前API同步開放內(nèi)測(cè)申請(qǐng)。

《每日經(jīng)濟(jì)新聞》記者從上述負(fù)責(zé)人處了解到，作為視頻模型，騰訊混元團(tuán)隊(duì)當(dāng)初在進(jìn)行設(shè)計(jì)時(shí)，在動(dòng)作流暢性和大幅度動(dòng)作上花費(fèi)了很多心思。另外，現(xiàn)在很多視頻模型有個(gè)共同的問題就是在大幅運(yùn)動(dòng)的時(shí)候會(huì)出現(xiàn)畫面抖動(dòng)，這個(gè)難題也是當(dāng)時(shí)其著力解決的事情。

“我們這次模型是全部開源的，遵從混元結(jié)構(gòu)體系，希望豐富社區(qū)，我們的算法模型、加速工程都會(huì)開放給社區(qū)，包括之后的圖聲視頻、驅(qū)動(dòng)綁定和配樂都會(huì)按節(jié)奏去做開源。現(xiàn)在（AI）視頻生成其實(shí)差距還比較大，特別是在文生視頻領(lǐng)域，成熟度其實(shí)遠(yuǎn)沒有到大家想象中那么高。”上述負(fù)責(zé)人告訴記者，一個(gè)月前就已經(jīng)把視頻生成模型訓(xùn)練完畢，現(xiàn)在對(duì)外發(fā)布也是水到渠成。

目前，騰訊宣布開源該視頻生成大模型已在Hugging Face平臺(tái)及Github上發(fā)布，包含模型權(quán)重、推理代碼、模型算法等完整模型，可供企業(yè)與個(gè)人開發(fā)者免費(fèi)使用和開發(fā)生態(tài)插件。

自年初以來，騰訊混元系列模型的開源速度不斷加快。此前，騰訊混元已經(jīng)開源了旗下文生文、文生圖和3D生成大模型。至此，騰訊混元系列大模型已實(shí)現(xiàn)全面開源。

上述負(fù)責(zé)人補(bǔ)充稱，目前文生視頻仍處于著重進(jìn)行技術(shù)打磨的階段。在此階段推出相關(guān)成果，也是期望對(duì)外開源，希望與社區(qū)一起協(xié)作，促使這項(xiàng)技術(shù)早日達(dá)到像圖像生成那樣真正可用的狀態(tài)，當(dāng)下談?wù)撋虡I(yè)化還為時(shí)過早。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

視頻模型 Ai 騰訊

上一篇文章

山水比德與季高集團(tuán)簽署戰(zhàn)略合作

返回每經(jīng)網(wǎng)首頁

下一篇文章

易瑞生物：接受太樸持信私募基金管理有限公司等機(jī)構(gòu)調(diào)研

相關(guān)文章