每日經(jīng)濟(jì)新聞 2024-09-25 15:02:42
每經(jīng)記者 可楊 每經(jīng)編輯 梁梟
9月25日,生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝在百度云智大會上宣布,生數(shù)科技旗下視頻大模型Vidu正式開放API(應(yīng)用程序編程接口),并同步接入百度智能云千帆大模型平臺,成為平臺接入的首個視頻大模型。
生數(shù)科技作為國內(nèi)最早布局多模態(tài)通用大模型的團(tuán)隊之一,今年4月聯(lián)合清華大學(xué)發(fā)布了視頻大模型Vidu。
6月,生數(shù)科技完成數(shù)億元Pre-A輪融資,由百度、北京市人工智能產(chǎn)業(yè)投資基金領(lǐng)投,中關(guān)村科學(xué)城公司、啟明創(chuàng)投等跟投。彼時,生數(shù)科技方面曾表示,將基于百度百舸·AI異構(gòu)算力平臺持續(xù)訓(xùn)練、提升模型能力,并逐步通過百度智能云千帆平臺開放模型服務(wù)。
據(jù)唐家渝介紹,Vidu采用的架構(gòu)是團(tuán)隊純自研的U-ViT架構(gòu),是全球最早提出的Diffusion Transformer融合架構(gòu),早于Sora的DiT架構(gòu),這為通用生成任務(wù)奠定了重要基礎(chǔ)。
生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝 圖片來源:企業(yè)供圖
他同時表示,Vidu模型具備文生視頻和圖生視頻能力,同時支持中英文指令輸入;在時長方面,Vidu在模型層面最長可支持一鍵32s視頻的生成;畫面質(zhì)感方面,Vidu最高可輸出1080p分辨率。
生數(shù)科技方面表示,目前,影視、動畫、廣告等行業(yè)的企業(yè)機(jī)構(gòu)普遍存在規(guī)模化視頻產(chǎn)出需求,Vidu API的開放,將助力這些企業(yè)在視頻生產(chǎn)環(huán)節(jié)降本增效,并激發(fā)創(chuàng)意。同時對于眾多開發(fā)者而言,Vidu API的開放也為探索AI 2.0應(yīng)用提供了重要基礎(chǔ)。
生數(shù)科技認(rèn)為,視頻大模型高度個性化、自動化的內(nèi)容創(chuàng)作能力,將賦予企業(yè)在營銷、品牌推廣和內(nèi)容創(chuàng)新等場景中的全新競爭力,視頻模型的引入將成為創(chuàng)意產(chǎn)業(yè)提升競爭力的關(guān)鍵因素。基于此背景,開放Vidu API成為生數(shù)科技進(jìn)一步推進(jìn)商業(yè)化布局的重要戰(zhàn)略舉措。
2024年以來,視頻大模型的競爭日趨激烈,9月24日,字節(jié)跳動剛剛宣布發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前,行業(yè)內(nèi)已有快手的視頻生成大模型“可靈”;同時,阿里旗下的通義萬相在9月宣布全面升級,并發(fā)布全新視頻生成模型;圖像賽道的老玩家美圖秀秀同樣在9月宣布旗下的美圖奇想大模型(MiracleVision)視頻生成能力全面升級。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP