每日經濟新聞 2024-09-02 21:02:50
◎MiniMax音樂生成模型與視頻生成模型已經在開放平臺和“海螺AI”網頁版上線。作為創業公司,MiniMax會不可避免地與大廠進行正面競爭。對此,閆俊杰表示:“當開始意識到那些比你大好多倍的公司都開始跟你競爭的時候,就意識到有些東西是沒用的,因為在那些東西上,大廠比你強百倍千倍,我們能做的就是(把)有可能變強的事無限地放大。”
每經記者 陳婷 每經編輯 文多
向來低調的AI獨角獸企業“MiniMax”公布了最新的業務進展。
在周末(8月31日)舉行的“2024 MiniMax Link伙伴日”活動上,MiniMax創始人閆俊杰宣布推出音樂生成模型與視頻生成模型。
圖片來源:每經記者 陳婷 攝
在接受包括《每日經濟新聞》等媒體的記者采訪時,閆俊杰表示,在視頻方面,這次MiniMax取得了很大的進展。“這個東西只是我們的第一版,很快還會有更新的版本,我們的策略是再等一兩周,等新的東西出來,到了一個更加滿意的狀態之后,可能會考慮一些商業化,把好的技術開放給廣大的開發者和B端客戶使用。” 閆俊杰介紹說。
MiniMax音樂生成模型與視頻生成模型已經在開放平臺和“海螺AI”網頁版上線。此外,記者從MiniMax處了解到,采用新一代技術的“abab7”系列文本模型也將于未來數周內正式發布。
在海螺AI網頁版,記者體驗了視頻生成模型。輸入一段簡單的創意描述內容之后,該模型可在1到2分鐘內輸出一個包含描述內容的視頻。
今年5月,MiniMax宣布上架了C端產品“海螺AI”,其1秒內可處理近3萬字的文本,進行書籍、長篇報告、學術論文等長篇內容的閱讀、分析和文本寫作。此外,MiniMax在AI內容社區上已經有所建樹。針對國外和國內市場,分別推出了“Talkie”和“星野”。
“為什么我們推出比‘可靈’(快手推出的AI創意生產力平臺)要晚一兩個月?”閆俊杰表示,核心在于MiniMax在解決一個更難的技術問題,即如何“原生訓練”算力比較高的東西。
知名風投機構“a16z”最新發布的《Top100消費級生成式AI應用》移動應用榜單中,Talkie位列22位。另據MiniMax提供的數據,MiniMax每日與全球用戶進行超30億次交互,處理超3萬億文本token(詞元)、2000萬張圖片和7萬小時語音。
在本次公開發布之前,MiniMax對外交流并不多,此前受到的普遍關注也與融資進展有關。
天眼查顯示,2024年3月,MiniMax背后的上海稀宇極智科技有限公司完成了B輪的6億美元融資,投資方為阿里巴巴,其估值達到25億美元。此前的2023年6月,MiniMax完成了超2.5億美元的A輪融資,投資方為騰訊投資。
作為一家大廠連續加碼的AI獨角獸,MiniMax已經推出了多款產品。
以星野為例,資料顯示,作為MiniMax旗下的AI原生應用,其致力于為用戶打造沉浸式AI內容社區,于2023年9月上線。
閆俊杰透露,星野這樣的產品,其底層設計并不是陪伴用戶聊天,底層設計實際上是一個內容社區。在其中,可以有一些用戶創建一些角色,此外,現在也提供了更復雜的工具,用戶可以在里面創建故事、創作世界觀。同時另外一些用戶可以根據創造的世界觀進行互動。
在發布星野之前,MiniMax已經于去年6月發布出海產品Talkie。根據數據分析公司Sensor Tower的數據,Talkie在美國免費娛樂類應用榜上排名第五,全球月活躍用戶數已達1100萬。此外,根據 智能服務商QuestMobile 數據,星野活躍率達到25.7%,月人均使用天數為7.7天。
值得一提的是,據媒體報道,谷歌花費了數十億美元,吸納了聊天機器人初創公司“Character.AI” 的聯合創始人諾姆·沙澤爾、丹尼爾·德弗雷塔斯,以及研發人員約30名,并與Character.AI達成了許可協議。同時,谷歌將以25億美元的估值收購Character.AI投資者的股票。
關于海外業務的進展,MiniMax國際業務總經理盛靜遠對記者表示,很早之前Character.AI是比較有名的。“現在他的核心團隊被谷歌收走之后,我們成了賽道的扛大旗者,我們在做的事情是不斷地破圈。我們做的不是陪聊,也不是AI的情感陪伴,就是新一代的內容生成平臺。”盛靜遠說道。
此外,今年5月,“海螺AI”也已經上線。據MiniMax官方公眾號披露,海螺AI背后接入了 MiniMax自研的多模態大模型,包括萬億參數MoE(混合專家)大語言模型 “abab6.5”,語音大模型和圖像大模型。這些技術讓海螺AI可以在1秒內處理近3萬字的文本。
閆俊杰表示,星野的用戶畫像以二三線城市居民為主,年齡在17歲到25歲之間。據他透露,海螺用戶畫像更泛一些,因為海螺本來就是工具型的產品。
就商業化進展等問題,閆俊杰回復稱,整個公司的商業化基本上分成兩個形式,其中的一個形式就是MiniMax開放平臺,它目前擁有超過3萬名企業客戶和開發者。此外,閆俊杰表示,MiniMax的產品里面也有廣告的機制,廣告本身也可以進行商業化的變現。
他認為,在目前的階段,最重要的東西還不是商業化,是技術能達到廣泛“可用”的程度。
2024 年以來,AI 視頻生成模型正在加速涌現。
2024年2月,OpenAI 的視頻生成大模型 Sora 橫空出世,可輸出長達60秒的視頻,不僅能準確呈現細節,還能理解物體在物理世界中的存在,被視為視頻創作領域里程碑式的產品。
根據興業證券相關研報統計,年中以來,中國自研視頻生成大模型也在加速涌現。
當前,“即夢”(抖音旗下)、“可靈”(快手旗下)、“清影”(智譜旗下)等產品已對公眾開放,在幀率、視頻時長、清晰度等層面接近或超過了海外已開放的主流視頻大模型,并且實現了背景音樂、首尾幀、視頻延長、口型驅動等技術集成。
對于切入視頻生成模型混戰的原因,閆俊杰表示,MiniMax一直以來的目標是要做動態的輸出。
“我們每天看的大部分內容,都不是文字,而是一些動態的東西。打開小紅書都是圖文,打開抖音都是視頻,甚至打開拼多多買東西,大部分時候也是圖片。”閆俊杰表示,為了能夠有非常高的用戶覆蓋度,有非常高的使用深度,唯一的辦法是能夠輸出動態的內容,而不是輸出單純基于文字的內容。
閆俊杰透露,其實(MiniMax)很早就做出來了圖片,只是現在技術變得更強,把視頻也做了出來。“這個路線是一以貫之的,一定要能夠做多模態。”
閆俊杰也提到,做視頻生成模型的工作復雜度比文本更難,因為視頻的Context(上下文的文本)天然很長。其次,視頻量很大,比如一個5秒的視頻,大小可能有幾兆,但是5秒的文字,大小可能都不到1K,這是幾千倍的存儲差距。
“這里面的挑戰在于,之前基于文本而構建的這套底層基礎設施怎么處理數據、怎么清洗數據、怎么來標注。(但這些)對視頻都不太適用,意味著基礎設施也需要升級。”閆俊杰說。
興業證券的相關研報提及,AI生成視頻模型已在短劇領域取得顯著成果,未來有望賦能對畫面的精度和時長要求更高的長視頻和電影。
北京社科院副研究員王鵬對《每日經濟新聞》記者表示,隨著短視頻、直播等新型媒體形式的興起,視頻內容的需求量急劇增加。視頻生成模型能夠滿足這一需求,為內容創作者提供高效、低成本的視頻制作工具。
值得一提的是,作為創業公司,MiniMax會不可避免地與大廠進行正面競爭。
對此,閆俊杰表示:“當開始意識到那些比你大好多倍的公司都開始跟你競爭的時候,就意識到有些東西是沒用的,因為在那些東西上,大廠比你強百倍千倍,我們能做的就是(把)有可能變強的事無限地放大。”
對于這“可能變強的事”,他提到了兩點,一是技術如何提升,二是如何跟用戶做更好的共創,“這兩點都需要一些非常關鍵的判斷,需要非常長期的積累”。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP