要聞

每經網首頁 > 要聞 > 正文

AIGC行業周報 | 2024，有分析稱英偉達要花68億美元買芯片；ShareGPT4Video系列發布；馬斯克：我沒投資任何永生技術，活太久會對社會產生負面影響

每日經濟新聞 2024-06-21 19:06:33

每經編輯張錦河

開欄語：《AIGC行業周報》梳理AIGC行業一周內發生的重要動態，產品發布和業內大咖的最新觀點。

圖片來源：每經制圖

一、企業動態

（一）前OpenAI聯合創始人Ilya Sutskever成立新公司

OpenAI聯合創始人Ilya Sutskever宣布成立Safe Superintelligence Inc.（SSI），專注于開發安全超級智能。

SSI致力于實現“核能級別”的安全超級智能，不受短期商業壓力影響，專注于安全性和AI能力的提升。

擁有強大的資金、算力和人才支持，包括與Eric Schmidt的合作和Daniel Gross的天使投資經驗，以及在硅谷和以色列特拉維夫的人才網絡。

（二）2024，有分析稱英偉達要花68億美元買芯片

預計2024年全球HBM芯片總產能約為5600萬顆，英偉達的需求量預計為2700萬顆，基于單顆250美元的成本測算，意味著英偉達全年采購HBM芯片的費用可以預測到68億美元，遠超此前媒體披露的13億美元預算。

CoWoS封裝技術是GPU-HBM芯片的關鍵，臺積電和Amkor為主要供應商。

二、產品技術動態

（一）ShareGPT4Video系列發布

由中國科學技術大學、北京大學等研究人員推出的ShareGPT4Video系列，包含4萬條高質量視頻-字幕數據，旨在提升視頻理解和生成能力。

通過差分滑窗視頻描述策略，創建了能夠為任意視頻生成詳細描述的模型，有助于提高視頻語言模型的性能。

數據集在多個長視頻理解基準上帶來性能增益，同時在視頻生成任務中，使用該數據集訓練的模型展現出更好的鏡頭和語義控制能力。

（二）AI視頻巨頭Runway深夜發布Gen-3

AI視頻制作公司Runway推出了新一代視頻生成模型Gen-3 Alpha，其在細節、一致性和動作表現上進行了顯著改進，達到電影級畫質。

Gen-3 Alpha支持文本到視頻、圖像到視頻等多種功能，被認為將挑戰現有的AI視頻生成技術，包括Sora。

Runway計劃提供定制版本，并宣布了新的安全功能，Gen-3 Alpha即將向付費訂閱者開放。

（三）開源版Sora：單鏡頭16秒720p高清視頻一鍵生成

潞晨團隊Open-Sora項目在720p高清視頻質量和生成時長上取得顯著進展，支持一鍵生成16秒的任意風格高質量視頻，并且宣布全部開源。

引入視頻壓縮網絡和優化的擴散模型算法，發布了1.1B的擴散生成模型，實現了成本與生成質量的平衡，提供了訓練和推理的高效解決方案。

Open-Sora的開源為視頻內容創作者提供了豐富的創作工具，使用戶從消費者轉變為創造者。

（四）Google DeepMind 最新研究：為AI視頻生成創建逼真的背景聲音

DeepMind開發了V2A技術，將視頻像素與自然語言文本相結合，生成與視頻動作同步的逼真音效。

V2A技術能夠為無聲視頻添加相應的背景聲音或對話，提升視頻的真實感和用戶體驗，同時支持對生成音效的創意控制。

V2A基于擴散模型，通過編碼視頻輸入、迭代改進音頻并解碼生成波形實現同步生成，但仍在改進中，如提高音頻質量和唇語同步的準確性。

（五）ChatGPT最新定價體系

OpenAI的ChatGPT提供多種訂閱計劃，滿足從個人到企業的各類需求，包括免費版、ChatGPT Plus、團隊版、企業版、教育版本和非營利組織版本。

免費版用戶可訪問GPT-4o模型和GPT Store，但有日容量限制；ChatGPT Plus提供更高容量和高級數據分析功能；團隊版和企業版提供協作工具、定制應用程序和增強的管理控制。

ChatGPT Edu專為教育機構設計，提供額外的SCIM支持；非營利組織可獲得ChatGPT團隊和企業版的折扣價格。

（六）DreamTech 推出全球首個原生 3D-DiT 大模型 Direct3D

通過3D Diffusion Transformer技術，實現高質量3D內容生成。

解決了傳統2D-to-3D升維技術中的多個問題，如多頭多面、空腔、遮擋等，滿足商業應用需求。

推出面向C端用戶產品，可將圖片/文字轉換為二次元3D人物形象，以及面向創作者的3D內容創作平臺，大幅簡化3D模型獲取流程。

（七）英偉達開源Nemotron-4 340B模型

英偉達發布了一個包含3400億參數的開源模型家族，包括基礎模型、指令模型和獎勵模型，采用NVIDIA Open Model License Agreement，允許分布、修改和使用模型及其輸出。

模型訓練使用了超過98%的合成數據，展示了在生成合成數據方面的能力，有助于訓練更小的語言模型，同時開源了合成數據生成流程。

Nemotron-4 340B性能在多個基準測試中與GPT-4o等專有模型競爭，支持多種語言和編程語言，對商用友好的許可協議，可能對醫療、金融、制造業和零售業等行業產生重大影響。

三、前沿觀點

（一）馬斯克最新專訪：我沒投資任何永生技術，活太久會對社會產生負面影響

人工智能很快會改變一切，最早明年就能帶來顯著改變，五年內將帶來激進變化。

馬斯克認為，人工智能將在搜索領域超越谷歌，提供更為精準、個性化的搜索結果。

馬斯克透露，SpaceX的最終使命是將生命拓展至多個行星，以擴展人類的意識邊界。

馬斯克的腦機接口公司Neuralink正研究大腦芯片，致力于創造人類與人工智能的共生關系。

馬斯克預測，將來每個人至少會擁有一個機器人。全球將有200億臺類似擎天柱的人形機器人。

（二）奧特曼談AI的機遇、挑戰與人類自我反思：中國將擁有獨特的大語言模型

認為AI在提升生產力方面已顯現積極作用，但網絡安全等問題也隨之而來。

GPT-4o能覆蓋97%人群的母語，奧特曼承諾將持續改進，解決語言公平性問題。

面對AI治理的挑戰，OpenAI成立安全委員會，奧特曼強調安全與效率并重。

奧特曼預測在眾多大語言模型，少數將會勝出；中國將會擁有自己獨特的大語言模型。

奧特曼認為AI可能使人類更謙卑，促使我們重新認識自身在宇宙中的位置。

來源：每經科技提供

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

視頻模型英偉達馬斯克

上一篇文章

海航控股：李殿春辭去公司副總裁職務

返回每經網首頁

下一篇文章

今年一月以來首艘液化天然氣運輸船穿越紅海

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

AIGC行業周報 | 2024，有分析稱英偉達要花68億美元買芯片；ShareGPT4Video系列發布；馬斯克：我沒投資任何永生技術，活太久會對社會產生負面影響

一、企業動態

二、產品技術動態

三、前沿觀點