每日經濟新聞 2024-06-21 19:06:33
每經編輯 張錦河
開欄語:《AIGC行業周報》梳理AIGC行業一周內發生的重要動態,產品發布和業內大咖的最新觀點。
圖片來源:每經制圖
(一)前OpenAI聯合創始人Ilya Sutskever成立新公司
OpenAI聯合創始人Ilya Sutskever宣布成立Safe Superintelligence Inc.(SSI),專注于開發安全超級智能。
SSI致力于實現“核能級別”的安全超級智能,不受短期商業壓力影響,專注于安全性和AI能力的提升。
擁有強大的資金、算力和人才支持,包括與Eric Schmidt的合作和Daniel Gross的天使投資經驗,以及在硅谷和以色列特拉維夫的人才網絡。
(二)2024,有分析稱英偉達要花68億美元買芯片
預計2024年全球HBM芯片總產能約為5600萬顆,英偉達的需求量預計為2700萬顆,基于單顆250美元的成本測算,意味著英偉達全年采購HBM芯片的費用可以預測到68億美元,遠超此前媒體披露的13億美元預算。
CoWoS封裝技術是GPU-HBM芯片的關鍵,臺積電和Amkor為主要供應商。
(一)ShareGPT4Video系列發布
由中國科學技術大學、北京大學等研究人員推出的ShareGPT4Video系列,包含4萬條高質量視頻-字幕數據,旨在提升視頻理解和生成能力。
通過差分滑窗視頻描述策略,創建了能夠為任意視頻生成詳細描述的模型,有助于提高視頻語言模型的性能。
數據集在多個長視頻理解基準上帶來性能增益,同時在視頻生成任務中,使用該數據集訓練的模型展現出更好的鏡頭和語義控制能力。
(二)AI視頻巨頭Runway深夜發布Gen-3
AI視頻制作公司Runway推出了新一代視頻生成模型Gen-3 Alpha,其在細節、一致性和動作表現上進行了顯著改進,達到電影級畫質。
Gen-3 Alpha支持文本到視頻、圖像到視頻等多種功能,被認為將挑戰現有的AI視頻生成技術,包括Sora。
Runway計劃提供定制版本,并宣布了新的安全功能,Gen-3 Alpha即將向付費訂閱者開放。
(三)開源版Sora:單鏡頭16秒720p高清視頻一鍵生成
潞晨團隊Open-Sora項目在720p高清視頻質量和生成時長上取得顯著進展,支持一鍵生成16秒的任意風格高質量視頻,并且宣布全部開源。
引入視頻壓縮網絡和優化的擴散模型算法,發布了1.1B的擴散生成模型,實現了成本與生成質量的平衡,提供了訓練和推理的高效解決方案。
Open-Sora的開源為視頻內容創作者提供了豐富的創作工具,使用戶從消費者轉變為創造者。
(四)Google DeepMind 最新研究:為AI視頻生成創建逼真的背景聲音
DeepMind開發了V2A技術,將視頻像素與自然語言文本相結合,生成與視頻動作同步的逼真音效。
V2A技術能夠為無聲視頻添加相應的背景聲音或對話,提升視頻的真實感和用戶體驗,同時支持對生成音效的創意控制。
V2A基于擴散模型,通過編碼視頻輸入、迭代改進音頻并解碼生成波形實現同步生成,但仍在改進中,如提高音頻質量和唇語同步的準確性。
(五)ChatGPT最新定價體系
OpenAI的ChatGPT提供多種訂閱計劃,滿足從個人到企業的各類需求,包括免費版、ChatGPT Plus、團隊版、企業版、教育版本和非營利組織版本。
免費版用戶可訪問GPT-4o模型和GPT Store,但有日容量限制;ChatGPT Plus提供更高容量和高級數據分析功能;團隊版和企業版提供協作工具、定制應用程序和增強的管理控制。
ChatGPT Edu專為教育機構設計,提供額外的SCIM支持;非營利組織可獲得ChatGPT團隊和企業版的折扣價格。
(六)DreamTech 推出全球首個原生 3D-DiT 大模型 Direct3D
通過3D Diffusion Transformer技術,實現高質量3D內容生成。
解決了傳統2D-to-3D升維技術中的多個問題,如多頭多面、空腔、遮擋等,滿足商業應用需求。
推出面向C端用戶產品,可將圖片/文字轉換為二次元3D人物形象,以及面向創作者的3D內容創作平臺,大幅簡化3D模型獲取流程。
(七)英偉達開源Nemotron-4 340B模型
英偉達發布了一個包含3400億參數的開源模型家族,包括基礎模型、指令模型和獎勵模型,采用NVIDIA Open Model License Agreement,允許分布、修改和使用模型及其輸出。
模型訓練使用了超過98%的合成數據,展示了在生成合成數據方面的能力,有助于訓練更小的語言模型,同時開源了合成數據生成流程。
Nemotron-4 340B性能在多個基準測試中與GPT-4o等專有模型競爭,支持多種語言和編程語言,對商用友好的許可協議,可能對醫療、金融、制造業和零售業等行業產生重大影響。
(一)馬斯克最新專訪:我沒投資任何永生技術,活太久會對社會產生負面影響
人工智能很快會改變一切,最早明年就能帶來顯著改變,五年內將帶來激進變化。
馬斯克認為,人工智能將在搜索領域超越谷歌,提供更為精準、個性化的搜索結果。
馬斯克透露,SpaceX的最終使命是將生命拓展至多個行星,以擴展人類的意識邊界。
馬斯克的腦機接口公司Neuralink正研究大腦芯片,致力于創造人類與人工智能的共生關系。
馬斯克預測,將來每個人至少會擁有一個機器人。全球將有200億臺類似擎天柱的人形機器人。
(二)奧特曼談AI的機遇、挑戰與人類自我反思:中國將擁有獨特的大語言模型
認為AI在提升生產力方面已顯現積極作用,但網絡安全等問題也隨之而來。
GPT-4o能覆蓋97%人群的母語,奧特曼承諾將持續改進,解決語言公平性問題。
面對AI治理的挑戰,OpenAI成立安全委員會,奧特曼強調安全與效率并重。
奧特曼預測在眾多大語言模型,少數將會勝出;中國將會擁有自己獨特的大語言模型。
奧特曼認為AI可能使人類更謙卑,促使我們重新認識自身在宇宙中的位置。
來源:每經科技提供
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP