亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
頭條

每經網首頁 > 頭條 > 正文

OpenAI首席技術官最新透露:Sora預計將在今年發布,計劃加入語音功能,還有這些“干貨”

每日經濟新聞 2024-03-15 09:36:41

每經編輯 杜宇

OpenAI似乎已經在為Sora降世預熱了。

當地時間3月13日周三,OpenAI首席技術官米拉·穆拉蒂(Mira Murati)接受了《華盛頓郵報》的視頻專訪。

穆拉蒂在接受采訪時透露,目前利用Sora生成視頻的成本非常高,團隊正在優化技術,預計將在今年正式發布。

穆拉蒂透露,OpenAI人工智能文生視頻大模型Sora即將于今年晚些時候正式向公眾發布,OpenAI計劃最終加入音頻功能,以使場景更為真實,同時還將允許用戶編輯Sora生成的視頻內容。

除此之外,穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會包含音頻、訓練數據來自哪里等若干問題。給出的答案有的籠統,有的不乏誠意。

Sora如何“化文字為神奇”?請你想象一幕場景:“一條美人魚和她的螃蟹伙伴,正在一起瀏覽智能手機……”

作為這場媒體采訪的“福利”,主持人獲得了讓Sora將其提供的多組文本提示,轉化為視頻圖像的機會,而以上的這一幕,便是Sora提供的視頻中的一幀。

圖片來源:視頻截圖

Sora究竟是如何實現這一轉換的呢?穆拉蒂表示,盡管解釋美人魚的進化可能都要比解釋“擴散模型”(diffusion models)的內部運作容易得多,但簡而言之便是:人工智能模型分析了大量視頻,學會了識別物體和動作。然后,當你給它一個文字提示時,它就會勾勒出整個場景,然后填充每一幀。

在被問及OpenAI為Sora使用了哪些訓練數據時,穆拉蒂指出,“我們使用了公開數據和授權數據”。

在另外一段視頻里,主持人要求Sora制作一段她更為符合這場采訪的內容:“兩位30多歲、有著棕色頭發的職業女性,在一個光線充足的演播室里坐下來接受新聞采訪。”

圖片來源:視頻截圖

最終,在Sora交出的“作業”里,無論是兩位女性嘴型和頭發的動捕,還是皮夾克上的細節,一切看起來都那么真實。Murati指出,這段20秒的720p分辨率短片,Sora花了幾分鐘才制作完成,但目前還未能支持配備音效。

但穆拉蒂已承諾,他們計劃最終會添加聲音。

Murati還表示,當前Sora生成視頻的成本遠高于該公司的圖像生成器Dall-E。不過,在未來向公眾正式發布時,OpenAI將進行優化,以降低對算力的需求。

北京時間2月16日,OpenAI發布文生視頻模型Sora,效果驚艷,引爆全球。此時距離OpenAI推出ChatGPT,開啟生成式AI時代,僅僅過去了14個月時間,AI的進化速度令人震驚。

在Sora生成的視頻里,女士身著黑色皮衣、紅色裙子在霓虹街頭行走,不僅主體連貫穩定,還有多鏡頭,包括從大街景慢慢切入到對女士的臉部表情的特寫,以及潮濕的街道地面反射霓虹燈的光影效果。

YicUhk5aAGtDoBER8LFLgvz8xKobGQbcJT9AzRVsz8VCFpicDelz9Dnsu9cE29dzAs7BP6eWBLwgyhDXCFxiaDTEw.jpg

圖片來源:視頻截圖

Sora的研究結果表明,擴展視頻生成模型是構建物理世界通用模擬器一條極具前景的途徑,它使人工智能理解和模擬運動中的物理世界邁向了一個新的高度。

有業內人士預言,通用人工智能(AGI)將比預期更早到來,產業差距將拉大。此外,文生視頻所帶來的顛覆性影響引發了人們的擔憂,亦有遠慮者就真實與虛擬間模糊的邊界反復預警。但少有爭議的一點是,Sora被認為有望推動AI應用加速落地。

與此同時,Sora的誕生引發了人們對于AI未來發展的更多展望。隨著技術的不斷進步,AI將在更多領域發揮更大的作用。無論是工業生產、教育培訓還是娛樂休閑等領域,AI都將為人類帶來更多的驚喜和可能性。

2月16日,360創始人周鴻祎發布微博提到自己對Sora的看法,周鴻祎認為,Sora的誕生意味著AGI(通用人工智能)實現可能從10年縮短至一兩年。

談到Sora最大的優勢,周鴻祎表示,以往文生視頻軟件都是在2D平面上對圖形元素進行操作,可以把視頻看成是多個真實圖片的組合,并沒有真正掌握這個世界的知識。但Sora產生的視頻里,它能像人一樣理解坦克是有巨大沖擊力的,坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的情況,“這次OpenAI利用它的大語言模型優勢,讓Sora實現了對現實世界的理解和對世界的模擬兩層能力,這樣產生的視頻才是真實的,才能跳出2D的范圍模擬真實的物理世界。”

周鴻祎提到,有了大模型技術作為基礎,再加上人類知識的引導,可以創造各個領域的超級工具,例如在生物醫學、蛋白質、基因研究,包括物理、化學、數學的學科研究上,大模型都會發揮作用。

“一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠遠超過文字學習,一幅圖勝過千言萬語,這就離AGI真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現。”周鴻祎感慨。

每日經濟新聞綜合OpenAI官網、每日經濟新聞、公開資料

封面圖片來源::視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

OpenAI似乎已經在為Sora降世預熱了。 當地時間3月13日周三,OpenAI首席技術官米拉·穆拉蒂(Mira Murati)接受了《華盛頓郵報》的視頻專訪。 穆拉蒂在接受采訪時透露,目前利用Sora生成視頻的成本非常高,團隊正在優化技術,預計將在今年正式發布。 穆拉蒂透露,OpenAI人工智能文生視頻大模型Sora即將于今年晚些時候正式向公眾發布,OpenAI計劃最終加入音頻功能,以使場景更為真實,同時還將允許用戶編輯Sora生成的視頻內容。 除此之外,穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會包含音頻、訓練數據來自哪里等若干問題。給出的答案有的籠統,有的不乏誠意。 Sora如何“化文字為神奇”?請你想象一幕場景:“一條美人魚和她的螃蟹伙伴,正在一起瀏覽智能手機……” 作為這場媒體采訪的“福利”,主持人獲得了讓Sora將其提供的多組文本提示,轉化為視頻圖像的機會,而以上的這一幕,便是Sora提供的視頻中的一幀。 圖片來源:視頻截圖 Sora究竟是如何實現這一轉換的呢?穆拉蒂表示,盡管解釋美人魚的進化可能都要比解釋“擴散模型”(diffusion models)的內部運作容易得多,但簡而言之便是:人工智能模型分析了大量視頻,學會了識別物體和動作。然后,當你給它一個文字提示時,它就會勾勒出整個場景,然后填充每一幀。 在被問及OpenAI為Sora使用了哪些訓練數據時,穆拉蒂指出,“我們使用了公開數據和授權數據”。 在另外一段視頻里,主持人要求Sora制作一段她更為符合這場采訪的內容:“兩位30多歲、有著棕色頭發的職業女性,在一個光線充足的演播室里坐下來接受新聞采訪。” 圖片來源:視頻截圖 最終,在Sora交出的“作業”里,無論是兩位女性嘴型和頭發的動捕,還是皮夾克上的細節,一切看起來都那么真實。Murati指出,這段20秒的720p分辨率短片,Sora花了幾分鐘才制作完成,但目前還未能支持配備音效。 但穆拉蒂已承諾,他們計劃最終會添加聲音。 Murati還表示,當前Sora生成視頻的成本遠高于該公司的圖像生成器Dall-E。不過,在未來向公眾正式發布時,OpenAI將進行優化,以降低對算力的需求。 北京時間2月16日,OpenAI發布文生視頻模型Sora,效果驚艷,引爆全球。此時距離OpenAI推出ChatGPT,開啟生成式AI時代,僅僅過去了14個月時間,AI的進化速度令人震驚。 在Sora生成的視頻里,女士身著黑色皮衣、紅色裙子在霓虹街頭行走,不僅主體連貫穩定,還有多鏡頭,包括從大街景慢慢切入到對女士的臉部表情的特寫,以及潮濕的街道地面反射霓虹燈的光影效果。 圖片來源:視頻截圖 Sora的研究結果表明,擴展視頻生成模型是構建物理世界通用模擬器一條極具前景的途徑,它使人工智能理解和模擬運動中的物理世界邁向了一個新的高度。 有業內人士預言,通用人工智能(AGI)將比預期更早到來,產業差距將拉大。此外,文生視頻所帶來的顛覆性影響引發了人們的擔憂,亦有遠慮者就真實與虛擬間模糊的邊界反復預警。但少有爭議的一點是,Sora被認為有望推動AI應用加速落地。 與此同時,Sora的誕生引發了人們對于AI未來發展的更多展望。隨著技術的不斷進步,AI將在更多領域發揮更大的作用。無論是工業生產、教育培訓還是娛樂休閑等領域,AI都將為人類帶來更多的驚喜和可能性。 2月16日,360創始人周鴻祎發布微博提到自己對Sora的看法,周鴻祎認為,Sora的誕生意味著AGI(通用人工智能)實現可能從10年縮短至一兩年。 談到Sora最大的優勢,周鴻祎表示,以往文生視頻軟件都是在2D平面上對圖形元素進行操作,可以把視頻看成是多個真實圖片的組合,并沒有真正掌握這個世界的知識。但Sora產生的視頻里,它能像人一樣理解坦克是有巨大沖擊力的,坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的情況,“這次OpenAI利用它的大語言模型優勢,讓Sora實現了對現實世界的理解和對世界的模擬兩層能力,這樣產生的視頻才是真實的,才能跳出2D的范圍模擬真實的物理世界?!? 周鴻祎提到,有了大模型技術作為基礎,再加上人類知識的引導,可以創造各個領域的超級工具,例如在生物醫學、蛋白質、基因研究,包括物理、化學、數學的學科研究上,大模型都會發揮作用。 “一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠遠超過文字學習,一幅圖勝過千言萬語,這就離AGI真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現。”周鴻祎感慨。 每日經濟新聞綜合OpenAI官網、每日經濟新聞、公開資料
Sora 視頻 Ai OpenAI

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0