亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

大模型“混戰(zhàn)”,云端競爭時代到來

每日經(jīng)濟新聞 2023-06-05 23:52:26

“現(xiàn)在大語言模型出現(xiàn)以后,云端就開始被開發(fā)出來,云端的競爭將成為下一場互聯(lián)網(wǎng)競爭的窗戶。”

每經(jīng)記者 石普寧    每經(jīng)編輯 唐元    

“國內(nèi)現(xiàn)在是‘百大戰(zhàn)’,這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來城與智媒體”首屆成都東部新區(qū)·成渝地區(qū)雙城經(jīng)濟圈城市媒體發(fā)展大會暨城市機會清單發(fā)布活動上,北京師范大學新聞傳播學院院長張洪忠表示,大模型讓所有的互聯(lián)網(wǎng)公司都有一個新的機會重新開始。

如何理解“大模型”?或許可以從架構(gòu)上出發(fā)。簡單來說,如今的IT技術(shù)棧分為四層,芯片層、框架層、模型層和應用層。

“今天的ChatGPT、文心一言等屬于模型層,AI時代的原生應用都會基于大模型來開發(fā)。”百度CEO李彥宏在第七屆世界智能大會上曾如此說

開春以來,隨著以大模型的應用為標志的AI2.0時代加速到來,人工智能概念大火。

在國內(nèi),以大廠領頭的各大企業(yè)紛紛宣布各自的大模型與產(chǎn)品,通用大模型也迎來一波創(chuàng)業(yè)潮,一時間市場上熱鬧紛呈,任何人都不愿錯失良機。

縱觀各類大模型產(chǎn)品的“出生”,其中既有來自熟悉的大廠如百度、阿里,也有來自專注人工智能領域的企業(yè)如商湯,更有創(chuàng)業(yè)者“另起爐灶”,典型如美團聯(lián)合創(chuàng)始人王慧文,稱要打造“中國的OpenAI”。

在“百模混戰(zhàn)”的背景下,如今各家的“戰(zhàn)況”如何,在大模型“一窩蜂”闖入視野的同時,我們正在迎接怎樣的科技變革?

各路產(chǎn)品業(yè)已上馬

“ChatGPT從去年11月份進入社會視野,有兩個最大的突破點:第一個是開放域的多輪對話,第二個是生成性的文本。”張洪忠表示,兩個技術(shù)的突破意味著人機交往的新時代到來,“這是一個巨大的革命性突破。” 

視線投向國內(nèi)互聯(lián)網(wǎng)巨頭,在大模型技術(shù)上積累較為深厚的百度和阿里率先出手,分別于3月16日與4月7日推出“文心一言”以及“通義千問”。

圖片來源:“百度文心一言”公眾號

自內(nèi)測以來,文心一言完成了4次技術(shù)版本升級:如今的推理成本降到了原來的十分之一,推理性能提升近10倍。

“當別人剛剛思考如何進行訓練的時候,我們已經(jīng)在推理上沖出了很遠。”5月,李彥宏在百度內(nèi)部大會上說。

此外,文心一言還將逐步融入百度所有業(yè)務

5月16日,百度發(fā)布了第一季度未經(jīng)審計的財務報告,李彥宏表示,“我們計劃逐步將文心一言融入我們的所有業(yè)務,為我們的產(chǎn)品及服務賦能,吸引更廣泛的用戶及客戶。圍繞文心一言在新的時代中建立新生態(tài)。這也將助力我們實現(xiàn)長期、可持續(xù)的增長。”

無獨有偶,一個多月前,在阿里云峰會正式推出“通義千問”之際,阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇亦表示,阿里巴巴所有產(chǎn)品未來將接入通義千問大模型并進行全面改造。“面向AI時代,所有產(chǎn)品都值得用大模型重新升級。

6月1日,阿里云對外披露通義大模型最新進展,瞄向AI音視頻賽道推出“通義聽悟”,并且正式開啟公測。

據(jù)阿里云CTO周靖人介紹,通義聽悟作為一款工作學習AI助手,不僅“聽力好”,能夠高準確度生成會議記錄、區(qū)分不同發(fā)言人,而且“悟性極高”,可以一秒給音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個發(fā)言人觀點、整理關注重點和待辦事項。

圖片來源:“阿里云”公眾號

除了大廠動作頻頻之外,AI科技企業(yè)也對這塊“蛋糕”虎視眈眈。

4月,計算機視覺公司商湯科技于推出“日日新”(SenseNova),其中包括自然語言處理模型“商量”(SenseChat)、文生圖模型“秒畫”和數(shù)字人視頻生成平臺“如影”(SenseAvatar)等。

同月,決策類AI公司第四范式首次向公眾展示 “式說3.0”,瞄準生成式AI對企業(yè)級軟件重構(gòu)和改變的增長空間和市場機會。

值得一提的是,就大模型產(chǎn)品而言,騰訊則“低調(diào)”不少,并不打算“拼速度”。

在3月騰訊發(fā)布2022年四季度財報后,騰訊總裁劉熾平透露了包括聊天機器人在內(nèi)的即將發(fā)布的眾多產(chǎn)品的計劃。他表示,騰訊不會匆忙推出產(chǎn)品,而將花費時間打造一個經(jīng)過多次迭代后的長期發(fā)展機會。

此外,大廠如字節(jié)跳動則選擇扮演類似微軟的角色,旗下的火山引擎推出大模型訓練云平臺,為大模型公司提供算力等技術(shù)服務。火山引擎總裁譚待表示,火山引擎不做大模型,將化身賦能者,為大模型客戶提供算力等AI基礎設施,幫助其做好大模型開發(fā)。

圖片來源:“火山引擎”公眾號

作業(yè)幫教育大模型正在內(nèi)測

除了科技企業(yè),記者從作業(yè)幫獲悉,目前作業(yè)幫正在內(nèi)測基于中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景,涉及工具類App、智能硬件、圖書等業(yè)務。據(jù)內(nèi)部人士透露,教育場景中綜合能力表現(xiàn)超出預期水平。

針對此事,財經(jīng)網(wǎng)科技向作業(yè)幫方面進行求證,作業(yè)幫相關工作人員回復,作業(yè)幫教育大模型目前在內(nèi)測階段,相關評估及備案等工作正在進行中。

一位接近作業(yè)幫人士表示,作業(yè)幫在今年年初就啟動了自研教育GPT項目,從各個業(yè)務模塊調(diào)集技術(shù)精英組成原始團隊。今年3月份,作業(yè)幫內(nèi)部郵件宣布,再次加大投入,并進行組織架構(gòu)調(diào)整。目前該項目由CTO羅亮牽頭進行底層研發(fā)支持及AIGC大方向建設,研發(fā)經(jīng)費優(yōu)先調(diào)撥。

該人士進一步表示,除了組織架構(gòu)調(diào)整,作業(yè)幫產(chǎn)研團隊中近百人也已并入GPT相關項目,“從技術(shù)到產(chǎn)品側(cè),分不同落地場景在‘跑’項目,估計有兩百人以上的團隊規(guī)模”。

另一位作業(yè)幫內(nèi)部人士透露, “從過往技術(shù)能力積累來看,作業(yè)幫優(yōu)勢明顯,不做這件事才奇怪。”該人士稱,經(jīng)過半年的技術(shù)研發(fā),作業(yè)幫內(nèi)部對自研GPT比較有信心,已經(jīng)優(yōu)先“解鎖”解題能力、中英文作文批改、知識問答等產(chǎn)品級應用,進展比想象中順利,已經(jīng)在一些教育場景中達到了行業(yè)top水平。

圖片來源:“作業(yè)幫”公眾號

云端競爭時代已經(jīng)到來

“現(xiàn)在大語言模型出現(xiàn)以后,云端就開始被開發(fā)出來,云端的競爭將成為下一場互聯(lián)網(wǎng)競爭的窗戶。”張洪忠稱。

據(jù)Canalys數(shù)據(jù)顯示,去年中國云計算市場同比增長10%,前四大云計算廠商阿里云、華為云、騰訊云和百度智能云,合計增長9%,占云服務客戶支出總額的79%。

張洪忠認為,對于應用而言,“對話即平臺”成為現(xiàn)實,對話可以解決多模態(tài)的問題。例如,把ChatGPT的API接上以后,大模型就可以畫圖、做平面設計、寫文案等等。

而要更深層次理解大模型,“涌現(xiàn)”是一個關鍵的概念。

簡單來說,涌現(xiàn)指的是當大模型的數(shù)據(jù)量達到一定量的時候,一種產(chǎn)生質(zhì)變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時指出,業(yè)界普遍的共識在于,500-600億機器訓練參數(shù)是大模型智能涌現(xiàn)的門檻

這也是ChatGPT“大力出奇跡”的基礎,早前“掀起蝴蝶翅膀”的GPT-3模型,就已經(jīng)有1750億個參數(shù)。OpenAI沒有進一步公布GPT-4的參數(shù)數(shù)量。作為對比,谷歌新推出的PaLM2訓練參數(shù)已經(jīng)達到3400億個。

“算力是競爭的基礎,”張洪忠提,目前很多想要從事相關研究的老師從大學轉(zhuǎn)到企業(yè),就是因為大學無法承載如此龐大的算力需求以及巨額費用。

一個典型的例子是,作為算力基礎GPU的供應商英偉達,近日市值一度突破萬億美元,其A100芯片、H100芯片在全球具有絕對優(yōu)勢。就國內(nèi)的A100芯片而言,主要被百度、阿里等大廠掌握在手中。

英偉達CEO黃仁勛 圖片來源:英偉達官網(wǎng)截圖

換句話說,大模型產(chǎn)品競爭費用不菲,這也是一些國內(nèi)大模型產(chǎn)品采用邀請測試或是不面向C端的主要考慮。

據(jù)國盛證券估算,GPT-3的單次訓練成本就高達140萬美元,對于一些更大的LLM(大型語言模型),訓練成本介于200萬美元至1200萬美元之間。

在這其中,大部分費用是電費,計算機專家吳軍曾提“大概可能是3000輛特斯拉的電動汽車,每輛跑到20萬英里(約32.19萬公里),把它跑‘死’,這么大的耗電量,才夠ChatGPT訓練一次。”

在如此高昂成本之下,各互聯(lián)網(wǎng)大廠也爭相入場,或許都是因為看重大模型產(chǎn)品背后掙到“真金白銀”的可能。

李彥宏就提道,初創(chuàng)企業(yè)“沒有必要再重新發(fā)明一遍輪子(基礎大模型)”,它們的機會是在應用層,將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機遇”。當然,百度自己想要做“輪子”。

在張洪忠看來,互聯(lián)網(wǎng)經(jīng)歷了三大時代:PC互聯(lián)網(wǎng)時代,2010年之后的移動互聯(lián)網(wǎng)時代,以及可能進入的下一個時代——大模型時代。他表示,“我們未來的互聯(lián)網(wǎng)競爭,幾乎都要建立在大模型基礎上。”

他進一步提,移動互聯(lián)網(wǎng)時代,誰都想不到當時如日中天的四大門戶——新浪、騰訊、網(wǎng)易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。

“同樣的,今天我們到了大模型時代,在大模型基礎之上的應用就可能會產(chǎn)生新的技術(shù),這就是人工智能技術(shù)帶給我們的希望和變數(shù),包括一些新的產(chǎn)業(yè)發(fā)展契機。

本文作者系天府文創(chuàng)云記者石普寧,轉(zhuǎn)載合作相關可搜索“天府文創(chuàng)云”公眾號。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

“國內(nèi)現(xiàn)在是‘百模大戰(zhàn)’,這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來城與智媒體”首屆成都東部新區(qū)·成渝地區(qū)雙城經(jīng)濟圈城市媒體發(fā)展大會暨城市機會清單發(fā)布活動上,北京師范大學新聞傳播學院院長張洪忠表示,大模型讓所有的互聯(lián)網(wǎng)公司都有一個新的機會重新開始。 如何理解“大模型”?或許可以從架構(gòu)上出發(fā)。簡單來說,如今的IT技術(shù)棧分為四層,芯片層、框架層、模型層和應用層。 “今天的ChatGPT、文心一言等屬于模型層,AI時代的原生應用都會基于大模型來開發(fā)。”百度CEO李彥宏在第七屆世界智能大會上曾如此說道。 自開春以來,隨著以大模型的應用為標志的AI2.0時代加速到來,人工智能概念大火。 在國內(nèi),以大廠領頭的各大企業(yè)紛紛宣布各自的大模型與產(chǎn)品,通用大模型也迎來一波創(chuàng)業(yè)潮,一時間市場上熱鬧紛呈,任何人都不愿錯失良機。 縱觀各類大模型產(chǎn)品的“出生”,其中既有來自熟悉的大廠如百度、阿里,也有來自專注人工智能領域的企業(yè)如商湯,更有創(chuàng)業(yè)者“另起爐灶”,典型如美團聯(lián)合創(chuàng)始人王慧文,稱要打造“中國的OpenAI”。 在“百模混戰(zhàn)”的背景下,如今各家的“戰(zhàn)況”如何,在大模型“一窩蜂”闖入視野的同時,我們正在迎接怎樣的科技變革? 各路產(chǎn)品業(yè)已上馬 “ChatGPT從去年11月份進入社會視野,有兩個最大的突破點:第一個是開放域的多輪對話,第二個是生成性的文本。”張洪忠表示,兩個技術(shù)的突破意味著人機交往的新時代到來,“這是一個巨大的革命性突破。” 視線投向國內(nèi)互聯(lián)網(wǎng)巨頭,在大模型技術(shù)上積累較為深厚的百度和阿里率先出手,分別于3月16日與4月7日推出“文心一言”以及“通義千問”。 圖片來源:“百度文心一言”公眾號 自內(nèi)測以來,文心一言完成了4次技術(shù)版本升級:如今的推理成本降到了原來的十分之一,推理性能提升近10倍。 “當別人剛剛思考如何進行訓練的時候,我們已經(jīng)在推理上沖出了很遠。”5月,李彥宏在百度內(nèi)部大會上說。 此外,文心一言還將逐步融入百度所有業(yè)務。 5月16日,百度發(fā)布了第一季度未經(jīng)審計的財務報告,李彥宏表示,“我們計劃逐步將文心一言融入我們的所有業(yè)務,為我們的產(chǎn)品及服務賦能,吸引更廣泛的用戶及客戶。圍繞文心一言在新的時代中建立新生態(tài)。這也將助力我們實現(xiàn)長期、可持續(xù)的增長。” 無獨有偶,一個多月前,在阿里云峰會正式推出“通義千問”之際,阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇亦表示,阿里巴巴所有產(chǎn)品未來將接入通義千問大模型并進行全面改造。“面向AI時代,所有產(chǎn)品都值得用大模型重新升級。” 6月1日,阿里云對外披露通義大模型最新進展,瞄向AI音視頻賽道推出“通義聽悟”,并且正式開啟公測。 據(jù)阿里云CTO周靖人介紹,通義聽悟作為一款工作學習AI助手,不僅“聽力好”,能夠高準確度生成會議記錄、區(qū)分不同發(fā)言人,而且“悟性極高”,可以一秒給音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個發(fā)言人觀點、整理關注重點和待辦事項。 圖片來源:“阿里云”公眾號 除了大廠動作頻頻之外,AI科技企業(yè)也對這塊“蛋糕”虎視眈眈。 4月,計算機視覺公司商湯科技于推出“日日新”(SenseNova),其中包括自然語言處理模型“商量”(SenseChat)、文生圖模型“秒畫”和數(shù)字人視頻生成平臺“如影”(SenseAvatar)等。 同月,決策類AI公司第四范式首次向公眾展示“式說3.0”,瞄準生成式AI對企業(yè)級軟件重構(gòu)和改變的增長空間和市場機會。 值得一提的是,就大模型產(chǎn)品而言,騰訊則“低調(diào)”不少,并不打算“拼速度”。 在3月騰訊發(fā)布2022年四季度財報后,騰訊總裁劉熾平透露了包括聊天機器人在內(nèi)的即將發(fā)布的眾多產(chǎn)品的計劃。他表示,騰訊不會匆忙推出產(chǎn)品,而將花費時間打造一個經(jīng)過多次迭代后的長期發(fā)展機會。 此外,大廠如字節(jié)跳動則選擇扮演類似微軟的角色,旗下的火山引擎推出大模型訓練云平臺,為大模型公司提供算力等技術(shù)服務。火山引擎總裁譚待表示,火山引擎不做大模型,將化身賦能者,為大模型客戶提供算力等AI基礎設施,幫助其做好大模型開發(fā)。 圖片來源:“火山引擎”公眾號 作業(yè)幫教育大模型正在內(nèi)測 除了科技企業(yè),記者從作業(yè)幫獲悉,目前作業(yè)幫正在內(nèi)測基于中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景,涉及工具類App、智能硬件、圖書等業(yè)務。據(jù)內(nèi)部人士透露,教育場景中綜合能力表現(xiàn)超出預期水平。 針對此事,財經(jīng)網(wǎng)科技向作業(yè)幫方面進行求證,作業(yè)幫相關工作人員回復,作業(yè)幫教育大模型目前在內(nèi)測階段,相關評估及備案等工作正在進行中。 一位接近作業(yè)幫人士表示,作業(yè)幫在今年年初就啟動了自研教育GPT項目,從各個業(yè)務模塊調(diào)集技術(shù)精英組成原始團隊。今年3月份,作業(yè)幫內(nèi)部郵件宣布,再次加大投入,并進行組織架構(gòu)調(diào)整。目前該項目由CTO羅亮牽頭進行底層研發(fā)支持及AIGC大方向建設,研發(fā)經(jīng)費優(yōu)先調(diào)撥。 該人士進一步表示,除了組織架構(gòu)調(diào)整,作業(yè)幫產(chǎn)研團隊中近百人也已并入GPT相關項目,“從技術(shù)到產(chǎn)品側(cè),分不同落地場景在‘跑’項目,估計有兩百人以上的團隊規(guī)模”。 另一位作業(yè)幫內(nèi)部人士透露,“從過往技術(shù)能力積累來看,作業(yè)幫優(yōu)勢明顯,不做這件事才奇怪。”該人士稱,經(jīng)過半年的技術(shù)研發(fā),作業(yè)幫內(nèi)部對自研GPT比較有信心,已經(jīng)優(yōu)先“解鎖”解題能力、中英文作文批改、知識問答等產(chǎn)品級應用,進展比想象中順利,已經(jīng)在一些教育場景中達到了行業(yè)top水平。 圖片來源:“作業(yè)幫”公眾號 云端競爭時代已經(jīng)到來 “現(xiàn)在大語言模型出現(xiàn)以后,云端就開始被開發(fā)出來,云端的競爭將成為下一場互聯(lián)網(wǎng)競爭的窗戶。”張洪忠稱。 據(jù)Canalys數(shù)據(jù)顯示,去年中國云計算市場同比增長10%,前四大云計算廠商阿里云、華為云、騰訊云和百度智能云,合計增長9%,占云服務客戶支出總額的79%。 張洪忠認為,對于應用而言,“對話即平臺”成為現(xiàn)實,對話可以解決多模態(tài)的問題。例如,把ChatGPT的API接上以后,大模型就可以畫圖、做平面設計、寫文案等等。 而要更深層次理解大模型,“涌現(xiàn)”是一個關鍵的概念。 簡單來說,涌現(xiàn)指的是當大模型的數(shù)據(jù)量達到一定量的時候,一種產(chǎn)生質(zhì)變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時指出,業(yè)界普遍的共識在于,500-600億機器訓練參數(shù)是大模型智能涌現(xiàn)的門檻。 這也是ChatGPT“大力出奇跡”的基礎,早前“掀起蝴蝶翅膀”的GPT-3模型,就已經(jīng)有1750億個參數(shù)。OpenAI沒有進一步公布GPT-4的參數(shù)數(shù)量。作為對比,谷歌新推出的PaLM2訓練參數(shù)已經(jīng)達到3400億個。 “算力是競爭的基礎,”張洪忠提到,目前很多想要從事相關研究的老師從大學轉(zhuǎn)到企業(yè),就是因為大學無法承載如此龐大的算力需求以及巨額費用。 一個典型的例子是,作為算力基礎GPU的供應商英偉達,近日市值一度突破萬億美元,其A100芯片、H100芯片在全球具有絕對優(yōu)勢。就國內(nèi)的A100芯片而言,主要被百度、阿里等大廠掌握在手中。 英偉達CEO黃仁勛圖片來源:英偉達官網(wǎng)截圖 換句話說,大模型產(chǎn)品競爭費用不菲,這也是一些國內(nèi)大模型產(chǎn)品采用邀請測試或是不面向C端的主要考慮。 據(jù)國盛證券估算,GPT-3的單次訓練成本就高達140萬美元,對于一些更大的LLM(大型語言模型),訓練成本介于200萬美元至1200萬美元之間。 在這其中,大部分費用是電費,計算機專家吳軍曾提到,“大概可能是3000輛特斯拉的電動汽車,每輛跑到20萬英里(約32.19萬公里),把它跑‘死’,這么大的耗電量,才夠ChatGPT訓練一次。” 在如此高昂成本之下,各互聯(lián)網(wǎng)大廠也爭相入場,或許都是因為看重大模型產(chǎn)品背后掙到“真金白銀”的可能。 李彥宏就提道,初創(chuàng)企業(yè)“沒有必要再重新發(fā)明一遍輪子(基礎大模型)”,它們的機會是在應用層,將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機遇”。當然,百度自己想要做“輪子”。 在張洪忠看來,互聯(lián)網(wǎng)經(jīng)歷了三大時代:PC互聯(lián)網(wǎng)時代,2010年之后的移動互聯(lián)網(wǎng)時代,以及可能進入的下一個時代——大模型時代。他表示,“我們未來的互聯(lián)網(wǎng)競爭,幾乎都要建立在大模型基礎上。” 他進一步提到,移動互聯(lián)網(wǎng)時代,誰都想不到當時如日中天的四大門戶——新浪、騰訊、網(wǎng)易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。 “同樣的,今天我們到了大模型時代,在大模型基礎之上的應用就可能會產(chǎn)生新的技術(shù),這就是人工智能技術(shù)帶給我們的希望和變數(shù),包括一些新的產(chǎn)業(yè)發(fā)展契機。” 本文作者系天府文創(chuàng)云記者石普寧,轉(zhuǎn)載合作相關可搜索“天府文創(chuàng)云”公眾號。
大模型

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0