要聞

每經網首頁 > 要聞 > 正文

大模型“混戰(zhàn)”，云端競爭時代到來

每日經濟新聞 2023-06-05 23:52:26

“現在大語言模型出現以后，云端就開始被開發(fā)出來，云端的競爭將成為下一場互聯網競爭的窗戶。”

每經記者石普寧每經編輯唐元

如何理解“大模型”？或許可以從架構上出發(fā)。簡單來說，如今的IT技術棧分為四層，芯片層、框架層、模型層和應用層。

“今天的ChatGPT、文心一言等屬于模型層，AI時代的原生應用都會基于大模型來開發(fā)。”百度CEO李彥宏在第七屆世界智能大會上曾如此說道。

自開春以來，隨著以大模型的應用為標志的AI2.0時代加速到來，人工智能概念大火。

在國內，以大廠領頭的各大企業(yè)紛紛宣布各自的大模型與產品，通用大模型也迎來一波創(chuàng)業(yè)潮，一時間市場上熱鬧紛呈，任何人都不愿錯失良機。

縱觀各類大模型產品的“出生”，其中既有來自熟悉的大廠如百度、阿里，也有來自專注人工智能領域的企業(yè)如商湯，更有創(chuàng)業(yè)者“另起爐灶”，典型如美團聯合創(chuàng)始人王慧文，稱要打造“中國的OpenAI”。

在“百模混戰(zhàn)”的背景下，如今各家的“戰(zhàn)況”如何，在大模型“一窩蜂”闖入視野的同時，我們正在迎接怎樣的科技變革？

各路產品業(yè)已上馬

“ChatGPT從去年11月份進入社會視野，有兩個最大的突破點：第一個是開放域的多輪對話，第二個是生成性的文本。”張洪忠表示，兩個技術的突破意味著人機交往的新時代到來，“這是一個巨大的革命性突破。”

視線投向國內互聯網巨頭，在大模型技術上積累較為深厚的百度和阿里率先出手，分別于3月16日與4月7日推出“文心一言”以及“通義千問”。

圖片來源：“百度文心一言”公眾號

自內測以來，文心一言完成了4次技術版本升級：如今的推理成本降到了原來的十分之一，推理性能提升近10倍。

“當別人剛剛思考如何進行訓練的時候，我們已經在推理上沖出了很遠。”5月，李彥宏在百度內部大會上說。

此外，文心一言還將逐步融入百度所有業(yè)務。

5月16日，百度發(fā)布了第一季度未經審計的財務報告，李彥宏表示，“我們計劃逐步將文心一言融入我們的所有業(yè)務，為我們的產品及服務賦能，吸引更廣泛的用戶及客戶。圍繞文心一言在新的時代中建立新生態(tài)。這也將助力我們實現長期、可持續(xù)的增長。”

無獨有偶，一個多月前，在阿里云峰會正式推出“通義千問”之際，阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇亦表示，阿里巴巴所有產品未來將接入通義千問大模型并進行全面改造。“面向AI時代，所有產品都值得用大模型重新升級。”

6月1日，阿里云對外披露通義大模型最新進展，瞄向AI音視頻賽道推出“通義聽悟”，并且正式開啟公測。

據阿里云CTO周靖人介紹，通義聽悟作為一款工作學習AI助手，不僅“聽力好”，能夠高準確度生成會議記錄、區(qū)分不同發(fā)言人，而且“悟性極高”，可以一秒給音視頻劃分章節(jié)并形成摘要、總結全文及每個發(fā)言人觀點、整理關注重點和待辦事項。

圖片來源：“阿里云”公眾號

除了大廠動作頻頻之外，AI科技企業(yè)也對這塊“蛋糕”虎視眈眈。

4月，計算機視覺公司商湯科技于推出“日日新”（SenseNova），其中包括自然語言處理模型“商量”（SenseChat）、文生圖模型“秒畫”和數字人視頻生成平臺“如影”（SenseAvatar）等。

同月，決策類AI公司第四范式首次向公眾展示 “式說3.0”，瞄準生成式AI對企業(yè)級軟件重構和改變的增長空間和市場機會。

值得一提的是，就大模型產品而言，騰訊則“低調”不少，并不打算“拼速度”。

在3月騰訊發(fā)布2022年四季度財報后，騰訊總裁劉熾平透露了包括聊天機器人在內的即將發(fā)布的眾多產品的計劃。他表示，騰訊不會匆忙推出產品，而將花費時間打造一個經過多次迭代后的長期發(fā)展機會。

此外，大廠如字節(jié)跳動則選擇扮演類似微軟的角色，旗下的火山引擎推出大模型訓練云平臺，為大模型公司提供算力等技術服務。火山引擎總裁譚待表示，火山引擎不做大模型，將化身賦能者，為大模型客戶提供算力等AI基礎設施，幫助其做好大模型開發(fā)。

圖片來源：“火山引擎”公眾號

作業(yè)幫教育大模型正在內測

除了科技企業(yè)，記者從作業(yè)幫獲悉，目前作業(yè)幫正在內測基于中國市場的教育大模型，包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景，涉及工具類App、智能硬件、圖書等業(yè)務。據內部人士透露，教育場景中綜合能力表現超出預期水平。

針對此事，財經網科技向作業(yè)幫方面進行求證，作業(yè)幫相關工作人員回復，作業(yè)幫教育大模型目前在內測階段，相關評估及備案等工作正在進行中。

一位接近作業(yè)幫人士表示，作業(yè)幫在今年年初就啟動了自研教育GPT項目，從各個業(yè)務模塊調集技術精英組成原始團隊。今年3月份，作業(yè)幫內部郵件宣布，再次加大投入，并進行組織架構調整。目前該項目由CTO羅亮牽頭進行底層研發(fā)支持及AIGC大方向建設，研發(fā)經費優(yōu)先調撥。

該人士進一步表示，除了組織架構調整，作業(yè)幫產研團隊中近百人也已并入GPT相關項目，“從技術到產品側，分不同落地場景在‘跑’項目，估計有兩百人以上的團隊規(guī)模”。

另一位作業(yè)幫內部人士透露， “從過往技術能力積累來看，作業(yè)幫優(yōu)勢明顯，不做這件事才奇怪。”該人士稱，經過半年的技術研發(fā)，作業(yè)幫內部對自研GPT比較有信心，已經優(yōu)先“解鎖”解題能力、中英文作文批改、知識問答等產品級應用，進展比想象中順利，已經在一些教育場景中達到了行業(yè)top水平。

圖片來源：“作業(yè)幫”公眾號

云端競爭時代已經到來

“現在大語言模型出現以后，云端就開始被開發(fā)出來，云端的競爭將成為下一場互聯網競爭的窗戶。”張洪忠稱。

據Canalys數據顯示，去年中國云計算市場同比增長10%，前四大云計算廠商阿里云、華為云、騰訊云和百度智能云，合計增長9%，占云服務客戶支出總額的79%。

張洪忠認為，對于應用而言，“對話即平臺”成為現實，對話可以解決多模態(tài)的問題。例如，把ChatGPT的API接上以后，大模型就可以畫圖、做平面設計、寫文案等等。

而要更深層次理解大模型，“涌現”是一個關鍵的概念。

簡單來說，涌現指的是當大模型的數據量達到一定量的時候，一種產生質變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時指出，業(yè)界普遍的共識在于，500-600億機器訓練參數是大模型智能涌現的門檻。

這也是ChatGPT“大力出奇跡”的基礎，早前“掀起蝴蝶翅膀”的GPT-3模型，就已經有1750億個參數。OpenAI沒有進一步公布GPT-4的參數數量。作為對比，谷歌新推出的PaLM2訓練參數已經達到3400億個。

“算力是競爭的基礎，”張洪忠提到，目前很多想要從事相關研究的老師從大學轉到企業(yè)，就是因為大學無法承載如此龐大的算力需求以及巨額費用。

一個典型的例子是，作為算力基礎GPU的供應商英偉達，近日市值一度突破萬億美元，其A100芯片、H100芯片在全球具有絕對優(yōu)勢。就國內的A100芯片而言，主要被百度、阿里等大廠掌握在手中。

英偉達CEO黃仁勛圖片來源：英偉達官網截圖

換句話說，大模型產品競爭費用不菲，這也是一些國內大模型產品采用邀請測試或是不面向C端的主要考慮。

據國盛證券估算，GPT-3的單次訓練成本就高達140萬美元，對于一些更大的LLM（大型語言模型），訓練成本介于200萬美元至1200萬美元之間。

在這其中，大部分費用是電費，計算機專家吳軍曾提到，“大概可能是3000輛特斯拉的電動汽車，每輛跑到20萬英里（約32.19萬公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓練一次。”

在如此高昂成本之下，各互聯網大廠也爭相入場，或許都是因為看重大模型產品背后掙到“真金白銀”的可能。

李彥宏就提道，初創(chuàng)企業(yè)“沒有必要再重新發(fā)明一遍輪子（基礎大模型）”，它們的機會是在應用層，將出現“全新的、十倍于現在微信和抖音的創(chuàng)業(yè)機遇”。當然，百度自己想要做“輪子”。

在張洪忠看來，互聯網經歷了三大時代：PC互聯網時代，2010年之后的移動互聯網時代，以及可能進入的下一個時代——大模型時代。他表示，“我們未來的互聯網競爭，幾乎都要建立在大模型基礎上。”

他進一步提到，移動互聯網時代，誰都想不到當時如日中天的四大門戶——新浪、騰訊、網易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。

“同樣的，今天我們到了大模型時代，在大模型基礎之上的應用就可能會產生新的技術，這就是人工智能技術帶給我們的希望和變數，包括一些新的產業(yè)發(fā)展契機。”

本文作者系天府文創(chuàng)云記者石普寧，轉載合作相關可搜索“天府文創(chuàng)云”公眾號。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

“國內現在是‘百模大戰(zhàn)’，這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來城與智媒體”首屆成都東部新區(qū)·成渝地區(qū)雙城經濟圈城市媒體發(fā)展大會暨城市機會清單發(fā)布活動上，北京師范大學新聞傳播學院院長張洪忠表示，大模型讓所有的互聯網公司都有一個新的機會重新開始。如何理解“大模型”？或許可以從架構上出發(fā)。簡單來說，如今的IT技術棧分為四層，芯片層、框架層、模型層和應用層。 “今天的ChatGPT、文心一言等屬于模型層，AI時代的原生應用都會基于大模型來開發(fā)。”百度CEO李彥宏在第七屆世界智能大會上曾如此說道。自開春以來，隨著以大模型的應用為標志的AI2.0時代加速到來，人工智能概念大火。在國內，以大廠領頭的各大企業(yè)紛紛宣布各自的大模型與產品，通用大模型也迎來一波創(chuàng)業(yè)潮，一時間市場上熱鬧紛呈，任何人都不愿錯失良機。縱觀各類大模型產品的“出生”，其中既有來自熟悉的大廠如百度、阿里，也有來自專注人工智能領域的企業(yè)如商湯，更有創(chuàng)業(yè)者“另起爐灶”，典型如美團聯合創(chuàng)始人王慧文，稱要打造“中國的OpenAI”。在“百模混戰(zhàn)”的背景下，如今各家的“戰(zhàn)況”如何，在大模型“一窩蜂”闖入視野的同時，我們正在迎接怎樣的科技變革？各路產品業(yè)已上馬 “ChatGPT從去年11月份進入社會視野，有兩個最大的突破點：第一個是開放域的多輪對話，第二個是生成性的文本。”張洪忠表示，兩個技術的突破意味著人機交往的新時代到來，“這是一個巨大的革命性突破。” 視線投向國內互聯網巨頭，在大模型技術上積累較為深厚的百度和阿里率先出手，分別于3月16日與4月7日推出“文心一言”以及“通義千問”。圖片來源：“百度文心一言”公眾號自內測以來，文心一言完成了4次技術版本升級：如今的推理成本降到了原來的十分之一，推理性能提升近10倍。 “當別人剛剛思考如何進行訓練的時候，我們已經在推理上沖出了很遠。”5月，李彥宏在百度內部大會上說。此外，文心一言還將逐步融入百度所有業(yè)務。 5月16日，百度發(fā)布了第一季度未經審計的財務報告，李彥宏表示，“我們計劃逐步將文心一言融入我們的所有業(yè)務，為我們的產品及服務賦能，吸引更廣泛的用戶及客戶。圍繞文心一言在新的時代中建立新生態(tài)。這也將助力我們實現長期、可持續(xù)的增長。” 無獨有偶，一個多月前，在阿里云峰會正式推出“通義千問”之際，阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇亦表示，阿里巴巴所有產品未來將接入通義千問大模型并進行全面改造。“面向AI時代，所有產品都值得用大模型重新升級。” 6月1日，阿里云對外披露通義大模型最新進展，瞄向AI音視頻賽道推出“通義聽悟”，并且正式開啟公測。據阿里云CTO周靖人介紹，通義聽悟作為一款工作學習AI助手，不僅“聽力好”，能夠高準確度生成會議記錄、區(qū)分不同發(fā)言人，而且“悟性極高”，可以一秒給音視頻劃分章節(jié)并形成摘要、總結全文及每個發(fā)言人觀點、整理關注重點和待辦事項。圖片來源：“阿里云”公眾號除了大廠動作頻頻之外，AI科技企業(yè)也對這塊“蛋糕”虎視眈眈。 4月，計算機視覺公司商湯科技于推出“日日新”（SenseNova），其中包括自然語言處理模型“商量”（SenseChat）、文生圖模型“秒畫”和數字人視頻生成平臺“如影”（SenseAvatar）等。同月，決策類AI公司第四范式首次向公眾展示“式說3.0”，瞄準生成式AI對企業(yè)級軟件重構和改變的增長空間和市場機會。值得一提的是，就大模型產品而言，騰訊則“低調”不少，并不打算“拼速度”。在3月騰訊發(fā)布2022年四季度財報后，騰訊總裁劉熾平透露了包括聊天機器人在內的即將發(fā)布的眾多產品的計劃。他表示，騰訊不會匆忙推出產品，而將花費時間打造一個經過多次迭代后的長期發(fā)展機會。此外，大廠如字節(jié)跳動則選擇扮演類似微軟的角色，旗下的火山引擎推出大模型訓練云平臺，為大模型公司提供算力等技術服務。火山引擎總裁譚待表示，火山引擎不做大模型，將化身賦能者，為大模型客戶提供算力等AI基礎設施，幫助其做好大模型開發(fā)。圖片來源：“火山引擎”公眾號作業(yè)幫教育大模型正在內測除了科技企業(yè)，記者從作業(yè)幫獲悉，目前作業(yè)幫正在內測基于中國市場的教育大模型，包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景，涉及工具類App、智能硬件、圖書等業(yè)務。據內部人士透露，教育場景中綜合能力表現超出預期水平。針對此事，財經網科技向作業(yè)幫方面進行求證，作業(yè)幫相關工作人員回復，作業(yè)幫教育大模型目前在內測階段，相關評估及備案等工作正在進行中。一位接近作業(yè)幫人士表示，作業(yè)幫在今年年初就啟動了自研教育GPT項目，從各個業(yè)務模塊調集技術精英組成原始團隊。今年3月份，作業(yè)幫內部郵件宣布，再次加大投入，并進行組織架構調整。目前該項目由CTO羅亮牽頭進行底層研發(fā)支持及AIGC大方向建設，研發(fā)經費優(yōu)先調撥。該人士進一步表示，除了組織架構調整，作業(yè)幫產研團隊中近百人也已并入GPT相關項目，“從技術到產品側，分不同落地場景在‘跑’項目，估計有兩百人以上的團隊規(guī)模”。另一位作業(yè)幫內部人士透露，“從過往技術能力積累來看，作業(yè)幫優(yōu)勢明顯，不做這件事才奇怪。”該人士稱，經過半年的技術研發(fā)，作業(yè)幫內部對自研GPT比較有信心，已經優(yōu)先“解鎖”解題能力、中英文作文批改、知識問答等產品級應用，進展比想象中順利，已經在一些教育場景中達到了行業(yè)top水平。圖片來源：“作業(yè)幫”公眾號云端競爭時代已經到來 “現在大語言模型出現以后，云端就開始被開發(fā)出來，云端的競爭將成為下一場互聯網競爭的窗戶。”張洪忠稱。據Canalys數據顯示，去年中國云計算市場同比增長10%，前四大云計算廠商阿里云、華為云、騰訊云和百度智能云，合計增長9%，占云服務客戶支出總額的79%。張洪忠認為，對于應用而言，“對話即平臺”成為現實，對話可以解決多模態(tài)的問題。例如，把ChatGPT的API接上以后，大模型就可以畫圖、做平面設計、寫文案等等。而要更深層次理解大模型，“涌現”是一個關鍵的概念。簡單來說，涌現指的是當大模型的數據量達到一定量的時候，一種產生質變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時指出，業(yè)界普遍的共識在于，500-600億機器訓練參數是大模型智能涌現的門檻。這也是ChatGPT“大力出奇跡”的基礎，早前“掀起蝴蝶翅膀”的GPT-3模型，就已經有1750億個參數。OpenAI沒有進一步公布GPT-4的參數數量。作為對比，谷歌新推出的PaLM2訓練參數已經達到3400億個。 “算力是競爭的基礎，”張洪忠提到，目前很多想要從事相關研究的老師從大學轉到企業(yè)，就是因為大學無法承載如此龐大的算力需求以及巨額費用。一個典型的例子是，作為算力基礎GPU的供應商英偉達，近日市值一度突破萬億美元，其A100芯片、H100芯片在全球具有絕對優(yōu)勢。就國內的A100芯片而言，主要被百度、阿里等大廠掌握在手中。英偉達CEO黃仁勛圖片來源：英偉達官網截圖換句話說，大模型產品競爭費用不菲，這也是一些國內大模型產品采用邀請測試或是不面向C端的主要考慮。據國盛證券估算，GPT-3的單次訓練成本就高達140萬美元，對于一些更大的LLM（大型語言模型），訓練成本介于200萬美元至1200萬美元之間。在這其中，大部分費用是電費，計算機專家吳軍曾提到，“大概可能是3000輛特斯拉的電動汽車，每輛跑到20萬英里（約32.19萬公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓練一次。” 在如此高昂成本之下，各互聯網大廠也爭相入場，或許都是因為看重大模型產品背后掙到“真金白銀”的可能。李彥宏就提道，初創(chuàng)企業(yè)“沒有必要再重新發(fā)明一遍輪子（基礎大模型）”，它們的機會是在應用層，將出現“全新的、十倍于現在微信和抖音的創(chuàng)業(yè)機遇”。當然，百度自己想要做“輪子”。在張洪忠看來，互聯網經歷了三大時代：PC互聯網時代，2010年之后的移動互聯網時代，以及可能進入的下一個時代——大模型時代。他表示，“我們未來的互聯網競爭，幾乎都要建立在大模型基礎上。” 他進一步提到，移動互聯網時代，誰都想不到當時如日中天的四大門戶——新浪、騰訊、網易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。 “同樣的，今天我們到了大模型時代，在大模型基礎之上的應用就可能會產生新的技術，這就是人工智能技術帶給我們的希望和變數，包括一些新的產業(yè)發(fā)展契機。” 本文作者系天府文創(chuàng)云記者石普寧，轉載合作相關可搜索“天府文創(chuàng)云”公眾號。

大模型

上一篇文章

幣安CEO趙長鵬：團隊將確保系統穩(wěn)定，包括提款和存款

返回每經網首頁

下一篇文章

西南水電大省，何時才能“解渴”？