每日經濟新聞 2023-02-27 19:31:28
◎我們的注意力更多集中在應用和跟風上,“ChatGPT一出來,我們馬上就跟上了,有很多企業來扶植它,這樣的情況并不是我們希望看到的。”
每經記者 陳婷 每經編輯 劉雪梅
“兩百多年前我們有了機器,所以人類進入了機械化時代,幾十年前有了電子設備,所以人類進入電子化時代。未來幾十年,算法是推動技術創新、科研社會發展的主要動力,未來我們進入算法時代。”2月25日,在2023全球人工智能開發者先鋒大會開幕式上,中國科學院院士、上海算法創新研究院院長鄂維南說。
中國科學院院士、上海算法創新研究院院長鄂維南 圖片來源:大會供圖
在演講中,他分析了我國在人工智能領域的優勢和劣勢。他認為,我國人工智能領域注意力更多集中在工程層面,算法層面原始創新動力很明顯不足。頂尖算法人才比較缺乏,更重要的是缺乏整個算法創新體系。
“但是我們也有優勢,我們有大量基礎人才,有廣泛的應用場景,在有限領域里有一定的先發優勢。”鄂維南表示。
值得一提的是,他還聊到了時下大火的ChatGPT。在他看來,我國人工智能發展的數據量巨大,場景極具挑戰性,理想的情況就是利用挑戰性場景推動底層算法、系統的原始創新。但實際情況是,我們的注意力很多時候更多集中在應用和跟風上,“ChatGPT一出來,我們馬上就跟上了,有很多企業來扶植它,這樣的情況并不是我們希望看到的。”
2月25日、26日,2023年全球人工智能開發者先鋒大會(GAIDC)在上海臨港舉辦,《每日經濟新聞》記者現場獲悉,包括鄂維南院士在內,阿里云創始人王堅、商湯科技董事長兼CEO徐立等領域內頂尖專家都熱聊起了ChatGpt。
“ChatGPT的成功給了大家完全不一樣的思考。”在開幕式上,商湯科技董事長兼CEO徐立在回答現場提問時表示,“生成式的內容,不光是可以解決單一目標下的優化問題,是給出很多的問題不同的解法的路徑。”
對于基于人工智能大模型的生成式AI應用的商業化前景,徐立也表達了自己的看法。
他表示,OpenAI打開了一個出口,讓ChatGPT很快成為第一個突破上億用戶的觸達終端的應用,在這個行業里的下游諸多應用都會隨著這種大模型的思維模式而改變。
2023全球人工智能開發者先鋒大會現場 圖片來源:每經記者 陳婷 攝
“人工智能對于開發者來說是一種模式的變化,下一步對很多內容創作者來說,一樣會面臨工作模式的巨大變化,未來人們不需要具備底層的制作能力,而是需要更多暢想、連接、協同的能力,這些能力才是跟AI協同共創的核心商業能力。”徐立認為,伴隨著生產力模型的變革,可能會產生類似于Photoshop這樣的互聯網SaaS應用和工具鏈,或者基于這些工具鏈新生成的社區,也就是可能會擁有下一階段的“小紅書”、B站等一系列互聯網應用。
而在中國工程院院士、阿里云創始人王堅看來,ChatGPT表面上是應用的發展,但本質上其背后的方法論發生了一次天翻地覆的變化。
王堅表示,在十多年前,互聯網就已經存在,但當時的互聯網并沒有成為開發者必須依賴的東西。當年超級計算機的資源只有極少數開發者可以獲取。計算能力是所有開發者的瓶頸。但云計算給世界帶來了天翻地覆的變化。
“算力從哪里來,隨著技術的進步,可能每年都會不一樣,每十年不一樣。但是用云計算的方式為開發者提供算力,讓他們在全世界范圍能夠公平地獲取算力,這一點是不會改變的。”王堅說,在他看來,從做云計算的角度看,計算能力的獲取再也不會變成開發者的瓶頸。
對于ChatGPT,在王堅看來,在過去十幾年,人工智能真正發生的天翻地覆變化是方法論趨向統一,他認為,語言的差別不再重要,這是一次非常革命性的變化。ChatGPT表面上是應用的發展,本質上是其背后的方法論發生了變化。
“事實上今天我們看到的ChatGPT,沒有超出當年比爾·蓋茨對一臺PC的希望,當時比爾·蓋茨說,希望PC能夠像跟人一樣的方法來與用戶交流,只不過當時只是PC時代,沒有互聯網帶來的數據,也沒有數據帶來的人工智能,所以他這個愿景沒有實現。”他認為,比爾·蓋茨的愿景在今天已經被實現了,“盡管PC時代過去,我們應該創造下一個時代。”
大模型,是ChatGPT的基座,2023全球人工智能開發者先鋒大會期間,不少頂尖專家也對大模型的發展發表了自己的見解。
昇思MindSpore業務總經理丁誠給出了一個形象的比喻。丁誠認為,大語言模型數據結構很簡單,是矩陣成,它特點是參數量特別大,就好比人類具備了超級大腦,“接下去大模型訓練過程中是通過大數據大算力來喂,在這個過程中好比本身聰明絕頂擁有超級大腦的人接受了博覽群書,接受了各種知識的訓練,這樣的人類到各行各業里應用,都是大有可為的。”
在2月26日下午的“智領未來:大模型技術與應用論壇”上,對于大模型,百度飛槳總架構師于佃海給出了他的定義。
于佃海表示,AI預訓練大模型,是深度學習崛起以來最重要的一次技術變革。大模型不只是模型參數規模更大,同時也對應著學習機制和AI研發應用范式的改變。自監督學習模式突破了數據標注的困境,可以從海量數據中學習到豐富的通用知識。基于大模型,只需要通過模型微調或是提示等方式,就可以在廣泛下游任務中取得優異效果,極大降低了AI開發和應用的門檻。
復旦大學計算機學院教授邱錫鵬也在論壇上表示:“從早期的預訓練模型,一直到GPT3,GPT3的規模遠超過之前的模型,之前的模型是千萬到億級別,GPT3直接到了千億級別。”
他提到,當模型從小規模發展到大規模的時候,發展到一定階段會涌現出一些原來小模型上觀測不到的能力,“我們把這一能力稱為‘涌現’。”
邱錫鵬表示,對大模型,主要觀察數學建模能力、上下文的理解能力、學習能力等,會發現大概在百億規模之后就會發生突變。
“能力不再是線性增長,之前是線性或者類線性增長,隨著規模增長,收益或者邊際效應越來越弱的,但是突然在百億規模之后,能力就會大幅度增長。我們把這些能力歸結為在模型大了以后,就涌現出來了。”
那么,大模型到底有多大?分水嶺在哪?
“一個標志性的分水嶺就是百億規模,百億以下我們不再認為是大模型。”邱錫鵬表示,“我們自己開發一個智能涌現能力的模型,至少應該是百億起步的。”
邱錫鵬表示,如今大模型已經承載了非常多的知識,但是文本知識寫完了之后,下一步怎么發展,一個非常重要的就是要把大語言模型和現實世界打通,讓它與現實世界不斷交互,才能學到更多的文本無法表達的知識。
2月20日,國內第一個對話式大型語言模型MOSS便是由邱錫鵬團隊發布至公開平臺。在2023全球人工智能開發者先鋒大會上,邱錫鵬也談到了MOSS。
邱錫鵬透露:“MOSS大模型計劃在一個月之內,和人類不斷交互,進行優化,順利的話將于3月底開源。”
值得關注的是,在論壇現場,邱錫鵬提到了ChatGPT與實現通用人工智能之間的關系。
“通用人工智能應當具備聽說讀寫、思考推理以及行動等能力,就ChatGPT目前的表現來看,目前雖然不具備聽覺、視覺能力,但我相信未來接入這方面的能力不是特別難的事情。這樣的話,可以把它當成類似智能體,以及把它和現實世界打通。”邱錫鵬說。
他認為,ChatGPT展示出了非常好的通向人工智能的潛力,“也就是說ChatGPT的出現,或者說涌現出來的很多能力,大大縮短了我們此前實現通用人工智能的時間預期。”
封面圖片來源:企業供圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP