每日經濟新聞 2025-03-05 22:53:12
王江平表示,人工智能是靠數據來馴化的,既需要公共數據來支撐,又需要專業數據來發揮關鍵作用,當前專業數據集不完善是制約人工智能進入實體經濟的最大障礙。“具體到一些行業數據更多掌握在頭部企業、工程設計院、大學科研院所等手里,要通過一種商業模式把他們手里的數據集成起來,讓大家共享數據集產生的價值。”他說。
每經記者 楊棄非 淡忠奎 每經編輯 楊歡
3月5日,十四屆全國人大三次會議開幕會在北京人民大會堂舉行。國務院總理李強在政府工作報告中提出,要持續推進“人工智能+”行動,將數字技術與制造優勢、市場優勢更好結合起來。
當前,在DeepSeek大模型熱潮帶動下,“人工智能+”賦能實體經濟的探索不斷加速,而背后的數據、算力等瓶頸問題也成為今年全國兩會代表、委員們關注的焦點之一。
全國政協委員、工信部原副部長王江平在接受《每日經濟新聞》(以下簡稱“NBD”)記者采訪時表示,人工智能是靠數據來馴化的,既需要公共數據來支撐,又需要專業數據來發揮關鍵作用,當前專業數據集不完善是制約人工智能進入實體經濟的最大障礙。
“具體到一些行業數據更多掌握在頭部企業、工程設計院、大學科研院所等手里,要通過一種商業模式把他們手里的數據集成起來,讓大家共享數據集產生的價值。”他說。
NBD:您認為,當前人工智能賦能實體經濟面臨的最大障礙是什么?
王江平:人工智能有推動效率提升的作用,但進入到實體經濟,它面臨最大的障礙還是數據集的問題。因為人工智能是靠數據來馴化的,專業的數據馴化出的模型就會比較專業。反之,如果數據不專業,就達不到這樣的效果。
所以,現在我們要推動人工智能進入實體經濟,就迫切需要解決專業化數據集不足的問題,這個顆粒度越細越好。現在來看,我們通識性的數據已經有了,但是一些很專業的數據還需要去豐富,這是當前要迫切解決的問題。
接下來,就是商業模式的問題。人工智能進入實體經濟需要什么樣的商業模式,這是一個探索的過程。在我看來,至少有這樣幾個商業模式值得去探索——
第一個就是模型托管,模型做出來放在哪里,涉及云服務的問題;第二是模型服務,模型做出來以后要進入到每一個具體的行業。也就是說,做模型的人要懂實體經濟,推動模型進入實體經濟就是模型服務。
最后就是數據治理和交易問題。一個行業的數據治理完不完整非常關鍵,只有一個科學的、完整的數據治理體系才可能提供一個高水平的、專業化的數據集。有數據集就會涉及到交易的問題。
還有生產裝備的智能化,現在我們的AI PC、AI手機,甚至AI家居等等,這些裝備制造的AI化也值得探索。當然,模型的評估測試等服務也自然會跟著起來。
NBD:作為支撐AI算法運行的基礎,大模型的算力瓶頸問題也受到越來越多的關注。您如何看待這一問題?
王江平:算力確實是我們的一個短板,但我認為通過綜合施策是可以解決的。算力包括芯片、網絡,以及供電這樣一些綜合型基礎設施,或者叫算力基礎設施。這些基礎設施中,芯片是我們的一個短板。
在人工智能時代,特別是DeepSeek出來以后,我預測這種專用芯片(ASIC芯片)會在今明兩年有一個大爆發的機會。我們過去的CPU是通用型芯片,而大模型出來以后,可能會有越來越多大模型專用的算力芯片出現。
NBD:您認為,現在人工智能在哪個領域的應用最為成熟?
王江平:不論哪個領域都應該主動地去擁抱人工智能,而行業的數據集越好、越快,應用也就會越深入。我覺得現在醫療行業的人工智能應用發展比較快,而工業行業里門類較多,反而可能是一些關注度不高、規模較小、企業不多的行業會率先突破,因為它的數據集更容易建設,數據的共享更容易做起來。
實際上,一方面人工智能確實給我們的很多崗位帶來了替代效應,但另一方面它也會增加很多新的崗位。不論是對企業,還是個人而言,一定要抓住這個機會去主動地擁抱人工智能。
NBD:行業AI應用落地程度,很大程度上取決于專業數據集的完善程度。您提到要建立一些“顆粒度更細”的數據集,目前還有哪些難點?應該如何去解決?
王江平:在過去,人工智能模型還是一個高大上的東西,它的進入門檻是比較高的,但當DeepSeek模型開源以后,它的應用門檻大幅降低。這樣一來對人工智能模型的需求就顯得非常迫切,但我們的數據集其實還沒有完全準備好,這是需要有個過程的。
另一方面,數據集本身涉及到企業生產、能耗等關鍵數據,對企業而言是非常重要的,一般不太愿意去共享,所以我們要探索一種共享機制來推動這種數據集的建設。
我們的數據集既需要公共數據來支撐,更需要多個“顆粒度很細”的行業數據來發揮關鍵作用。而具體到一些行業數據更多又是掌握在頭部企業、工程設計院、大學科研院所等手里,所以,下一步我們要通過一種商業模式把他們手里的數據集成起來,能夠讓大家共享數據集產生的價值。這樣形成的數據就會很有價值,用它馴化的模型就可以更容易地進入具體的行業里去應用。
NBD:專業數據集的建設能否解決AI幻覺的問題?
王江平:其實,AI幻覺與數據集的質量、豐富性有很大的關系。就推理模型來講,幻覺是比較高的。如果某些特定領域數據集不完整,就會產生幻覺。因為人工智能有一個“補白機制”,它自己數據庫里有這些數據就會按照一定的權重去算,等于是一個輸出的結果。
但當它沒有這樣豐富的數據集時,就會降低它的權重,最后補白出來,就可能會產生幻覺。我們一般人看不出來,但是專業人士就會看出來這是胡編亂造的。所以,歸根究底,幻覺問題也是一個數據集的質量問題。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP