要聞

專訪全國政協委員、工信部原副部長王江平：AI進入實體經濟的最大障礙是專業數據集不完善

每日經濟新聞 2025-03-05 22:53:12

王江平表示，人工智能是靠數據來馴化的，既需要公共數據來支撐，又需要專業數據來發揮關鍵作用，當前專業數據集不完善是制約人工智能進入實體經濟的最大障礙。“具體到一些行業數據更多掌握在頭部企業、工程設計院、大學科研院所等手里，要通過一種商業模式把他們手里的數據集成起來，讓大家共享數據集產生的價值。”他說。

每經記者楊棄非淡忠奎每經編輯楊歡

3月5日，十四屆全國人大三次會議開幕會在北京人民大會堂舉行。國務院總理李強在政府工作報告中提出，要持續推進“人工智能＋”行動，將數字技術與制造優勢、市場優勢更好結合起來。

當前，在DeepSeek大模型熱潮帶動下，“人工智能+”賦能實體經濟的探索不斷加速，而背后的數據、算力等瓶頸問題也成為今年全國兩會代表、委員們關注的焦點之一。

全國政協委員、工信部原副部長王江平在接受《每日經濟新聞》（以下簡稱“NBD”）記者采訪時表示，人工智能是靠數據來馴化的，既需要公共數據來支撐，又需要專業數據來發揮關鍵作用，當前專業數據集不完善是制約人工智能進入實體經濟的最大障礙。

“具體到一些行業數據更多掌握在頭部企業、工程設計院、大學科研院所等手里，要通過一種商業模式把他們手里的數據集成起來，讓大家共享數據集產生的價值。”他說。

專業數據集和算力瓶頸是突出短板

NBD：您認為，當前人工智能賦能實體經濟面臨的最大障礙是什么？

王江平：人工智能有推動效率提升的作用，但進入到實體經濟，它面臨最大的障礙還是數據集的問題。因為人工智能是靠數據來馴化的，專業的數據馴化出的模型就會比較專業。反之，如果數據不專業，就達不到這樣的效果。

所以，現在我們要推動人工智能進入實體經濟，就迫切需要解決專業化數據集不足的問題，這個顆粒度越細越好。現在來看，我們通識性的數據已經有了，但是一些很專業的數據還需要去豐富，這是當前要迫切解決的問題。

接下來，就是商業模式的問題。人工智能進入實體經濟需要什么樣的商業模式，這是一個探索的過程。在我看來，至少有這樣幾個商業模式值得去探索——

第一個就是模型托管，模型做出來放在哪里，涉及云服務的問題；第二是模型服務，模型做出來以后要進入到每一個具體的行業。也就是說，做模型的人要懂實體經濟，推動模型進入實體經濟就是模型服務。

最后就是數據治理和交易問題。一個行業的數據治理完不完整非常關鍵，只有一個科學的、完整的數據治理體系才可能提供一個高水平的、專業化的數據集。有數據集就會涉及到交易的問題。

還有生產裝備的智能化，現在我們的AI PC、AI手機，甚至AI家居等等，這些裝備制造的AI化也值得探索。當然，模型的評估測試等服務也自然會跟著起來。

NBD：作為支撐AI算法運行的基礎，大模型的算力瓶頸問題也受到越來越多的關注。您如何看待這一問題？

王江平：算力確實是我們的一個短板，但我認為通過綜合施策是可以解決的。算力包括芯片、網絡，以及供電這樣一些綜合型基礎設施，或者叫算力基礎設施。這些基礎設施中，芯片是我們的一個短板。

在人工智能時代，特別是DeepSeek出來以后，我預測這種專用芯片（ASIC芯片）會在今明兩年有一個大爆發的機會。我們過去的CPU是通用型芯片，而大模型出來以后，可能會有越來越多大模型專用的算力芯片出現。

加快搭建“顆粒度更細”的數據集

NBD：您認為，現在人工智能在哪個領域的應用最為成熟？

王江平：不論哪個領域都應該主動地去擁抱人工智能，而行業的數據集越好、越快，應用也就會越深入。我覺得現在醫療行業的人工智能應用發展比較快，而工業行業里門類較多，反而可能是一些關注度不高、規模較小、企業不多的行業會率先突破，因為它的數據集更容易建設，數據的共享更容易做起來。

實際上，一方面人工智能確實給我們的很多崗位帶來了替代效應，但另一方面它也會增加很多新的崗位。不論是對企業，還是個人而言，一定要抓住這個機會去主動地擁抱人工智能。

NBD：行業AI應用落地程度，很大程度上取決于專業數據集的完善程度。您提到要建立一些“顆粒度更細”的數據集，目前還有哪些難點？應該如何去解決？

王江平：在過去，人工智能模型還是一個高大上的東西，它的進入門檻是比較高的，但當DeepSeek模型開源以后，它的應用門檻大幅降低。這樣一來對人工智能模型的需求就顯得非常迫切，但我們的數據集其實還沒有完全準備好，這是需要有個過程的。

另一方面，數據集本身涉及到企業生產、能耗等關鍵數據，對企業而言是非常重要的，一般不太愿意去共享，所以我們要探索一種共享機制來推動這種數據集的建設。

我們的數據集既需要公共數據來支撐，更需要多個“顆粒度很細”的行業數據來發揮關鍵作用。而具體到一些行業數據更多又是掌握在頭部企業、工程設計院、大學科研院所等手里，所以，下一步我們要通過一種商業模式把他們手里的數據集成起來，能夠讓大家共享數據集產生的價值。這樣形成的數據就會很有價值，用它馴化的模型就可以更容易地進入具體的行業里去應用。

NBD：專業數據集的建設能否解決AI幻覺的問題？

王江平：其實，AI幻覺與數據集的質量、豐富性有很大的關系。就推理模型來講，幻覺是比較高的。如果某些特定領域數據集不完整，就會產生幻覺。因為人工智能有一個“補白機制”，它自己數據庫里有這些數據就會按照一定的權重去算，等于是一個輸出的結果。

但當它沒有這樣豐富的數據集時，就會降低它的權重，最后補白出來，就可能會產生幻覺。我們一般人看不出來，但是專業人士就會看出來這是胡編亂造的。所以，歸根究底，幻覺問題也是一個數據集的質量問題。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

數據人工智能工信部

上一篇文章

專訪國務院參事、農業農村部原副部長于康震：AI技術已廣泛應用于動物疫病防控領域，并在預測病毒變異方面具有重要價值

返回每經網首頁

下一篇文章

51家上市公司股票獲回購，京滬高鐵回購金額最高