亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

對話數庫科技創始人沈鑫:大模型是效率工具,真正可供使用的高質量數據非常缺乏丨WAIC 2023

每日經濟新聞 2023-07-07 00:08:49

◎在談及通用大模型是否會取代行業大模型時,沈鑫表示,通用大模型如果真的做到垂直領域,經過很高級別的訓練之后,可以做得很好。“但是問題在于,能夠真正供大模型使用的高質量的數據是非常缺乏的……(做得好的)幾家肯定不會把數據貢獻給別人,所以(通用大模型取代行業大模型)其實是一個漫長的過程,沒有大家想象得那么快。

每經記者 孫嘉夏    每經實習記者 黃海    每經編輯 董興生    

“這個世界不存在魔術,不存在一個大模型‘啪’得一瞬間把所有問題都解決了。”

7月6日至8日,2023世界人工智能大會在上海舉辦。6日下午,數庫科技創始人兼總裁沈鑫在大會現場接受了《每日經濟新聞》記者專訪。

沈鑫 圖片來源:企業供圖

數庫科技成立于2009年,是一家專注產融數字化的數據科技公司,主要在金融及產業領域提供基于產業邏輯的智能數據產品與系統服務,幫助金融機構、企業集團、政府部門解決業務場景中的數據和系統需求。

本次大會期間,數庫科技將發布融合統一產品圖譜體系與大模型的概念型產品“istari”。記者現場觀察到,用戶輸入問題后,istari可以將需求轉化成統一產品知識圖譜(UPG)相關的查詢,并呈現出相關的專業產業知識以及各個知識點之間的關系。

據沈鑫介紹,目前,istari主要通過大模型來做產業關系的推演。“以前我們只有單純的上下游關系,今天大模型可以通過各種各樣的資訊,來反推除了產業關系之外潛在的經營聯系。”

在談及通用大模型是否會取代行業大模型時,沈鑫表示,通用大模型如果真的做到垂直領域,經過很高級別的訓練之后,可以做得很好。“但是問題在于,能夠真正供大模型使用的高質量的數據是非常缺乏的……(做得好的)幾家肯定不會把數據貢獻給別人,所以(通用大模型取代行業大模型)其實是一個漫長的過程,沒有大家想象得那么快。

以下是部分問答實錄:

NBD:對于當今市場而言,產業鏈數據價值體現在哪里?

沈鑫:我們講數據想要用好,必須要數數相連,要有連接邏輯,產業關系是唯一一個可以連接中國所有企業的關系。我跟你之間哪怕沒有金錢往來,有了金錢往來那叫供應鏈,(但)直接和間接,兩個企業之間一定會有產業的傳導路徑。

我們把產業數據網絡搭起來以后,第一,它本身是個數據集,你可以看到企業上下游的情況,可以做企業定位,它可以單獨當成一個數據集來用,同時它又是一個數據編制的核心邏輯,我們可以把宏觀行業的信息、公司相關的信息、某一個產品的產能價格等定到產品節點上。

本來是孤島式的數據現在有了邏輯,再去疊加模型的時候,你會發現它的判斷就更加精準。所以我們主要是做數據融合和數據組裝。通過各種各樣的大數據線索把這些數據融合起來建模,得出一個決策的結論,讓我們的客戶能夠在最佳的市場時機去切入這些企業,去授信也好,去服務也好,找到企業生命周期中最好的介入時間點。

圖片來源:每經實習記者 黃海 攝

NBD:公司過去這十年中遇到最大的難點是在哪?

沈鑫:其實難點很多,為什么講數據行業實際上門檻比較高,首先想做好數據融合,數據就要做到高度的結構化和標準化,這件事情就有點像石油冶煉一樣,怎么把粗的、顆粒的數據變成更加結構化、更加精細的,我們叫“好料子”,這有個提煉的過程。

在過去的十多年,我們用很多的人工智能技術,通過工程化建設打造自己的數據工廠,這個數據工廠會把一些非標數據轉換成高度結構化和標準化的數據。在開始的時候,機器生產數據肯定是不如人的,它需要很多年的積累,但今天它已經突破了邊界,生產的精度已經超過人了。

我們相信的一點是,要用工業化的思維來經營一家企業,我們不能回到勞動密集型老路上去。

NBD:如何看待大模型的應用?

沈鑫:這個世界不存在魔術,不存在一個大模型“啪”得一瞬間把所有問題都解決了。它本身是一個效率工具,我們現在會把大模型的一些技術融入到數據生產端,進一步去提升生產效率。這個實際上是我們看待大模型的一個點,就是不要為了技術而技術。

NBD:如何看待通用大模型和行業大模型之間的應用場景沖突?

沈鑫:如果通用大模型發展到極致的話,我覺得也就不存在什么行業大模型,但這是一個非常漫長的過程。

能夠真正供大模型使用的高質量數據是非常缺乏的。你看我們行業里,能把金融相關數據標準做到很高的公司,可能掰手指頭都數得出來,而這幾家肯定不會把數據貢獻給別人。所以它其實是一個漫長的過程,沒有大家想象得那么快。

另外一個點,很多的場景是不需要用到大模型的。可能在咨詢服務類的場景中大模型有很大的用場,但是在金融這種對數據要求很嚴謹的行業內,大模型實際是沒有意義的,因為回饋是相對比較模糊的。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

人工智能 2023世界人工智能大會 大數據 數據 大模型 科技

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0