每日經濟新聞 2023-11-16 23:47:54
◎向量數據庫通過統一企業數據與大模型交互的“語言”,讓AI變得更加通用和高效。這已經成為AI浪潮下的行業共識。
每經記者 王帆 每經編輯 張海妮
今年7月,騰訊云正式發布AI原生向量數據庫,最高支持10億級向量檢索規模。四個月后,在11月15日的騰訊云向量數據庫技術及產業峰會上,騰訊云宣布將向量數據庫檢索規模從十億升級至千億級別。
向量數據庫使用向量化計算,能夠高速地處理大規模的復雜數據,解決傳統關系型數據庫中的痛點,是大模型訓練過程中數據存儲的更優選擇。在接受包括《每日經濟新聞》記者在內的媒體記者采訪時,騰訊云數據庫副總經理羅云表示:“向量在未來是一種通用的人工智能數據格式,能夠屏蔽掉因底層數據格式的差異導致無法很好使用非結構化數據的問題。”
也就是說,向量數據庫通過統一企業數據與大模型交互的“語言”,讓AI變得更加通用和高效。這已經成為AI浪潮下的行業共識。
圖片來源:每經記者 孔澤思 攝(資料圖)
11月15日,在騰訊云向量數據庫技術及產業峰會上,騰訊云全面升級向量數據庫多項核心性能,最高支持千億級向量規模和500萬QPS(每秒查詢率)峰值能力,同時和信通院一起聯合50多家企業共同發布了國內首個向量數據庫標準,推進向量數據庫及大模型相關產業走向大規模應用。
騰訊方面透露,自7月份正式發布以來,騰訊云向量數據庫經過多次迭代升級,在企業級能力上持續突破:在優化版的IVF索引支持下,從最初支持的十億向量規模到現在的千億規模;不斷優化索引的壓縮算法,讓相同的內存可以存儲5-10倍的數據;集成Embedding(嵌入)功能,讓用戶無須關注向量生成過程,就可以實現快速的數據處理。
騰訊云數據庫副總經理羅云在會上表示:“從編程語言到自然語言,大模型重塑了算力調度方式。而AGI(通用人工智能)時代,也需要智能化的數據調度范式。AGI時代的數據平臺,向量數據庫是數據的中樞,騰訊云向量數據庫希望成為這個數據中樞,通過企業級和智能化的能力助力各行各業一起走向AGI。”
在會后接受采訪時,羅云進一步分析道:“向量在未來是一種通用的人工智能數據格式,它連接關鍵數據庫、非關鍵數據庫、對象存儲、文件存儲各式各樣結構的數據,把這些數據集中化放在一個數據管理平臺上,屏蔽掉因底層數據格式的差異導致無法很好使用非結構化數據的問題。”他提到,大模型目前更多是解決計算問題,而向量數據庫解決的是存儲問題,兩者之間相互支持配合,是一種“你中有我,我中有你”的關系。
如今,向量數據庫通過統一數據“語言”能夠加速大模型高效落地,已經成為了行業共識。今年全球有多家向量數據庫創業公司獲得新融資。阿里云今年7月也發布了內置向量引擎功能的最新版云原生數倉AnalyticDB,用戶僅需30分鐘即可構建專屬生成式AI應用。
據羅云介紹,目前騰訊云向量數據庫已經累計服務了騰訊內部40多個業務,日請求量達1600億次,服務了包括博世、銷售易、搜狐、好未來、鏈家等在內的超過1000家外部客戶。
例如,在SaaS領域,幫助企業客戶快速構建私域知識庫、智能客服系統;在電商行業,使用向量數據庫來提升推薦、搜索、廣告業務的推薦效果;在出行行業,使用向量數據庫來加速自動駕駛模型訓練。此外,在教育行業以及文創等行業也有廣泛應用。
《每日經濟新聞》記者注意到,向量數據庫擁有騰訊云產品一貫的推廣邏輯——在內部豐富的產品矩陣中打磨跑通,再對外輸出經驗。羅云認為,騰訊自己把產品的應用吃透,再放到外部去,客戶的滿意度自然就會起來。“在To B這種賽道,一個客戶的試錯成本是很高的。如果客戶由于我們的服務沒有支撐好他的業務,那這種業界的口碑傳播其實對我們整個云品牌的創傷是挺大的。”他說道。
那么,為何最早使用騰訊云向量數據庫的是SaaS領域以及電商出行、教育等行業?羅云認為,產品落地的“冷啟動”對象,首先主要來自騰訊云既有的客戶群體,其次是取決于客戶意愿,對新興業務是否主動擁抱。
羅云稱,“我和很多的企業主都在聊,大家很饑渴也很焦慮,生怕在AI時代掉隊,但他們其實也不太明白怎么樣去用好向量數據庫,怎么樣用好大模型,怎么樣把自己的知識變成向量數據存儲起來。盡管向量數據庫是很重計算、重內存的事情,整個行業都在探討解決方案,但目前來看,成本還不是當前推廣向量數據庫的主要‘卡點’,客戶更多的還是考慮怎樣把自己的行業know-how(技術訣竅)和AI技術打通”。
封面圖片來源:每經記者 孔澤思 攝(資料圖)
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP