騰訊云正式發布向量數據庫,已應用于QQ瀏覽器、騰訊游戲等業務場景_全球簡訊
(原標題:騰訊云正式發布向量數據庫,已應用于QQ瀏覽器、騰訊游戲等業務場景)
“每日調用量超千億次。”
【資料圖】
作者:涂鴉君 編輯:tuya 出品:財經涂鴉
7月4日,騰訊云正式發布國內首個AI原生(AI Native)的自研向量數據庫(Tencent Cloud Vector DB),預計 8月上線騰訊云官網。
據介紹,該數據庫是騰訊自研、基于內部多年運營積累的分布式向量數據庫,已經過騰訊海量業務場景驗證,日均處理向量檢索千億次,支持標量+向量的混合檢索,具有高性能、大容量等特點,支持全內存索引。主要面向大模型訓練,讓企業原先花一個月時間才能完成的大模型接入,縮短到三天時間。
天眼查App顯示,騰訊科技(深圳)有限公司于近日申請注冊兩枚“TENCENT CLOUD VECTORDB”商標,國際分類為科學儀器、網站服務,當前商標狀態為申請中。
騰訊云數據庫副總經理羅云指出,向量數據庫已經在QQ瀏覽器、騰訊視頻、騰訊游戲、QQ音樂、搜狗輸入法等上百個業務場景應用,每日調用量超千億次。其中,支撐QQ音樂人均聽歌時長提升3.2%,QQ瀏覽器成本降低37.9%,騰訊視頻有效曝光人均時長提升1.74%。
其還自研了分布式向量數據庫核心引擎Olama,原ElasticFaiss。據了解,Olama最早于2019年4月進行孵化,目前可支持十億級別的單行向量數據索引、查詢QPS達到百萬、響應延遲在20毫秒。
向量數據庫源自騰訊集團每日處理千億次檢索的向量引擎(OLAMA),單索引支持10億級向量規模,更適用于AI運算、檢索,數據接入AI的效率也比傳統方案提升10倍。
針對大模型場景,向量數據庫在接入層、計算層、存儲層實現了全面AI化:在接入層,智能化支持自然語言文本的直接檢索;在計算層,通過AI算子替代企業尋找/調優AI算法,將接入工期從一個月縮短到3天;在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。
此外,騰訊云在6月19日首次公布了其行業大模型研發進展,依托騰訊云TI平臺打造行業大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務,技術底座來自騰訊全棧能力,提供高性能計算集群HCC、高性能網絡、向量數據庫等基礎設施。
4月,騰訊云發布了專為大模型訓練設計的新一代HCC高性能計算集群,采用最新一代的騰訊云星星海自研服務器,具備業界最高的3.2Tbps互聯帶寬,算力性能提升3倍。
一直以來,騰訊在產業互聯網中的定位是做產業的“數字化助手”,騰訊云作為中國云市場的頭部廠商,目前形成了四級加速框架,為產業輸出從底層算力支撐到AI開發平臺、到AI產品解決方案、再到頂層數智化轉型方法的四級全鏈條服務,是實現這一目標的重要動力引擎。
展望未來,“向量數據庫+大模型+數據”將產生“飛輪效應”,共同助力企業步入AI Native(AI原生)時代。騰訊云也將繼續打磨技術能力,提供更堅實的AI基礎設施。
關鍵詞: