11月15日,中國信通院聯(lián)合騰訊云計(jì)算(北京)有限責(zé)任公司、中移(蘇州)軟件技術(shù)有限公司等多家企業(yè)共同編制的、國內(nèi)首個(gè)向量數(shù)據(jù)庫標(biāo)準(zhǔn)正式發(fā)布,將為我國向量數(shù)據(jù)庫研發(fā)、測試及選型提供重要參考,推動(dòng)我國人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展。
向量數(shù)據(jù)能夠從多個(gè)維度記錄事物特征,是人工智能時(shí)代的基礎(chǔ)數(shù)據(jù)形式。人工智能系統(tǒng)正是通過海量向量數(shù)據(jù)所標(biāo)記的事物特征,準(zhǔn)確理解、認(rèn)識(shí)事物。向量數(shù)據(jù)庫則能夠?qū)A肯蛄繑?shù)據(jù)進(jìn)行有效儲(chǔ)存、檢索、管理。
傳統(tǒng)關(guān)系型數(shù)據(jù)庫主要基于表格形式,按照行和列來組織、儲(chǔ)存數(shù)據(jù),在進(jìn)行檢索時(shí)需要逐行、逐列進(jìn)行搜索,不利于對(duì)向量數(shù)據(jù)進(jìn)行快速檢索和高效管理。而向量數(shù)據(jù)庫借助向量索引等技術(shù),在進(jìn)行數(shù)據(jù)檢索時(shí),可以通過模糊匹配來進(jìn)行近似查找,能夠以最快速度找出符合需求的數(shù)據(jù),顯著提升人工智能系統(tǒng)的數(shù)據(jù)檢索、處理效率。
中國信通院云計(jì)算與大數(shù)據(jù)研究所大數(shù)據(jù)與區(qū)塊鏈部主任姜春宇在當(dāng)日舉行的“AG時(shí)代的‘?dāng)?shù)據(jù)樞紐’騰訊云向量數(shù)據(jù)庫技術(shù)及產(chǎn)業(yè)峰會(huì)”上表示,今年以來,人工智能大模型的爆發(fā)式發(fā)展,進(jìn)一步催生了行業(yè)對(duì)向量數(shù)據(jù)庫的需求,向量數(shù)據(jù)庫關(guān)注度持續(xù)上升。但長期以來,在向量數(shù)據(jù)庫技術(shù)架構(gòu)、查詢語言、使用成本等方面,行業(yè)共識(shí)不足,有較多亟待解決的關(guān)鍵問題。
為進(jìn)一步推動(dòng)行業(yè)形成對(duì)向量數(shù)據(jù)庫基礎(chǔ)能力的基本共識(shí),推動(dòng)向量數(shù)據(jù)庫技術(shù)產(chǎn)業(yè)發(fā)展和規(guī)模化應(yīng)用,中國信通院云計(jì)算與大數(shù)據(jù)研究所依托中國通信標(biāo)準(zhǔn)化協(xié)會(huì)大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(huì),推動(dòng)向量數(shù)據(jù)庫領(lǐng)域標(biāo)準(zhǔn)化相關(guān)工作。此次發(fā)布的向量數(shù)據(jù)庫標(biāo)準(zhǔn)聚焦七大能力域,包含47個(gè)能力測試項(xiàng),其中有27個(gè)必選項(xiàng)和20個(gè)可選項(xiàng)。目前,騰訊云向量數(shù)據(jù)庫是首個(gè)完成標(biāo)準(zhǔn)評(píng)價(jià)的向量數(shù)據(jù)庫,通過全部必選測試項(xiàng)。
來源 | 科技日?qǐng)?bào)