概覽
向量檢索服務 DashVector是基於阿里雲的向量引擎Proxima的內核開發的。 它提供了高效的向量檢索服務,這些服務完全在雲原生架構上進行管理,並且可以橫向和縱向擴展以滿足業務需求。 向量檢索服務透過簡單的API和SDK提供強大的向量管理和檢索能力,您可以輕鬆地將其集成到智能問答、多模態搜尋等各種場景的應用程式中。
運作方式
-
應用程式
透過低代碼API和簡單的SDK,將來自各種場景的應用程式(例如多模態搜尋,智能問答和基於LLM的服務)與DashVector集成。
-
DashVector
基於雲原生架構,DashVector可以跨集群跨地域部署,您可以透過擴展集群和服務(searcher)來調整服務量和性能(如QPS),靈活應對業務變化。 您可以在DashVector控制台中管理和配置向量搜尋服務(如集群、集合、API密鑰等)。 我們提供主流編程語言的SDK,讓您可以快速使用低代碼方式開始使用服務。
-
雲基礎設施
阿里雲提供強大的計算、儲存和網絡雲資源,以及強大的數據處理和容器管理服務,支援靈活、可靠的雲原生架構。
功能
完全托管的雲上向量檢索服務
準確而高效的搜尋
DashVector集成了阿里雲的矢量搜我尋引擎Proxima,該引擎提供高性能算法以實現大規模數據的低延遲搜尋。
低運維成本
具有水平和垂直可擴展性的完全托管的雲原生向量搜尋服務可降低運維成本,使您能夠僅關注業務需求,而無需擔心底層架構。
極簡SDK設計
低代碼API和易於使用的SDK,支援快速集成到各種業務場景的人工智能應用程式中。
向量數據的即時索引
使用串流數據建構索引
DashVector採用扁平化索引架構,支援大規模串流數據從頭開始線上索引。
即時線上更新
當新增、刪除或修改向量數據時,向量狀態立即生效。 向量數據在新增後立即檢查,並即時寫入硬碟驅動器。 向量數據狀態亦會即時更新。
大量數據的快速索引
DashVector透過多種方式優化索引結構和載入方式,支援2 ~ 20,000維的大規模向量數據導入。
已篩選的搜尋
可自訂架構
對於過濾搜尋來說,DashVector使用預定義的字段來實現更高的檢索速度和更少的計算功耗。
使用多個表達式進行篩選搜尋
您可以使用比較、邏輯和字符串運算符(包括「<」 、「<=」、「!=」、「>」、「and」、「or」和「like」)執行組合搜尋。
稀疏向量
關鍵詞搜尋和混合搜尋
您可以使用DashVector執行關鍵字搜尋,向量搜尋或混合搜尋(關鍵字 + 向量),該服務同時支援稀疏向量和密集向量,以平衡語義和關鍵字。
稀疏向量生成器
我們建議使用DashVector中的DashText進行稀疏向量編碼。 DashText使用BM25算法將原始文本轉換為稀疏向量數據,大大簡化了基於關鍵字的向量搜尋過程。
場景
您可以使用DashVector的API,基於文本索引和向量搜尋功能,從零開始快速構建語義搜尋服務,以支援像通義千問這樣的生成式AI應用。 這些應用程式可以創建基於文本的內容(包括翻譯、重寫、摘要等)、編寫代碼和角色扮演。
優勢
-
高效
您可以即時新增、刪除、搜尋和修訂向量數據,並在多個數據源中進行增量或全量數據同步。
-
快速和準確
您可以使用各種運算符的組合執行過濾搜尋,並自訂無模式數據庫設計支援的數據字段,以加速向量搜尋過程。
DashVector將圖像、影片和文本的單個文檔抽象為高維向量特徵,然後基於所有特徵構建高效的向量索引。 用戶只需輸入文本或上傳照片或影片即可搜尋類似文件。 這種多模態搜尋服務極大地改善了用戶體驗。
優勢
-
靈活
您可以為數據設定多個集合和分區,並輕鬆管理它們
-
無模式數據庫
您可以自訂數據字段,並提高向量搜尋的靈活性和準確性。
-
方便
您可以透過低代碼API和易於使用的SDK,快速設定多模態搜尋服務。
您可以結合DashVector與大型語言模型(LLM),以構建特定領域的知識問答系統。 首先,將用戶輸入和知識庫的內容轉換為高質量的向量,然後利用DashVector將匹配過程轉換為語義搜尋,以便更準確,更有效地提取相關知識。 透過相應的提示,該服務可以理解用戶意圖並提供來自知識庫資訊的答案。
優勢
-
雲原生
雲原生系統架構將計算資源與儲存資源分離,因此您可以輕鬆向上和向外擴展。
-
易於集成
您可以集成特定領域的知識庫與DashVector,以提供準確的問答服務。
-
大範圍
Vector Retrieval Service支援快速檢索大規模向量數據,以提高向量搜索的準確性。
針對智能搜尋、廣告推送等場景,將購買記錄等用戶洞察轉化為向量數據,DashVector根據相似度在向量數據庫中搜尋相關產品資訊,推薦給潛在買家,提高購買率和用戶體驗。
優勢
-
兼容性高
支援廣泛的數據類型和各種搜尋方法。
-
高效能
達摩院面向大規模文本和向量數據的向量搜尋引擎,以及阿里雲的高可用架構,為各種搜尋場景提供更高性能的服務。
-
可自訂
您可以自訂搜尋距離,並為相似性設定閾值(過濾掉相似度低於閾值的向量數據 )。
透過5個簡單步驟啟用向量檢索服務