子句說明
查詢query功能,是搜尋語句中最基礎,也是不可缺少的一部分。它表示在哪個索引欄位下查詢什麼內容,並且可以指定多個查詢條件及其之間的關係(AND \ OR \ ANDNOT \ RANK)。
例如可以將TEXT類型的title和subject兩個欄位組合在一起,建立共同的索引default。此時通過default索引的查詢,可以召回查詢詞命中了title或者subject原文的文檔。
如果將 title欄位,單獨建立索引 title_search。那麼在 title_search索引做查詢時,只有查詢詞命中了title這個欄位的原文,才能召回該文檔。
文法說明
{
"query": ""
}query子句是一個必選子句,它的內容是待查詢的索引與查詢片語成的字串,例如 title:'OpenSearch' AND tag:'1',具體的查詢拼接文法請參考簡單查詢和進階查詢部分。
簡單查詢
查詢文法:
索引名:'查詢詞'^boost 查詢條件 索引名:'查詢詞'^boost索引名:是在定義索引結構時,配置的索引資訊。表示在指定索引欄位包含的源欄位上,尋找包含“查詢詞”的文檔。
查詢詞:表示要進行查詢的內容。
boost:表示要設定的查詢詞權重,類型為int,範圍為[0,99],不設定預設為99。
查詢條件可以為多個,支援關係主要有
()、AND、OR、ANDNOT、RANK(必須大寫),它們之間的優先順序從低到高排列是:RANK,OR,AND,ANDNOT,()。AND 表示兩個查詢詞的交集,比如default:'手機' AND default:'藍芽',表示查詢包含“手機”和“藍芽”同時出現的文檔。
OR 表示兩個查詢詞的並集,比如default:'手機' OR default:'藍芽',表示查詢包含“手機”或者“藍芽”的文檔。
ANDNOT 表示第一個查詢成立並且第二個不成立的集合,比如default:'手機' ANDNOT default:'藍芽',表示查詢包含“手機”,並不包含“藍芽”的文檔。
RANK 表示第一個查詢成立,並且第二個查詢不一定成立的集合。比如default:'手機' RANK default:'藍芽',表示查詢包含“手機”的文檔,文檔並不一定包含“藍芽”。該文法主要用於某些查詢詞不影響召回,隻影響算分的情境,例如上面的例子中配合文本相關性計算可以實現優先將含有藍芽的文檔排在前面。
進階查詢
多個查詢詞共用索引名
查詢文法:
索引名:'查詢詞'^boost | '查詢詞'^boost
索引名:'查詢詞'^boost & '查詢詞'^boost'|' 表示多個查詢詞之間是OR關係,'&'表示多個查詢詞是AND關係。
短語查詢
查詢文法:
索引名:"查詢詞"^boost 查詢條件 索引名:"查詢詞"^boost 如果“查詢詞”使用
""括起來進行查詢,表示 phrase(短語)查詢。即要求查詢詞分詞後各個term的位置相連、順序一致。range查詢,包括地理位置分析和數值分析,具體用法請點擊此處。
在最終產生query子句時需要將短語查詢中的雙引號進行轉義處理。
地理位置查詢:
查詢文法:
索引名:'SHAPE(ARGS...)' 其中SHAPE(ARGS...)可以是:
點:point(LON LAT),註:LON表示經度,LAT表示緯度,中間是空格
圓:circle(LON LAT,Radius),註:LON表示經度,LAT表示緯度,Radius是半徑,單位:米。
矩形:rectangle(minLON minLAT,maxLON maxLAT),註:緯度上,maxY>=minY,如果寫反了,會自動調整; 經度上,minX到maxX是由西向東理解的,如果寫反了,代表的範圍也就錯了。
多邊形:polygon(LON1 LAT1,LON2 LAT2,LON3 LAT3,LON4 LAT4,...),多邊形可以是凸多邊形或凹多邊形;多邊形起止點需要保證一致;相鄰的兩條邊不能共線;多邊形的邊不允許自相交。
注意:
查詢的索引必須是空間類型索引。
對Spatial索引的查詢圖形要使用單引號('')將其引起來,如:query=spatial_index:'circle(130.0 10.0,1000.0)'。
線和多邊形的點座標會映射到平面展開的世界地圖上,以此確定線和多邊形範圍,不考慮跨180度經線的情況。location倒排的查詢結果是精確的。line和polygon倒排的查詢結果需要進行過濾。
數值範圍查詢:
查詢文法:
索引名:(數值1,數值2]數值1,數值2表示數值範圍的起止值,支援數值範圍查詢的開閉區間查詢,'('表示開區間,']'表示閉區間。
例子:
開區間查詢:query = price:(3,100), 表示查詢3<x<100的資料。
閉區間查詢:query = price:[3,100],表示查詢3<=x<=100的資料
半開半閉查詢:query = price:(3,100],表示查詢3<x<=100的資料。
起始值不指定:query=price:(, 100),表示查詢x<100的資料。
注意:
查詢索引必須為數值範圍索引。
數值必須為整型,不支援浮點型。
日期date查詢:
查詢文法:
索引名:(起始時間,結束時間]起止時間是一個整數類型的時間戳記,精確到毫秒。如果起始時間不指定表示從0開始檢索,如果結束時間不指定預設為4102416000000(2100-01-01 00:00對應的毫秒時間戳記)。日期查詢也支援日期的開閉區間查詢。
注意:
查詢索引必須為日期類型索引。
時間戳記必須為整數,精確到毫秒,如果超過4102416000000,按照410241600000
樣本
文本檢索樣本
查詢title索引欄位中包含“北京大學”的文檔:
query=title:'北京大學'查詢title索引欄位中包含“北京大學”的文檔,並且包含“浙江大學”的文檔:
query=title:'北京大學' AND title:'浙江大學'查詢title索引欄位中包含“北京大學”或者“浙江大學”的文檔:
query=title:'北京大學' OR title:'浙江大學'查詢2024年10月份上架的商品:
query=publish_time:(1727712000000,1730304000000)
向量檢索樣本
查詢64維的向量索引:
文法:query=vector:'向量資料' query=vector: '0.377796,-0.958450,0.409853,-0.238177,-1.293826,0.356797,-0.295727,0.847301,-1.220337,0.148032,-1.128458,0.903187,0.509352,0.293686,-1.005852,-0.488839,0.888227,-0.555556,-0.658025,0.267552,-0.567601,0.003045,0.591734,-0.515983,-1.316453,-1.462450,0.091946,1.554954,0.384802,0.720498,0.144338,1.217826,0.724039,0.044212,0.571332,-1.425430,0.618965,0.481887,-1.617787,1.505416,-0.683652,1.030900,0.562021,0.162437,0.816546,0.112229,-0.739288,-0.342643,-0.199292,0.508368,-1.384887,-1.842170,0.952622,-1.699499,0.199430,-0.232464,-0.273227,-0.383696,-0.511302,0.005458,1.873572,-0.926169,-0.417587,-0.660156'指定top n 查詢:
文法:&n=number 直接拼在向量後面 query=vector_index:'0.1,0.2,0.98,0.6;0.3,0.4,0.98,0.6&n=10'
文本+向量混合檢索樣本
查詢64維的向量資料並且title索引欄位的中包含北京大學:
文法:query=vector:'向量資料' AND title:'關鍵詞'
query=title:'北京大學' AND vector: '0.377796,-0.958450,0.409853,-0.238177,-1.293826,0.356797,-0.295727,0.847301,-1.220337,0.148032,-1.128458,0.903187,0.509352,0.293686,-1.005852,-0.488839,0.888227,-0.555556,-0.658025,0.267552,-0.567601,0.003045,0.591734,-0.515983,-1.316453,-1.462450,0.091946,1.554954,0.384802,0.720498,0.144338,1.217826,0.724039,0.044212,0.571332,-1.425430,0.618965,0.481887,-1.617787,1.505416,-0.683652,1.030900,0.562021,0.162437,0.816546,0.112229,-0.739288,-0.342643,-0.199292,0.508368,-1.384887,-1.842170,0.952622,-1.699499,0.199430,-0.232464,-0.273227,-0.383696,-0.511302,0.005458,1.873572,-0.926169,-0.417587,-0.660156'