使用CreateSearchIndex方法在資料表上建立一個多元索引。一個資料表支援建立多個多元索引。建立多元索引時,您需要將要查詢的欄位添加到多元索引中,您還可以配置多元索引路由鍵、預排序等進階選項。
前提條件
完成建立資料表,並且資料表同時滿足以下條件:
最大版本數必須為1。
資料生命週期為-1或者資料表為禁止更新狀態。
注意事項
參數
建立多元索引時,需要指定資料表名稱(table_name)、多元索引名稱(index_name)和索引的結構資訊(schema),其中schema包含field_schemas(Index的所有欄位的設定)、index_setting(索引設定)和index_sort(索引預排序設定)。詳細參數說明請參見下表。
組成 | 說明 |
table_name | 資料表名稱。 |
index_name | 多元索引名稱。 |
field_schemas | field_schema的列表,每個field_schema包含如下內容:
|
index_setting | 索引設定,包含routing_fields設定。 routing_fields(可選):自訂路由欄位。可以選擇部分主鍵列作為路由欄位,一般情況下只需要設定一個。如果設定多個路由鍵,系統會將多個路由鍵的值拼接成一個值。 在進行索引資料寫入時,系統會根據路由欄位的值計算索引資料的分布位置,路由欄位的值相同的記錄會被索引到相同的資料分區中。 |
index_sort | 索引預排序設定,包含sorters設定。如果不設定,則預設按照主鍵排序。 說明 含有Nested類型的索引不支援indexSort,沒有預排序。 sorters(必選):索引的預排序方式,支援按照主鍵排序和欄位值排序。關於排序的更多資訊,請參見排序和翻頁。
|
樣本
建立多元索引時設定分詞
以下樣本用於在建立多元索引時設定分詞。該多元索引包括k(Keyword類型)、t(Text類型)、g(Geopoint類型)、ka(數組Keyword類型)、la(數組Long類型)和n(Nested類型)六個欄位。其中n欄位包括nk(Keyword類型)、nl(Long類型)和nt(Text類型)三個子欄位。
def create_search_index(client):
# Keyword類型的欄位,建立索引並開啟統計彙總功能。
field_a = FieldSchema('k', FieldType.KEYWORD, index=True, enable_sort_and_agg=True, store=True)
# Text類型的欄位,建立索引並使用單字分詞。
field_b = FieldSchema('t', FieldType.TEXT, index=True, store=True, analyzer=AnalyzerType.SINGLEWORD)
# Text類型的欄位,建立索引並使用模糊分詞。
#field_b = FieldSchema('t', FieldType.TEXT, index=True, store=True, analyzer=AnalyzerType.FUZZY,analyzer_parameter=FuzzyAnalyzerParameter(1, 6))
# Text類型的欄位,建立索引並使用自訂分隔字元半形逗號(,)進行分詞。
#field_b = FieldSchema('t', FieldType.TEXT, index=True, store=True, analyzer=AnalyzerType.SPLIT, analyzer_parameter = SplitAnalyzerParameter(","))
# Geopoint類型的欄位,建立索引。
field_c = FieldSchema('g', FieldType.GEOPOINT, index=True, store=True)
# 數組Kerword類型欄位,建立索引。
field_d = FieldSchema('ka', FieldType.KEYWORD, index=True, is_array=True, store=True)
# 數組Long類型欄位,建立索引。
field_e = FieldSchema('la', FieldType.LONG, index=True, is_array=True, store=True)
# Nested類型欄位,包括nk(Keyword類型)、nl(Long類型)和nt(Text類型)三個子欄位。
field_n = FieldSchema('n', FieldType.NESTED, sub_field_schemas=[
FieldSchema('nk', FieldType.KEYWORD, index=True, store=True),
FieldSchema('nl', FieldType.LONG, index=True, store=True),
FieldSchema('nt', FieldType.TEXT, index=True, store=True),
])
fields = [field_a, field_b, field_c, field_d, field_e, field_n]
index_setting = IndexSetting(routing_fields=['PK1'])
index_sort = None #當多元索引中存在Nested類型欄位時,不能設定索引預排序.
#index_sort = Sort(sorters=[PrimaryKeySort(SortOrder.ASC)])
index_meta = SearchIndexMeta(fields, index_setting=index_setting, index_sort=index_sort)
client.create_search_index('<TABLE_NAME>', '<SEARCH_INDEX_NAME>', index_meta)
建立多元索引時設定向量欄位
以下樣本用於建立一個多元索引。該多元索引包括col_keyword(Keyword類型)、col_long(Long類型)和col_vector(Vector類型)三列。其中向量欄位的距離度量的演算法為點積。
def create_search_index(client):
index_meta = SearchIndexMeta([
FieldSchema('col_keyword', FieldType.KEYWORD, index=True, enable_sort_and_agg=True, store=True), # 字串類型
FieldSchema('col_long', FieldType.LONG, index=True, store=True), # 數字類型
FieldSchema("col_vector", FieldType.VECTOR, # 向量類型
vector_options=VectorOptions(
data_type=VectorDataType.VD_FLOAT_32,
dimension=4, # 向量維度為4,相似性演算法為: 點積
metric_type=VectorMetricType.VM_DOT_PRODUCT
)),
])
client.create_search_index(table_name, index_name, index_meta)
建立多元索引時開啟摘要與高亮
以下樣本用於在建立多元索引時開啟摘要與高亮。該多元索引包括k(Keyword類型)、t(Text類型)和n(Nested類型)三個欄位,其中n欄位包括nk(Keyword類型)、nl(Long類型)和nt(Text類型)三個子欄位。同時為t欄位和n欄位中的nt子欄位開啟摘要與高亮功能。
def create_search_index0905(client):
# Keyword類型的欄位,建立索引並開啟統計彙總功能。
field_a = FieldSchema('k', FieldType.KEYWORD, index=True, enable_sort_and_agg=True, store=True)
# Text類型的欄位,建立索引並使用單字分詞,同時為欄位開啟摘要與高亮功能。
field_b = FieldSchema('t', FieldType.TEXT, index=True, store=True, analyzer=AnalyzerType.SINGLEWORD,
enable_highlighting=True)
# Nested類型欄位,包括nk(Keyword類型)、nl(Long類型)和nt(Text類型)三個子欄位,同時為nt子列開啟摘要與高亮功能。
field_n = FieldSchema('n', FieldType.NESTED, sub_field_schemas=[
FieldSchema('nk', FieldType.KEYWORD, index=True, store=True),
FieldSchema('nl', FieldType.LONG, index=True, store=True),
FieldSchema('nt', FieldType.TEXT, index=True, store=True, enable_highlighting=True),
])
fields = [field_a, field_b, field_n]
index_setting = IndexSetting(routing_fields=['id'])
index_sort = None # 當多元索引中存在Nested類型欄位時,不能設定索引預排序.
# index_sort = Sort(sorters=[PrimaryKeySort(SortOrder.ASC)])
index_meta = SearchIndexMeta(fields, index_setting=index_setting, index_sort=index_sort)
client.create_search_index('pythontest', 'pythontest_0905', index_meta)