全部產品
Search
文件中心

Tablestore:建立多元索引

更新時間:Apr 30, 2025

使用CreateSearchIndex方法在資料表上建立一個多元索引。一個資料表支援建立多個多元索引。建立多元索引時,您需要將要查詢的欄位添加到多元索引中,您還可以配置多元索引路由鍵、預排序等進階選項。

前提條件

注意事項

  • 建立多元索引時,多元索引中欄位的資料類型必須與資料表中欄位的資料類型相匹配。

  • 如果要修改多元索引為指定資料生命週期(即取值不為-1),則您必須禁用資料表的UpdateRow更新寫入功能。同時多元索引的TTL值必須小於或等於資料表的TTL值。更多資訊,請參見生命週期管理

參數

建立多元索引時,需要指定資料表名稱(tableName)、多元索引名稱(indexName)和索引的結構資訊(schema),其中schema包含fieldSchemas(Index的所有欄位的設定)、indexSetting(索引設定)和indexSort(索引預排序設定)。詳細參數說明請參見下表。

參數

說明

tableName

資料表名稱。

indexName

多元索引名稱。

fieldSchemas

fieldSchemas的列表,每個fieldSchema包含如下內容:

  • fieldName(必選):建立多元索引的欄位名,即列名,類型為String。

    多元索引中的欄位可以是主鍵列或者屬性列。

  • fieldType(必選):欄位的資料類型,類型為TableStore.FieldType.XXX。

  • index(可選):是否開啟索引,類型為Boolean。

    預設為true,表示對該列構建倒排索引或者空間索引;如果設定為false,則不會對該列構建索引。

  • analyzer(可選):分詞器類型。當欄位類型為Text時,可以設定此參數;如果不設定,則預設分詞器類型為單字分詞。

  • analyzerParameter(可選):分詞參數配置,請根據不同分詞器類型設定相應參數。當為欄位配置了analyzer時,必須設定此參數。

  • enableSortAndAgg(可選):是否開啟排序與統計彙總功能,類型為Boolean。

    只有enableSortAndAgg設定為true的欄位才能進行排序

    重要

    Nested類型的欄位不支援開啟排序與統計彙總功能,但是Nested類型內部的子列支援開啟排序與統計彙總功能。

  • store(可選):是否在多元索引中附加儲存該欄位的值,類型為Boolean。

    開啟後,可以直接從多元索引中讀取該欄位的值,而不必反查資料表,可用於查詢效能最佳化。

  • isAnArray(可選):是否為數組,類型為Boolean。

    如果設定為true,則表示該列是一個數組,在寫入時,必須按照JSON數組格式寫入,例如["a","b","c"]。

    由於Nested類型是一個數組,當fieldType為Nested類型時,無需設定此參數。

  • fieldSchemas(可選):當欄位類型為Nested類型時,需要通過此參數設定嵌套文檔中子列的索引類型,類型為fieldSchema的列表。

  • isVirtualField(可選):該欄位是否為虛擬列,類型為Boolean類型,預設值為false。如果要使用虛擬列,請設定此參數為true。

  • sourceFieldName(可選):資料表中的欄位名稱,類型為String。當設定isVirtualField為true時,必須設定此參數。

  • dateFormats(可選):日期的格式,類型為String。當欄位類型為Date時,必須設定此參數。更多資訊,請參見日期時間類型

  • enableHighlighting(可選):是否開啟摘要與高亮功能,類型為Boolean。預設值為false,表示不開啟摘要與高亮。如果要使用摘要與高亮,請設定此參數為true。僅Text類型欄位支援摘要與高亮功能。

    重要

    Table StoreNode.js SDK從5.5.0版本開始支援此功能。

  • vectorOptions(可選):向量欄位類型的屬性參數。當欄位類型為 Vector 時,必須設定此參數。包括如下內容:

    • dataType:向量資料類型。當前僅支援 float32。如果有其他類型需求,請提交工單聯絡我們。

    • dimension:向量維度。向量類型欄位支援的最大維度 (Dimension)為2048。

    • metricType:向量之間距離度量的演算法,支援歐氏距離(euclidean)、餘弦相似性(cosine)、點積(dot_product)。

      • 歐氏距離(euclidean):多維空間中兩個向量之間的直線距離。出於效能考慮,Table Store中的歐氏距離演算法未進行最後的平方根計算。歐氏距離的評分越大表示兩個向量的相似性越大。

      • 餘弦相似性(cosine):向量空間中兩個向量間夾角的餘弦值。餘弦相似性的評分越高表示兩個向量的相似性越大。常用於文本資料的相似性計算。

      • 點積(dot_product):維度相同的兩個向量的對應座標相乘,然後將結果相加。點積的評分越高標識兩個向量的相似性越大。

      選用距離度量演算法的說明請參見距離度量演算法說明

indexSetting

索引設定,包含routingFields設定。

routingFields(可選):自訂路由欄位。可以選擇部分主鍵列作為路由欄位,一般情況下只需要設定一個。如果設定多個路由鍵,系統會將多個路由鍵的值拼接成一個值。

在進行索引資料寫入時,系統會根據路由欄位的值計算索引資料的分布位置,路由欄位的值相同的記錄會被索引到相同的資料分區中。

indexSort

索引預排序設定,包含sorters設定。如果不設定,則預設按照主鍵排序。

說明

含有Nested類型的索引不支援indexSort,沒有預排序。

sorters(必選):索引的預排序方式,支援按照主鍵排序和欄位值排序。關於排序的更多資訊,請參見排序和翻頁

  • PrimaryKeySort表示按照主鍵排序,包含如下設定:

    order:排序的順序,可按升序或者降序排序,預設為升序(TableStore.SortOrder.SORT_ORDER_ASC)。

  • FieldSort表示按照欄位值排序,包含如下設定:

    只有建立索引且開啟排序與統計彙總功能的欄位才能進行預排序。

    • fieldName:排序的欄位名。

    • order:排序的順序,可按照升序或者降序排序,預設為升序(TableStore.SortOrder.SORT_ORDER_ASC)。

    • mode:當欄位存在多個值時的排序方式。

timeToLive

選擇性參數。資料生命週期(TTL),即資料的儲存時間,單位為秒。

預設值為 -1,表示資料永不到期。資料生命週期的取值最低為 86400 秒(一天),也可設定為 -1(永不到期)。

當資料的儲存時間超過設定的資料生命週期時,系統會自動清理超過資料生命週期的資料。

樣本

建立多元索引時設定分詞

以下樣本用於建立一個多元索引。該多元索引包括pic_id(Keyword類型)、count(Long類型)、time_stamp(Long類型)、pic_description(Text類型)、col_vector(Vector類型)、pos(Geo-point類型)、pic_tag(Nested類型)、date(Date類型)、analyzer_single_word(Text類型)、analyzer_split(Text類型)、analyzer_fuzzy(Text類型)列。其中pic_tag包括sub_tag_name(Keyword類型)和tag_name(Keyword類型)兩列,analyzer_single_word列使用的分詞類型為單字分詞,analyzer_split列使用的分詞類型為分隔字元分詞,analyzer_fuzzy列使用的分詞類型為模糊分詞。

client.createSearchIndex({
    tableName: "<TABLE_NAME>", //設定資料表名稱。
    indexName: "<INDEX_NAME>", //設定多元索引名稱。
    schema: {
        fieldSchemas: [
            {
                fieldName: "pic_id",
                fieldType: TableStore.FieldType.KEYWORD, // 設定欄位名和欄位類型。
                index: true, // 設定開啟索引。
                enableSortAndAgg: true, // 設定開啟排序和統計功能。
                store: false,
                isAnArray: false
            },
            {
                fieldName: "count",
                fieldType: TableStore.FieldType.LONG,
                index: true,
                enableSortAndAgg: true,
                store: true,
                isAnArray: false
            },
            {
                fieldName: "time_stamp",
                fieldType: TableStore.FieldType.LONG,
                index: true,
                enableSortAndAgg: false,
                store: true,
                isAnArray: false,
            },
            {
                fieldName: "pic_description",
                fieldType: TableStore.FieldType.TEXT,
                index: true,
                enableSortAndAgg: false,
                store: true,
                isAnArray: false,
            },
            {
                fieldName: "col_vector",
                fieldType: TableStore.FieldType.VECTOR,
                index: true,
                isAnArray: false,
                vectorOptions: {
                    dataType: TableStore.VectorDataType.VD_FLOAT_32,
                    dimension: 4,
                    metricType: TableStore.VectorMetricType.VM_COSINE,
                }
            },
            {
                fieldName: "pos",
                fieldType: TableStore.FieldType.GEO_POINT,
                index: true,
                enableSortAndAgg: true,
                store: true,
                isAnArray: false,
            },
            {
                fieldName: "pic_tag",
                fieldType: TableStore.FieldType.NESTED,
                index: false,
                enableSortAndAgg: false,
                store: false,
                fieldSchemas: [
                    {
                        fieldName: "sub_tag_name",
                        fieldType: TableStore.FieldType.KEYWORD,
                        index: true,
                        enableSortAndAgg: true,
                        store: false,
                    },
                    {
                        fieldName: "tag_name",
                        fieldType: TableStore.FieldType.KEYWORD,
                        index: true,
                        enableSortAndAgg: true,
                        store: false,
                    }
                ]
            },
            {
                fieldName: "date",
                fieldType: TableStore.FieldType.DATE,
                index: true,
                enableSortAndAgg: true,
                store: true,
                isAnArray: false,
                dateFormats: ["yyyy-MM-dd'T'HH:mm:ss.SSSSSS"],
            },
            {
                fieldName: "analyzer_single_word",
                fieldType: TableStore.FieldType.TEXT,
                analyzer: "single_word",
                index: true,
                enableSortAndAgg: false,
                store: true,
                isAnArray: false,
                analyzerParameter: {
                    caseSensitive: true,
                    delimitWord: false,
                }
            },
            {
                fieldName: "analyzer_split",
                fieldType: TableStore.FieldType.TEXT,
                analyzer: "split",
                index: true,
                enableSortAndAgg: false,
                store: true,
                isAnArray: false,
                analyzerParameter: {
                    delimiter: ",",
                }
            },
            {
                fieldName: "analyzer_fuzzy",
                fieldType: TableStore.FieldType.TEXT,
                analyzer: "fuzzy",
                index: true,
                enableSortAndAgg: false,
                store: true,
                isAnArray: false,
                analyzerParameter: {
                    minChars: 1,
                    maxChars: 5,
                }
            },
        ],
        indexSetting: { //索引的配置選項。
            "routingFields": ["count", "pic_id"], //只支援將主鍵列設定為routingFields。
            "routingPartitionSize": null
        },
        //indexSort: {//含有Nested類型的索引不支援indexSort,沒有預排序。
            //sorters: [
                // { //不設定indexSort時,預設為PrimaryKeySort(升序)排序。
                //     primaryKeySort: {
                //         order: TableStore.SortOrder.SORT_ORDER_ASC
                //     }
                // },
                //{
                //   fieldSort: {
                //        fieldName: "Col_Keyword",
                //        order: TableStore.SortOrder.SORT_ORDER_DESC //設定indexSort排序的順序。
                //    }
                //}
            //]
        //},
        timeToLive: 1000000, //單位為秒。
    }
}, function (err, data) {
    if (err) {
        console.log('error:', err);
        return;
    }
    console.log('success:',data);
});

建立多元索引時開啟摘要與高亮

以下樣本用於在建立多元索引時開啟摘要與高亮。該多元索引包括k(Keyword類型)、t(Text類型)和n(Nested類型)三個欄位,其中n欄位包括nk(Keyword類型)、nl(Long類型)和nt(Text類型)三個子欄位。同時為t欄位和n欄位中的nt子欄位開啟摘要與高亮功能。

client.createSearchIndex({
    tableName: "<TABLE_NAME>", //設定資料表名稱。
    indexName: "<SEARCH_INDEX_NAME>", //設定多元索引名稱。
    schema: {
        fieldSchemas: [
            {
                fieldName: "k",
                fieldType: TableStore.FieldType.KEYWORD, // 設定欄位名和欄位類型。
                index: true, // 設定開啟索引。
                enableSortAndAgg: true, // 設定開啟排序和統計功能。
                store: false,
                isAnArray: false
            },
            {
                fieldName: "t",
                fieldType: TableStore.FieldType.TEXT,
                index: true,
                enableSortAndAgg: false,
                enableHighlighting: true, //為欄位開啟摘要與高亮功能。
                store: true,
                isAnArray: false,
            },
            {
                fieldName: "n",
                fieldType: TableStore.FieldType.NESTED,
                index: false,
                enableSortAndAgg: false,
                store: false,
                fieldSchemas: [
                    {
                        fieldName: "nk",
                        fieldType: TableStore.FieldType.KEYWORD,
                        index: true,
                        enableSortAndAgg: true,
                        store: false,
                    },
                    {
                        fieldName: "nl",
                        fieldType: TableStore.FieldType.LONG,
                        index: true,
                        enableSortAndAgg: true,
                        store: false,
                    },
                    {
                        fieldName: "nt",
                        fieldType: TableStore.FieldType.TEXT,
                        index: true,
                        enableSortAndAgg: false,
                        enableHighlighting: true, //為欄位開啟摘要與高亮功能。
                        store: false,
                    },
                ]
            },
        ],
        indexSetting: { //索引的配置選項。
            "routingFields": ["id"], //只支援將主鍵列設定為routingFields。
            "routingPartitionSize": null
        },
        //indexSort: {//含有Nested類型的索引不支援indexSort,沒有預排序。
            //sorters: [
                // { //不設定indexSort時,預設為PrimaryKeySort(升序)排序。
                //     primaryKeySort: {
                //         order: TableStore.SortOrder.SORT_ORDER_ASC
                //     }
                // },
                //{
                //   fieldSort: {
                //        fieldName: "Col_Keyword",
                //        order: TableStore.SortOrder.SORT_ORDER_DESC //設定indexSort排序的順序。
                //    }
                //}
            //]
        //},
        timeToLive: 1000000, //單位為秒。
    }
}, function (err, data) {
    if (err) {
        console.log('error:', err);
        return;
    }
    console.log('success:',data);
});

常見問題

相關文檔