サマリーインデックスの概要
サマリーインデックスは、単一のドキュメントに関連するすべての情報を格納します。この情報はドキュメント ID(docID)を用いて特定され、ドキュメントのまとめを格納および取得するためのサービスを提供します。サマリーインデックスの構造はフォワードインデックスと類似していますが、それぞれ異なる目的で使用されます。
サマリーインデックスの設定サンプルコード
"summarys":
{
"summary_fields":["id", "company_id", "subject", "cat_id"],
"compress":false,
"parameter" : {
"compress_type" : "uniq|equal",
"file_compress" : "simple_compress1"
}
}
-
summary_fields パラメーターは、サマリーインデックスに格納するフィールドを指定します。このパラメーターには、すべてのデータの型のフィールドを指定できます。
-
compress パラメーターは、zlib を使用してサマリーインデックスを圧縮するかどうかを指定します。有効な値は true および false です。true を指定するとサマリーインデックスが圧縮され、false を指定すると圧縮されません。デフォルト値は false です。
-
TIMESTAMP データの型のフィールドをサマリーインデックスとして指定した場合、そのフィールドは属性として格納されます。これにより、デフォルトのタイムゾーンを使用する場合、時間フォーマットがシステムによって一元的に処理されます。
-
parameter フィールドを使用して、特定のパラメーターを設定できます。OpenSearch Vector Search Edition V3.9.1 以降のバージョンでは、parameter フィールドがサポートされています。以下のパラメーターが利用可能です。
-
compress_type:コーデックです。「uniq」と「equal」の説明については、「フィールド」セクションをご参照ください。
-
file_compress:ファイルの圧縮を指定します。schema.json ファイルでエイリアスを定義した後、file_compress パラメーターにはそのエイリアスを指定する必要があります。file_compress パラメーターで指定された圧縮方法は、compress パラメーターで指定された方法よりも高い圧縮性能を発揮します。そのため、圧縮性能を向上させるには、compress パラメーターの値を false に設定し、代わりに file_compress パラメーターを設定することを推奨します。