すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:基本的な組み込み機能

最終更新日:Dec 28, 2024

このトピックでは、カスタムソートモデルで使用される基本的な組み込み機能について説明します。

基本機能の図

image.png

基本機能の種類

基本機能は、アイテム機能とユーザー機能の2つのカテゴリに分類されます。

アイテム機能:

  • フィールド機能: 処理する機能フィールドを選択します。デフォルトでは、アプリケーションのすべてのフィールドがサポートされています。次に、各機能フィールドの処理方法を選択します。たとえば、テキスト型の機能フィールドの場合は、トークン化またはベクトル化を選択できます。数値型の機能フィールドの場合は、元の値のマッピングを選択します。必要な機能フィールドがアプリケーションにない場合は、MaxCompute外部テーブルを使用して追加できます。

  • 統計機能: システムは、アプリケーションの検索ログと収集された行動データに基づいて、過去7日間のインプレッション数、クリック数、クリックスルー率(CTR)などの統計情報を収集します。

ユーザー機能:

  • ユーザープロファイル機能: MaxCompute外部テーブルを使用して、モデル学習用のユーザープロファイル機能をインポートできます。ユーザーの行動が予測されると、クエリフィールドを使用してパラメーターが渡されます。このタイプの機能は、OpenSearchではサポートされていません。

  • クエリ機能: クエリリクエストでraw_queryを指定することで、クエリ機能を渡すことができます。このタイプの機能は、クエリトークンやベクトル化など、クエリ関連の情報を決定します。

アイテム機能の処理方法:

  • 元の値のマッピング

  • トークン化

  • トークン化後のルックアップ機能の生成

  • トークン化後の用語数のカウント

例:

たとえば、処理されるフィールドの内容が「白いTシャツ」であるとします。次のリストは、各処理方法の結果を示しています。

元の値のマッピング: 「白いTシャツ」。

トークン化: 「白い^]Tシャツ」。クエリトークンは^]で区切られます。

トークン化後のルックアップ機能の生成: 「白い:白い^]Tシャツ:Tシャツ」。

トークン化後の用語数のカウント: 2。

組み込みアイテム機能

フィールド名(機能名)

フィールドタイプ

説明

system_item_id

STRING

アイテムのID。アイテムの一意の識別子です。

system_all_nid_ctr_30

BIGINT

過去30日間のアイテムのCRT。この機能は離散化されています。

system_all_nid_ctr_7

BIGINT

過去7日間のアイテムのCRT。この機能は離散化されています。

system_all_nid_ctr_1

BIGINT

過去1日間のアイテムのCRT。この機能は離散化されています。

system_all_nid_pv_30

BIGINT

過去30日間のアイテムのインプレッション数。この機能は離散化されています。

system_all_nid_pv_7

BIGINT

過去7日間のアイテムのインプレッション数。この機能は離散化されています。

system_all_nid_pv_1

BIGINT

過去1日間のアイテムのインプレッション数。この機能は離散化されています。

system_all_nid_ipv_30

BIGINT

過去30日間のアイテムのクリック数。この機能は離散化されています。

system_all_nid_ipv_7

BIGINT

過去7日間のアイテムのクリック数。この機能は離散化されています。

system_all_nid_ipv_1

BIGINT

過去1日間のアイテムのクリック数。この機能は離散化されています。

system_query_score_decay

STRING

アイテムに関連する上位N件のクエリのクリック率。上位N件のクエリのNのデフォルト値は20です。

例: 'query1:score1^]query2:score2'

system_qterm_score_decay

STRING

アイテムに関連する上位N件のクエリ用語のクリック率。上位N件のクエリ用語のNのデフォルト値は300です。

例: 'term1:score1^]term2:score2'

system_query_ctr_decay

STRING

アイテムに関連する上位N件のクエリのCTR。

例: 'query1:ctr1^]query2:ctr2'

system_qterm_ctr_decay

STRING

アイテムに関連する上位N件のクエリ用語のCTR。

例: 'term1:ctr1^]term2:ctr2'

system_query_match_decay

STRING

アイテムに関連する上位N件のクエリでの検索クエリとその一致。

例: 'query1:query1^]query2:query2'

system_qterm_match_decay

STRING

アイテムに関連する上位N件のクエリ用語での検索クエリ用語とその一致。

例: 'term1:term1^]term2:term2'

system_query_seq_decay

STRING

アイテムに関連する上位N件のクエリ。これは複数値の機能です。

例: 'query1^]query2'

system_qterm_seq_decay

STRING

アイテムに関連する上位N件のクエリ用語。これは複数値の機能です。

例: 'term1^]term2'

system_query_cnt

BIGINT

system_query_seq_decay機能の値の数。

system_qterm_cnt

BIGINT

system_qterm_seq_decay機能の値の数。

dt

STRING

日ごとの時間パーティション。例: 20230316。

組み込みユーザー機能

次の表は、組み込みユーザー機能について説明しています。

機能名

タイプ

説明

system_exp_time

STRING

行動が実行された日付。値は曜日です。例: 月曜日、火曜日。

system_terms2

STRING

リストの最初の15個のクエリトークン。

system_user_id

STRING

ユーザーID。

system_raw_q_ultra

STRING

トークン化前の元のクエリ。

system_term_seq

STRING

クエリのシーケンス機能。

system_term_seq_length

DOUBLE

クエリのシーケンス機能の長さ。