このトピックでは、カスタムソートモデルで使用される基本的な組み込み機能について説明します。
基本機能の図

基本機能の種類
基本機能は、アイテム機能とユーザー機能の2つのカテゴリに分類されます。
アイテム機能:
フィールド機能: 処理する機能フィールドを選択します。デフォルトでは、アプリケーションのすべてのフィールドがサポートされています。次に、各機能フィールドの処理方法を選択します。たとえば、テキスト型の機能フィールドの場合は、トークン化またはベクトル化を選択できます。数値型の機能フィールドの場合は、元の値のマッピングを選択します。必要な機能フィールドがアプリケーションにない場合は、MaxCompute外部テーブルを使用して追加できます。
統計機能: システムは、アプリケーションの検索ログと収集された行動データに基づいて、過去7日間のインプレッション数、クリック数、クリックスルー率(CTR)などの統計情報を収集します。
ユーザー機能:
ユーザープロファイル機能: MaxCompute外部テーブルを使用して、モデル学習用のユーザープロファイル機能をインポートできます。ユーザーの行動が予測されると、クエリフィールドを使用してパラメーターが渡されます。このタイプの機能は、OpenSearchではサポートされていません。
クエリ機能: クエリリクエストでraw_queryを指定することで、クエリ機能を渡すことができます。このタイプの機能は、クエリトークンやベクトル化など、クエリ関連の情報を決定します。
アイテム機能の処理方法:
元の値のマッピング
トークン化
トークン化後のルックアップ機能の生成
トークン化後の用語数のカウント
例:
たとえば、処理されるフィールドの内容が「白いTシャツ」であるとします。次のリストは、各処理方法の結果を示しています。
元の値のマッピング: 「白いTシャツ」。
トークン化: 「白い^]Tシャツ」。クエリトークンは^]で区切られます。
トークン化後のルックアップ機能の生成: 「白い:白い^]Tシャツ:Tシャツ」。
トークン化後の用語数のカウント: 2。
組み込みアイテム機能
フィールド名(機能名) | フィールドタイプ | 説明 |
system_item_id | STRING | アイテムのID。アイテムの一意の識別子です。 |
system_all_nid_ctr_30 | BIGINT | 過去30日間のアイテムのCRT。この機能は離散化されています。 |
system_all_nid_ctr_7 | BIGINT | 過去7日間のアイテムのCRT。この機能は離散化されています。 |
system_all_nid_ctr_1 | BIGINT | 過去1日間のアイテムのCRT。この機能は離散化されています。 |
system_all_nid_pv_30 | BIGINT | 過去30日間のアイテムのインプレッション数。この機能は離散化されています。 |
system_all_nid_pv_7 | BIGINT | 過去7日間のアイテムのインプレッション数。この機能は離散化されています。 |
system_all_nid_pv_1 | BIGINT | 過去1日間のアイテムのインプレッション数。この機能は離散化されています。 |
system_all_nid_ipv_30 | BIGINT | 過去30日間のアイテムのクリック数。この機能は離散化されています。 |
system_all_nid_ipv_7 | BIGINT | 過去7日間のアイテムのクリック数。この機能は離散化されています。 |
system_all_nid_ipv_1 | BIGINT | 過去1日間のアイテムのクリック数。この機能は離散化されています。 |
system_query_score_decay | STRING | アイテムに関連する上位N件のクエリのクリック率。上位N件のクエリのNのデフォルト値は20です。 例: 'query1:score1^]query2:score2' |
system_qterm_score_decay | STRING | アイテムに関連する上位N件のクエリ用語のクリック率。上位N件のクエリ用語のNのデフォルト値は300です。 例: 'term1:score1^]term2:score2' |
system_query_ctr_decay | STRING | アイテムに関連する上位N件のクエリのCTR。 例: 'query1:ctr1^]query2:ctr2' |
system_qterm_ctr_decay | STRING | アイテムに関連する上位N件のクエリ用語のCTR。 例: 'term1:ctr1^]term2:ctr2' |
system_query_match_decay | STRING | アイテムに関連する上位N件のクエリでの検索クエリとその一致。 例: 'query1:query1^]query2:query2' |
system_qterm_match_decay | STRING | アイテムに関連する上位N件のクエリ用語での検索クエリ用語とその一致。 例: 'term1:term1^]term2:term2' |
system_query_seq_decay | STRING | アイテムに関連する上位N件のクエリ。これは複数値の機能です。 例: 'query1^]query2' |
system_qterm_seq_decay | STRING | アイテムに関連する上位N件のクエリ用語。これは複数値の機能です。 例: 'term1^]term2' |
system_query_cnt | BIGINT | system_query_seq_decay機能の値の数。 |
system_qterm_cnt | BIGINT | system_qterm_seq_decay機能の値の数。 |
dt | STRING | 日ごとの時間パーティション。例: 20230316。 |
組み込みユーザー機能
次の表は、組み込みユーザー機能について説明しています。
機能名 | タイプ | 説明 |
system_exp_time | STRING | 行動が実行された日付。値は曜日です。例: 月曜日、火曜日。 |
system_terms2 | STRING | リストの最初の15個のクエリトークン。 |
system_user_id | STRING | ユーザーID。 |
system_raw_q_ultra | STRING | トークン化前の元のクエリ。 |
system_term_seq | STRING | クエリのシーケンス機能。 |
system_term_seq_length | DOUBLE | クエリのシーケンス機能の長さ。 |