このトピックでは、包括的なライブ配信レコメンドシステムの構築に役立つ、ライブ配信レコメンド関連のフィールドについて説明します。ユーザーとコンテンツの特徴、およびライブ配信コンテンツに対するユーザーの行動を分析することにより、ライブ配信レコメンドシステムはパーソナライズされた提案を提供できます。
次の表は、ライブ配信レコメンドシナリオにおけるユーザー、アイテム、および行動テーブルの推奨フィールドを示しています。より多くのフィールドを設定することで、より良いレコメンド結果が得られます。次の表に記載されていないフィールドを追加して、結果をさらに向上させることもできます。フィールド名は、次の表に記載されているものと同じである必要はありません。
ユーザーテーブル
フィールド | タイプ | 必須 | 説明 |
user_id | 整数または文字列 | はい | ユーザーの ID。ユーザーの一意の識別子です。 |
age | 整数 | いいえ | ユーザーの年齢。セグメント化できます。 ユーザーの年齢は、0~12歳、12~18歳、18~24歳、25~34歳などのセグメントに分類でき、離散化によって数値的特徴からカテゴリ的特徴に変換できます。 |
gender | 文字列 | いいえ | ユーザーの性別。 たとえば、男性、女性、その他の性別をカテゴリ的特徴として使用できます。 |
occupation | 文字列 | いいえ | ユーザーの職業。カテゴリ的特徴として使用できます。 |
education | 文字列 | いいえ | ユーザーの学歴。 たとえば、高校、大学、大学院をカテゴリ的特徴として使用できます。 |
income | 整数または文字列 | いいえ | ユーザーの所得水準。 たとえば、低所得、中所得、高所得をカテゴリ的特徴として使用できます。 |
user_level | 整数または文字列 | いいえ | プラットフォームでのユーザーのレベルまたはメンバーシップレベル。 |
register_time | タイムスタンプ | いいえ | ユーザーがアカウントを登録した日時。単位:秒。 年、月、日でセグメント化すると、数値的特徴として使用できます。離散化後にカテゴリ的特徴に変換できます。 |
country | 文字列 | いいえ | ユーザーが所在する国。カテゴリ的特徴として使用できます。 |
province | 文字列 | いいえ | ユーザーが所在する都道府県。カテゴリ的特徴として使用できます。 |
city | 文字列 | いいえ | ユーザーが所在する市町村。カテゴリ的特徴として使用できます。 |
active_time | 整数または文字列 | いいえ | ユーザーがプラットフォームでアクティブになっている期間。 たとえば、午前、午後、夕方などの時間帯をカテゴリ的特徴として使用できます。 |
device_type | 文字列 | いいえ | ユーザーが使用するデバイスのタイプ。 たとえば、PC、携帯電話、タブレットなどのデバイスをカテゴリ的特徴として使用できます。 |
os | 文字列 | いいえ | ユーザーデバイスのオペレーティング システム。カテゴリ的特徴として使用できます。 |
browser | 文字列 | いいえ | ユーザーが使用するブラウザのタイプ。カテゴリ的特徴として使用できます。 |
language | 文字列 | いいえ | ユーザーが好む言語。カテゴリ的特徴として使用できます。 |
interests | 文字列 | いいえ | ユーザーの興味。タグ特徴として使用できます。 |
アイテムテーブル
フィールド | タイプ | 必須 | 説明 |
anchor_id | 整数または文字列 | はい | アイテムの ID。ストリーマーの一意の識別子です。 |
name | 文字列 | いいえ | ストリーマーの名前。 |
nickname | 文字列 | いいえ | ストリーマーのニックネーム。通常はライブ配信ページに表示されます。 |
anchor_gender | 文字列または数値 | いいえ | ユーザーの性別。 たとえば、男性、女性、その他の性別をカテゴリ的特徴として使用できます。 |
language | 文字列 | いいえ | ライブ配信中にストリーマーが使用する言語。 言語は、中国語、英語、日本語、またはその他の言語です。 |
level | 整数 | いいえ | プラットフォームでのストリーマーのレベル。 |
category | 文字列 | いいえ | ストリーマーが属するメインカテゴリ。 たとえば、タレントショー、ゲーム解説などのカテゴリをカテゴリ的特徴として使用できます。 |
leaf_category | 文字列 | いいえ | ストリーマーが属するサブカテゴリ。カテゴリ的特徴として使用できます。 |
rating | 浮動小数点数 | いいえ | ストリーマーの全体的な評価スコア。肯定的なコメント、ニュートラルなコメント、否定的なコメントに変換できます。コメントはカテゴリ的特徴として使用されます。 |
status | 数値 | いいえ | ストリーマーのステータス。たとえば、ストリーマーがライブ配信中かどうか。 |
review_count | 整数 | いいえ | ストリーマーへのコメントの総数。 |
video_type | 文字列 | いいえ | ライブ配信の具体的な形式。 たとえば、ライブ ブロードキャストまたは録画再生。 |
duration | 整数 | いいえ | 1 回のライブ配信の継続時間。 |
release_date | 日付 | いいえ | ライブ配信が開始される正確な日付。 |
director | 文字列 | いいえ | 事前に録画された番組のディレクター名。ない場合は、このフィールドを空のままにします。 |
actors | 文字列 | いいえ | ライブ配信ゲストのリスト。 |
subtitles | ブール値 | いいえ | 字幕サービスが提供されているかどうかを指定します。 |
region | 文字列 | いいえ | ストリーマーが所在するリージョン。 |
tags | 文字列 | いいえ | ライブ配信トピックに関連するキーワードのリスト。 |
follow_count | 整数 | いいえ | ストリーマーのフォロワー数。 |
行動テーブル
フィールド | タイプ | 必須 | 説明 |
request_id | 文字列 | いいえ | リクエストの ID。毎回のレコメンドの一意の識別子です。 request_id フィールドがないと、サンプルの精度とリアルタイム機能の追加に影響します。新しいレコメンド シナリオでは、request_id フィールドは必要ありません。ただし、レコメンド シナリオを作成した後は、request_id フィールドを追加し、モデル トレーニングの前にトレーニング サンプルのコードを変更する必要があります。 |
user_id | 整数または文字列 | はい | 特定の行動を実行するユーザーの ID。 |
item_id | 整数または文字列 | はい | アイテムの ID。ユーザーインタラクションの影響を受けます。 |
event | 文字列 | はい | ビデオコンテンツに対するユーザーの行動。 たとえば、露出、クリック、いいね、ギフト、コメント。 |
event_value | 浮動小数点数 | はい |
|
event_time | タイムスタンプ | いいえ | 行動が発生した日時。秒単位の精度です。 |
ip | 文字列 | いいえ | ユーザーの IP アドレス。ユーザーが住んでいる市町村と都道府県を見つけるために使用できます。 |
rating | 浮動小数点数 | いいえ | ユーザーがストリーマーに与える星評価またはその他の形式のフィードバック。 |
scene | 文字列 | いいえ | アクセス ポータル。 たとえば、ホームページまたは検索ページ。 |
device_type | 文字列 | いいえ | インタラクション中にユーザーが使用するデバイス。 |
browser | 文字列 | いいえ | ユーザーがアクセスに使用するブラウザ。 |
mobile_brand | 文字列 | いいえ | ユーザーが使用するモバイル デバイスのブランド。 |
os | 文字列 | いいえ | ユーザーデバイスのオペレーティング システム。 |
weather | 文字列 | いいえ | IP 位置情報に基づいて取得されたリアルタイムの気象条件。 |
holiday | ブール値 | いいえ | ユーザーの行動が休暇中に発生したかどうかを指定します。 |
season | 文字列 | いいえ | 季節。 |
longitude | 浮動小数点数 | いいえ | ユーザーの場所の経度。 |
latitude | 浮動小数点数 | いいえ | ユーザーの場所の緯度。 |