すべてのプロダクト
Search
ドキュメントセンター

Artificial Intelligence Recommendation:データの準備

最終更新日:Jun 13, 2025

PAI-Rec を使用してレコメンデーションシステムを構築する前に、モデルのトレーニングとキャリブレーションのために、基本データを準備し、ユーザーの特徴を分析する必要があります。このトピックでは、典型的なシナリオのデータ仕様について説明します。

背景情報

機能データには、一般的に次の基本テーブルが含まれます。

  • ユーザーテーブル:

    ユーザーに関連する機能データが含まれています。このテーブルは、ユーザーの個人情報、好み、行動習慣を記述するために使用されます。

    ユーザーテーブル内のユーザー ID は一意です。ユーザーテーブルと行動テーブルは、一意の ID を使用して関連付けることができます。ユーザーテーブルには、年齢、性別、都市、ポイント、登録時間、ユーザタグなどの基本的なユーザー情報が含まれている必要があります。各パーティションは 1 日を表し、すべてのユーザー情報を記録します。

  • アイテムテーブル:

    おすすめのアイテムに関する情報が含まれています。このテーブルは、アイテムのプロパティと特性を記述するために使用されます。

    アイテムテーブル内のアイテム ID は一意です。アイテムテーブルと行動テーブルは、一意の ID を使用して関連付けることができます。アイテムテーブルには、レベル 1 カテゴリ、レベル 2 カテゴリ、価格、タイトル、色、仕様、掲載時間、作成者 ID、フォロワー数などの基本的なアイテム情報が含まれている必要があります。各パーティションは 1 日を表し、すべてのアイテム情報を記録します。

  • 行動テーブル:

    ユーザーとアイテム間の行動が含まれており、ユーザーがアイテムに対してどのような行動をいつ行ったかを詳述しています。

前提条件

MaxCompute プロジェクトを作成しDataWorks ワークスペースに関連付けました。

手順

すぐに使い始められるように、PAI-Rec は MaxCompute の pai_online_project プロジェクトに 3 つのテーブルを用意しています。使用するためにデータを自分のプロジェクトに複製できます。

  1. DataWorks コンソール にログインします。左側のナビゲーションウィンドウで、[データ開発 & O&M] > [データ開発] を選択します。

  2. [データ開発] ページで、作成した DataWorks ワークスペースを選択し、[データ開発に移動] をクリックします。

  3. 表示されたページで、ポインタを [作成] に移動し、[ノードの作成] > [MaxCompute] > [ODPS SQL] を選択します。表示されたダイアログボックスで、ノードパラメータを設定し、[確認] をクリックします。

  4. 作成したノードのタブで、次の SQL 文を実行して、ユーザーテーブル、アイテムテーブル、ラベルテーブルを pai_online_project プロジェクトから MaxCompute プロジェクトに同期します。

    -- ユーザーテーブル
    CREATE TABLE IF NOT EXISTS rec_sln_demo_user_table(
      user_id BIGINT COMMENT 'ユーザーの一意のID',
      gender STRING COMMENT '性別',
      age BIGINT COMMENT '年齢',
      city STRING COMMENT '都市',
      item_cnt BIGINT COMMENT '作成されたコンテンツアイテムの数',
      follow_cnt BIGINT COMMENT 'フォローの累積数',
      follower_cnt BIGINT COMMENT 'フォロワーの累積数',
      register_time BIGINT COMMENT '登録時間',
      tags STRING COMMENT 'ユーザタグ'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    INSERT OVERWRITE TABLE rec_sln_demo_user_table PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_user_table
    WHERE ds > "20221231" and ds < "20230217";
    -- アイテムテーブル
    CREATE TABLE IF NOT EXISTS rec_sln_demo_item_table(
      item_id BIGINT COMMENT 'コンテンツID',
      duration DOUBLE COMMENT '動画の長さ',
      title STRING COMMENT 'タイトル',
      category STRING COMMENT 'レベル 1 タグ',
      author BIGINT COMMENT '作成者',
      click_count BIGINT COMMENT 'クリックの累積数',
      praise_count BIGINT COMMENT 'いいねの累積数',
      pub_time BIGINT COMMENT '公開時間'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    INSERT OVERWRITE TABLE rec_sln_demo_item_table PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_item_table
    WHERE ds > "20221231" and ds < "20230217";
    -- 行動テーブル
    CREATE TABLE IF NOT EXISTS rec_sln_demo_behavior_table(
      request_id STRING COMMENT 'リクエスト追跡ID/リクエストID',
      user_id STRING COMMENT 'ユーザーの一意のID',
      exp_id STRING COMMENT '実験ID',
      page STRING COMMENT 'ページ',
      net_type STRING COMMENT 'ネットワークタイプ',
      event_time BIGINT COMMENT '行動時間',
      item_id STRING COMMENT 'コンテンツID',
      event STRING COMMENT '行動タイプ',
      playtime DOUBLE COMMENT '再生時間/読書時間'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    INSERT OVERWRITE TABLE rec_sln_demo_behavior_table PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_behavior_table
    WHERE ds > "20221231" and ds < "20230217";

また、付録: 一般的なシナリオのデータ仕様 を参照して、独自のユーザーテーブル、アイテムテーブル、行動テーブルを準備することもできます。

付録: 一般的なシナリオのデータ仕様

E コマースレコメンデーションシナリオ

次の表に、E コマースシナリオにおける ユーザーテーブルアイテムテーブル行動テーブル の推奨フィールドを示します。網羅されていない他の機能フィールドがある場合は、自分で追加できます。フィールドがより完全で豊富であるほど、レコメンデーションの効果は向上します。フィールド名は、テーブルのフィールド名と完全に一致する必要はありません。

ユーザーテーブル

ユーザーテーブルには、システムに登録されているすべてのユーザーの情報を含めることをお勧めします。毎日パーティションを作成し、すべてのユーザーの毎日のデータをパーティションに同期することをお勧めします。

フィールド

必須

説明

user_id

ログインユーザーに必須

ユーザー ID。

user_id_type

オプション

ユーザー登録タイプ。アプリ登録アカウント、電話番号、WeChat アカウントなどが含まれます。

device_id

オプション

デバイス ID。

gender

オプション

性別。

age/birthday

オプション

年齢または生年月日。

purchasing

オプション

購買力。既存データに基づく統計分析またはモデリングによって取得されます。

country

オプション

国。

province

オプション

県。

city

オプション

市。

register_time

オプション

登録タイムスタンプ。

単位: 秒。例: 1520017038。

education

オプション

ユーザーの学歴。

career

オプション

ユーザーの職業。

last_login_time

オプション

最終ログインタイムスタンプ。

単位: 秒。例: 1520017038。

source

オプション

ユーザーのソース。Toutiao、WeChat など。

content

オプション

ユーザーの説明。

tags

オプション

ユーザタグの説明。サッカー、フィットネス、アウトドアアクティビティなど。

アイテムテーブル

アイテムテーブルには、システム内のすべてのアイテムの情報を含めることをお勧めします。毎日パーティションを作成し、すべてのアイテムの毎日のデータをパーティションに同期することをお勧めします。

フィールド

必須

説明

item_id

はい

アイテムの一意の ID。

item_type

オプション

アイテムのタイプ。

source_id

オプション

アイテムのソース。ガイド付き E コマースの場合は、アイテムのソースプラットフォームを入力します。

例: Taobao、Tmall、JD.com。

title

オプション。このパラメータを指定することをお勧めします。

アイテムのタイトル。このフィールドは、詳細な意味分析に使用されます。このフィールドを空のままにすると、レコメンデーションアルゴリズムが期待どおりに機能しない場合があります。

sub_title

オプション

アイテムのサブタイトル。

pub_time

必須

アイテムが公開されたタイムスタンプ。

単位: 秒。

expire_time

オプション

コンテンツの有効期限が切れるタイムスタンプ。

単位: 秒。

category_level

オプション。このパラメータを指定することをお勧めします。

カテゴリレベルの数。

cate_id_path

オプション。このパラメータを指定することをお勧めします。

ID で構成される完全なカテゴリパス。カテゴリパスには複数のカテゴリを含めることができます。カテゴリはアンダースコア (_) で区切る必要があります。

cate_name_path

オプション。このパラメータを指定することをお勧めします。

名前で構成される完全なカテゴリパス。カテゴリパスには複数のカテゴリを含めることができます。カテゴリはアンダースコア (_) で区切る必要があります。

cate1_id

オプション。このパラメータを指定することをお勧めします。

レベル 1 カテゴリの ID。カテゴリ階層ツリーは、相互排他的、集合的網羅的 (MECE) 原則に従う必要があります。ツリー内のすべてのカテゴリは、意味的に重複しません。

cate2_id

オプション。このパラメータを指定することをお勧めします。

レベル 2 カテゴリの ID。カテゴリ階層ツリーは、MECE 原則に従う必要があります。ツリー内のすべてのカテゴリは、意味的に重複しません。

cate_id

オプション。このパラメータを指定することをお勧めします。

カテゴリ階層ツリーの最終レベルのリーフカテゴリの ID。

cate1_name

オプション。このパラメータを指定することをお勧めします。

レベル 1 カテゴリの名前。

cate2_name

オプション。このパラメータを指定することをお勧めします。

レベル 2 カテゴリの名前。

cate_name

オプション。このパラメータを指定することをお勧めします。

リーフカテゴリの名前。

brand_id

オプション。このパラメータを指定することをお勧めします。

ブランド ID。

shop_id

オプション

ストア ID。

description

オプション

アイテムの詳細。

price

必須

アイテムの実際の販売価格。

origin_price

オプション

アイテムの元の価格。

discount

オプション

割引 (price/origin_price)。

tags

オプション

ビジネス担当者がアイテムに添付したタグ。プロモーションアクティビティの ID など。

color

オプション

色のカテゴリ。

properties

オプション。このパラメータを指定することをお勧めします。

販売者が JSON 形式で指定したアイテムのプロパティ。

例: {"material": "cotton", "style": "commuting"}

送料

オプション

送料。送料無料の商品の値は 0 です。

image_url

オプション

商品画像の URL です。この URL を使用して、インターネット経由で商品画像をダウンロードできます。

video_url

オプション

アイテムビデオの URL です。この URL を使用して、インターネット経由でアイテムビデオをダウンロードできます。

shop_dsr

オプション

販売者の詳細な評価。

spu_id

オプションです。このパラメーターを指定することをお勧めします。

標準製品ユニットの ID です。

sku_id

オプション

Stock Keeping Unit の ID です。

prov

オプション

アイテムが置かれている都道府県。

オプション

アイテムが置かれている市。

レート

オプション

肯定的なフィードバック評価です。

行動テーブル

行動テーブルには、アプリの行動データ、または直近期間における特定のシナリオでの行動データが含まれています。直近期間は少なくとも 30 ~ 60 日にすることをお勧めします。

ユーザー行動を包括的に把握するために、サイト全体でユーザー行動をレポートすることをお勧めします。これには、レコメンデーション シナリオ (home_feed) からのデータ収集だけでなく、人気シナリオ (hot_items) や検索シナリオ (search) からのインプレッション、クリック、その他の行動に関する情報の収集も含まれます。検索シナリオでは、検索語が記録されます。

フィールド

必須

説明

user_id

ログイン ユーザーに必須

ユーザーの ID。

device_id

オプション

ユーザーのデバイス ID。

item_id

必須

アイテム ID

item_type

オプション

アイテムのタイプ。

event

必須

行動タイプ。インプレッション、滞在、クリック、評価など。

event_time

必須

行動のタイムスタンプ。

単位:秒。

event_value

オプション

行動値。滞在時間、購入されたアイテム数、購入金額など。

request_id

オプション。このパラメーターを指定することをお勧めします。

リクエストの ID。各レコメンデーション リクエストの一意の識別子です。

このフィールドを空のままにすると、サンプルの精度に影響し、リアルタイム機能を追加できません。このフィールドは、レコメンデーション ソリューションの作成時にはオプションです。レコメンデーション ソリューションの作成後、このフィールドを設定し、トレーニング サンプル コードを変更し、トレーニング サンプルを再度準備してから、モデル トレーニングを実行する必要があります。

exp_id

オプション。このパラメーターを指定することをお勧めします。

実験バケットの ID。PAI-Rec レコメンデーション インターフェイスによって返される実験 ID。結果が PAI-Rec によって推奨されない場合は、このパラメーターをデフォルトまたはその他の値に設定します。

request_info

オプション

リクエスト追跡情報。この情報は、Recommend API 操作が呼び出されたときに返されます。情報をログに記録するだけで済みます。

scene

必須

シナリオの ID。

たとえば、home_feed はホームフィードを示します。 hot_items は人気シナリオを示し、レコメンデーション シナリオだけでなく必須です。 search は検索シナリオを示します。このフィールドを search に設定する場合は、query フィールドを設定する必要があります。

query

オプション

検索語。

page

オプション

ページ ID。

source_page

オプション

異なるソースに基づいて効果を収集するために使用される前のページ。

position

オプション

アイテムの位置。レコメンデーション リストでの位置です。

app_version

オプション

アプリのバージョン。

net_type

オプション

ネットワークタイプ。

例:3G、4G、5G、Wi-Fi。

ip

オプション

国や都市などの特徴を抽出するために使用されるクライアント IP 情報。

login

オプション

ユーザーがログインしているかどうかを指定します。

device_platform

オプション

クライアント プラットフォーム。

例:iOS、Android、H5、Msite。

device_system

オプション

デバイスのオペレーティング システム。

例:iOS、Android、PC。

device_model

オプション

デバイス モデル。

device_brand

オプション

デバイスのブランドまたは製造元。

longitude

オプション

場所の経度。

latitude

オプション

場所の緯度。

country

オプション

国。

province

オプション

県。

city

オプション。このパラメーターを指定することをお勧めします。

市。

行動タイプ テーブル

次の表は、E コマース レコメンデーション シナリオにおけるいくつかの一般的な行動タイプについて説明しています。

イベント

イベント値

説明

expose

このフィールドは空のままにします。

アイテムを公開する行動。

click

このフィールドは空のままにします。

アイテムをクリックする行動。

like

このフィールドは空のままにします。

アイテムに「いいね」をする行動。

unlike

このフィールドは空のままにします。

アイテムに「いいね」を取り消す行動。

comment

コメントの内容。

アイテムにコメントする行動。

レビュー内容は、ユーザーのショッピング体験やアイテムの品質をマイニングするために使用できます。

collect

このフィールドは空のままにします。

アイテムをお気に入りに追加する行動。

stay

期間。

アイテムに滞在する行動。

単位は限定されません。すべてのデータ エントリで単位が同じであることに注意してください。

cart

アイテム数、単価。アイテム数は価格とコンマ (,) で区切ります。

例:1,10000

アイテムをショッピング カートに追加する行動。

単価:USD、セント単位まで正確。

buy

アイテム数、単価。アイテム数は価格とコンマ (,) で区切ります。

例:1,10000

アイテムを購入する行動。

単価:USD、セント単位まで正確。1 つの購入行動エントリは、item_id フィールドで指定された 1 つのアイテム ID のみに対応します。注文に複数のアイテム ID が含まれている場合は、分割する必要があります。

evaluate

昇順または降順の離散整数。

アイテムを評価する行動。

たとえば、星評価が使用されている場合は、肯定的なレビューには昇順で 1 ~ 5 の整数を使用できます。昇順が肯定的なレビューの傾向と正の相関関係にあることを確認する必要があります。

dislike

アイテムに否定的なフィードバックを提供する行動。

コンテンツ推薦シナリオ

次の表に、コンテンツ推奨シナリオにおける user tableitem table、および behavior table の推奨フィールドを示します。網羅されていない他の特徴フィールドがある場合は、自分で追加できます。フィールドが完全でリッチであるほど、推奨効果は向上します。フィールド名は、表内のフィールド名と完全に一致する必要はありません。

ユーザーテーブル

ユーザーテーブルには、システムに登録されているすべてのユーザーに関する情報を含めることをお勧めします。毎日パーティションを作成し、すべてのユーザーの毎日のデータをパーティションに同期することをお勧めします。

フィールド

必須

説明

user_id

ログイン ユーザーに必須

ユーザーの ID。

device_id

オプション

デバイス ID。

register_time

オプション。このパラメーターを指定することをお勧めします。

登録時間。

単位:秒。例:1520017038。

gender

オプション

性別。

age

オプション

年齢。

country

オプション

国。

province

オプション

都道府県。

city

オプション

市区町村。

ip

オプション

最後のログインの IP アドレス。

education

オプション

ユーザーの学歴。

career

オプション

ユーザーの職業。

item_cnt

オプション

アカウント登録時からユーザーが作成したコンテンツの数。

favorite_cnt

オプション

お気に入りの数。

follow_cnt

オプション

ユーザーがフォローしているユーザーの数。

follower_cnt

オプション

フォロワーの数。

last_login_time

オプション

最終ログイン時間。

tags

オプション

ユーザーのタグ。

例:サッカー、フィットネス、アウトドア アクティビティ。

アイテムテーブル

アイテムテーブルには、システム内のすべてのコンテンツに関する情報を含めることをお勧めします。毎日パーティションを作成し、すべてのコンテンツのデータを毎日パーティションに同期することをお勧めします。

フィールド

必須

説明

item_id

必須

コンテンツ ID

item_type

複数コンテンツタイプの場合必須

コンテンツタイプ(記事、動画など)

status

必須

アイテムを推奨できるかどうかを示します。

duration

オプション(動画の場合必須)

動画の長さ

pub_time

必須

アイテムが公開された時間

title

オプション。このパラメータを指定することをお勧めします。

タイトル

category

オプション。このパラメータを指定することをお勧めします。

レベル 1 タグ

tags

オプション

タグ。複数のタグを設定し、セミコロン(;)で区切ることができます。

author

オプション。このパラメータを指定することをお勧めします。

作成者

abstract

オプション

コンテンツの要約

content

オプション

コンテンツの本文

image_url

オプション

画像の特徴抽出に使用する画像 URL

video_url

オプション

動画の特徴抽出に使用する動画 URL

pv_count

オプション

コンテンツが表示された合計回数

click_count

オプション

コンテンツがクリックされた合計回数

praise_count

オプション

コンテンツがいいねされた合計回数

comment_count

オプション

コンテンツにコメントされた合計回数

collect_count

オプション

コンテンツがお気に入りに追加された合計回数

share_count

オプション

コンテンツが共有された合計回数

download_count

オプション

コンテンツがダウンロードされた合計回数

tip_count

オプション

コンテンツがチップされた合計回数

行動テーブル

行動テーブルには、アプリの行動データ、または直近期間における特定のシナリオでの行動データが含まれています。直近期間は少なくとも 30 ~ 60 日にすることをお勧めします。

フィールド

必須

説明

user_id

ログイン ユーザーに必須

ユーザーの一意の ID。

device_id

オプション

ユーザーのデバイス ID。

item_id

必須

コンテンツ ID。

item_type

複数のコンテンツ タイプに必須

コンテンツ タイプ(記事、動画など)。

request_id

オプション

リクエストの ID。各推奨事項の一意の識別子です。

このフィールドを空のままにすると、サンプルの精度に影響し、リアルタイム機能を追加できません。推奨ソリューションを作成するときは、このフィールドはオプションです。推奨ソリューションを作成した後は、このフィールドを設定し、トレーニング サンプル コードを変更し、トレーニング サンプルを再度準備してから、モデル トレーニングを実行する必要があります。

request_info

オプション。このパラメーターを指定することをお勧めします。

リクエスト追跡情報(取得 ID など)。

exp_id

必須

PAI-Rec 推奨インターフェイスによって返される実験 ID。結果が PAI-Rec によって推奨されない場合は、このパラメーターをデフォルトまたはその他の値に設定します。

scene

複数のシナリオに必須

シナリオ。

page

オプション(複数ページの場合に推奨)

ページ。

source_page

オプション(複数ページの場合に推奨)

前のページ。

position

オプション

コンテンツの位置。

event

必須

行動タイプ(表示、滞在、クリック、評価など)。

event_time

必須

行動が発生した時間。

playtime

オプション。このパラメーターを指定することをお勧めします。

再生時間または閲覧時間。

単位:秒。

comment

オプション

コメントの内容。

net_type

オプション

ネットワーク タイプ。

device_platform

オプション。このパラメーターを指定することをお勧めします。

クライアント プラットフォーム。

device_brand

オプション

クライアント ブランド。

device_model

オプション

クライアント モデル。

device_system

オプション

クライアント オペレーティング システム。

app_version

オプション

アプリのバージョン。

longitude

オプション

場所の経度。

latitude

オプション

場所の緯度。

country

オプション

国。

province

オプション

都道府県。

city

オプション。このパラメーターを指定することをお勧めします。

市区町村。

ip

オプション

最後のログインの IP アドレス。

動画のおすすめ

次の表は、動画レコメンデーション シナリオにおける useritem、および behavior テーブルの推奨フィールドについて説明しています。より多くのフィールドを設定すると、より良いレコメンデーション結果が得られます。また、次の表に記載されていない追加のフィールドを提供して、結果をさらに改善することもできます。フィールド名は、次の表のものと同じである必要はありません。

ユーザーテーブル

フィールド

必須

説明

user_id

必須

ユーザーの ID です。

age

オプション

ユーザーの年齢。セグメント化できます。

ユーザーの年齢は、0~12 歳、12~18 歳、18~24 歳、25~34 歳などのセグメントに分類でき、離散化によって数値的特徴からカテゴリ的特徴に変換できます。

gender

オプション

ユーザーの性別。

たとえば、男性、女性、その他の性別をカテゴリ的特徴として使用できます。また、整数 0、1、2 を使用してユーザーの性別を示すこともできます。

occupation

オプション

ユーザーの職業。

たとえば、学生、教師、エンジニア、その他の職業をカテゴリ的特徴として使用できます。

education

オプション

ユーザーの学歴。

たとえば、高校、大学、修士課程をカテゴリ的特徴として使用できます。

income

オプション

ユーザーの収入レベル。

たとえば、低、中、高収入レベルをカテゴリ的特徴として使用できます。

user_level

オプション

プラットフォームでのユーザーのレベルまたはメンバーシップレベル。

register_time

オプション

ユーザーがアカウントを登録した時間。単位:秒。 年、月、日でセグメント化した後、数値的特徴として使用できます。 離散化後、カテゴリ的特徴に変換できます。

country

オプション

ユーザーが所在する国。カテゴリ的特徴として使用できます。

province

オプション

ユーザーが所在する都道府県。カテゴリ的特徴として使用できます。

city

オプション

ユーザーが所在する市。カテゴリ的特徴として使用できます。

active_time

オプション

ユーザーがプラットフォームでアクティブな期間。

たとえば、午前、午後、夕方などの期間をカテゴリ的特徴として使用できます。

device_type

オプション

ユーザーが使用するデバイスの種類。

たとえば、PC、携帯電話、タブレットなどのデバイスをカテゴリ的特徴として使用できます。

os

オプション

ユーザー デバイスのオペレーティング システム。

たとえば、iOS、Android、Windows などのオペレーティング システムをカテゴリ的特徴として使用できます。

browser

オプション

ユーザーが使用するブラウザの種類。

たとえば、Google Chrome、Firefox、Safari などのブラウザをカテゴリ的特徴として使用できます。

language

オプション

ユーザーが好む言語。

たとえば、英語、中国語、スペイン語などの言語をカテゴリ的特徴として使用できます。

interests

オプション

ユーザーの興味。

たとえば、スポーツ、音楽、旅行などの興味をタグ機能として使用できます。

アイテムテーブル

フィールド

必須

説明

item_id

必須

アイテムの ID 。これは動画の一意の識別子です。

category

オプション

動画が属するメインカテゴリ。カテゴリ特徴として使用できます。

leaf_category

オプション

動画が属するサブカテゴリ。カテゴリ特徴として使用できます。

brand

オプション

動画のブランドまたはプロデューサー。カテゴリ特徴として使用できます。

video_type

オプション

動画の種類。

たとえば、映画、テレビシリーズ、ドキュメンタリー、短編映画、その他の種類をカテゴリ特徴として使用できます。

duration

オプション

動画の長さ。動画の長さは、10 分未満、10 ~ 30 分、30 分以上のようにカテゴリに分割できます。これらのカテゴリは、カテゴリ特徴として使用できます。

title

オプション

動画のタイトル。

series_name

オプション

動画のシリーズタイトル。

例:西遊記

series_total_number

オプション

ビデオシリーズのエピソードの総数。

series_number

オプション

ビデオシリーズの現在のエピソード番号。

たとえば、1 は最初のエピソードを示します。

release_date

オプション

動画の公開日。公開日は数値特徴として使用できます。

単位:秒

director

オプション

動画の監督。

actors

オプション

動画の主な俳優。カンマ (,) で区切られます。複数の値をタグ特徴として使用できます。

rating

オプション

動画の評価。

たとえば、IMDb、Douban、その他の評価を数値特徴として使用できます。

language

オプション

動画の元の言語。

たとえば、英語、中国語、日本語、その他の言語をカテゴリ特徴として使用できます。

has_subtitle

オプション

字幕サービスが提供されているかどうかを指定します。

region

オプション

動画が制作された地域。

たとえば、ハリウッド、ボリウッド、中国本土、その他の地域をカテゴリ特徴として使用できます。

tags

オプション

動画のタグ。コメディ、アクション、ラブなどのタグ。複数の値をタグ特徴として使用できます。

動作テーブル

すべてのタイプのユーザー動作を取得するには、レコメンデーション、人気商品、検索シナリオなどのフルスタックから、露出やクリックなどのユーザー動作を収集することをお勧めします。検索シナリオでは、検索クエリが記録されます。

レコメンデーション以外のシナリオでのユーザーのクリックや閲覧の動作も、ユーザーのプリファレンスに関するインサイトのソースとして役立ちます。

フィールド

必須

説明

request_id

オプション

リクエストの ID。各レコメンデーションリクエストの一意の ID です。 request_id フィールドがない場合、サンプルの精度とリアルタイム機能の追加に影響します。新しいレコメンデーションシナリオでは、request_id フィールドは必要ありません。ただし、レコメンデーションシナリオを作成した後、モデルのトレーニングの前に request_id フィールドを追加し、トレーニングサンプルのコードを変更する必要があります。

user_id

必須

ユーザーの ID。ユーザーの一意の識別子です。

item_id

必須

アイテムの ID。動画の一意の識別子です。

event

必須

ユーザーが動画に対して実行する動作です。

たとえば、露出、クリック、いいねなどの動作をカテゴリ特徴として使用できます。

event_value

必須

event フィールドを watch に設定した場合、このフィールドは視聴時間を秒単位で示します。

timestamp

必須

ユーザーが動作を実行した時間です。単位:秒。時間は、時間、曜日、または祝日でセグメント化し、カテゴリ特徴として使用できます。

scene

必須

シナリオ。

home_feed はホームページレコメンデーションを示します。 hot_items は人気商品を示します。このフィールドはすべてのシナリオで必須です。

search は、query フィールドを設定する必要がある検索シナリオを示します。

query

オプション

検索語句。

device_type

オプション

ユーザーが使用しているデバイスのタイプです。

たとえば、PC、携帯電話、タブレットなどのデバイスをカテゴリ特徴として使用できます。

browser

オプション

ユーザーが使用しているブラウザのタイプです。

たとえば、Google Chrome、Firefox、Safari などのブラウザをカテゴリ特徴として使用できます。

mobile_brand

オプション

ユーザーが使用している携帯電話のブランド。カテゴリ特徴として使用できます。

os

オプション

ユーザーデバイスのオペレーティングシステムです。

たとえば、iOS、Android、Windows などのオペレーティングシステムをカテゴリ特徴として使用できます。

ip

オプション

ユーザーの IP アドレス。ユーザーの県と市を特定するために使用でき、カテゴリ特徴として使用できます。

rating

オプション

動画のユーザー平均評価です。

たとえば、動画のスコアは 10 点満点で 8.5 点です。

weather

オプション

ユーザーが住んでいる地域の気象条件です。

たとえば、晴れ、雨、雪などの気象条件をカテゴリ特徴として使用できます。

holiday

オプション

ユーザーの動作が祝日に行われたかどうかを指定します。

たとえば、春節、国慶節などの祝日をカテゴリ特徴として使用できます。

season

オプション

季節。

たとえば、春、夏、秋、冬をカテゴリ特徴として使用できます。

longitude

オプション

ユーザーの場所の経度。数値特徴として使用でき、離散化後にカテゴリ特徴として使用できます。

latitude

オプション

ユーザーの場所の緯度。数値特徴として使用でき、離散化後にカテゴリ特徴として使用できます。

ライブストリーミングのおすすめ

次の表は、ライブストリーミングレコメンデーションシナリオにおけるユーザー、アイテム、および動作テーブルの推奨フィールドについて説明しています。より多くのフィールドを設定すると、より良いレコメンデーション結果が得られます。また、結果をさらに向上させるために、以下の表に記載されていないフィールドを追加することもできます。 フィールド名は、以下の表と同じである必要はありません。

ユーザーテーブル

フィールド

必須

説明

user_id

必須

ユーザー ID です。

age

任意

ユーザーの年齢。セグメント化できます。

ユーザーの年齢は、0~12歳、12~18歳、18~24歳、25~34歳などのセグメントに分類でき、離散化によって数値的特徴からカテゴリ的特徴に変換できます。

gender

任意

ユーザーの性別です。

たとえば、男性、女性、その他の性別をカテゴリ的特徴として使用できます。

occupation

任意

ユーザーの職業。カテゴリ的特徴として使用できます。

education

任意

ユーザーの学歴です。

たとえば、高校、大学、大学院をカテゴリ的特徴として使用できます。

income

任意

ユーザーの収入レベルです。

たとえば、低、中、高収入レベルをカテゴリ的特徴として使用できます。

user_level

任意

プラットフォームでのユーザーのレベルまたはメンバーシップレベルです。

register_time

任意

ユーザーがアカウントを登録した時間です。単位:秒。 年、月、日でセグメント化すると、数値的特徴として使用できます。 離散化後にカテゴリ的特徴に変換できます。

country

任意

ユーザーが所在する国。カテゴリ的特徴として使用できます。

province

任意

ユーザーが所在する都道府県。カテゴリ的特徴として使用できます。

city

任意

ユーザーが所在する市町村。カテゴリ的特徴として使用できます。

active_time

任意

ユーザーがプラットフォームでアクティブな期間です。

たとえば、午前、午後、夕方などの期間をカテゴリ的特徴として使用できます。

device_type

任意

ユーザーが使用するデバイスの種類です。

たとえば、PC、携帯電話、タブレットなどのデバイスをカテゴリ的特徴として使用できます。

os

任意

ユーザー デバイスのオペレーティング システム。カテゴリ的特徴として使用できます。

browser

任意

ユーザーが使用するブラウザの種類。カテゴリ的特徴として使用できます。

language

任意

ユーザーが好む言語。カテゴリ的特徴として使用できます。

interests

任意

ユーザーの興味。タグ機能として使用できます。

アイテムテーブル

フィールド

必須

フィールドの説明

anchor_id

必須

アイテムの ID。ストリーマーの一意の識別子です。

name

オプション

ストリーマーの名前。

nickname

オプション

ストリーマーのニックネーム。通常、ライブストリーミングページに表示されます。

anchor_gender

オプション

ユーザーの性別。

たとえば、男性、女性、その他の性別をカテゴリ特徴として使用できます。

language

オプション

ストリーマーがライブストリーミング中に使用する言語。

言語は、中国語、英語、日本語、またはその他の言語です。

level

オプション

プラットフォームでのストリーマーのレベル。

category

オプション

ストリーマーが属するメインカテゴリ。

たとえば、タレントショー、ゲーム解説、その他のカテゴリをカテゴリ特徴として使用できます。

leaf_category

オプション

ストリーマーが属するサブカテゴリ。カテゴリ特徴として使用できます。

rating

オプション

ストリーマーの全体的な評価スコア。肯定的なコメント、中立的なコメント、否定的なコメントに変換できます。コメントはカテゴリ特徴として使用されます。

status

オプション

ストリーマーのステータス。たとえば、ストリーマーがライブストリーミング中かどうか。

review_count

オプション

ストリーマーへのコメントの総数。

video_type

オプション

ライブストリーミングの具体的な形式。

たとえば、ライブブロードキャストまたは録画再生など。

duration

オプション

1 回のライブストリームの期間。

release_date

オプション

ライブストリーミングが開始される正確な日付。

director

オプション

録画済み番組のディレクター名。ない場合は、このフィールドを空のままにします。

actors

オプション

ライブストリーミングゲストのリスト。

subtitles

オプション

字幕サービスが提供されるかどうかを指定します。

region

オプション

ストリーマーが所在する地域。

tags

オプション

ライブストリーミングのトピックに関連するキーワードのリスト。

follow_count

オプション

ストリーマーのフォロワー数。

動作テーブル

フィールド

必須

フィールドの説明

request_id

オプション

リクエストの ID。これは、リクエストごとに推奨事項の一意の識別子です。 request_id フィールドがない場合、サンプルの精度とリアルタイム機能の追加に影響します。新しい推奨シナリオでは、request_id フィールドは必要ありません。ただし、推奨シナリオを作成した後、モデルのトレーニングの前に request_id フィールドを追加し、トレーニングサンプルのコードを変更する必要があります。

user_id

必須

特定の動作を実行するユーザーの ID。

item_id

必須

ユーザーインタラクションの影響を受けるアイテムの ID。

event

必須

動画コンテンツに対するユーザーの動作。たとえば、露出、クリック、いいね、ギフト、コメントなど。

event_value

必須

event フィールドの値が gift の場合、このフィールドはギフトの特定の金額を示します。

event フィールドの値が like の場合、このフィールドはいいねの数を示します。

event_time

オプション

動作が発生した時間(秒単位)。

ip

オプション

ユーザーの IP アドレス。ユーザーが住んでいる市町村を検索するために使用できます。

rating

オプション

ストリーマーに対するユーザーの星評価またはその他の形式のフィードバック。

scene

オプション

ホームページや検索ページなどのアクセス ポータル。

device_type

オプション

インタラクション中にユーザーが使用するデバイス。

browser

オプション

ユーザーがアクセスに使用するブラウザ。

mobile_brand

オプション

ユーザーが使用するモバイル デバイスのブランド。

os

オプション

ユーザー デバイスのオペレーティング システム。

weather

オプション

IP 位置情報に基づいて取得されるリアルタイムの気象条件。

holiday

オプション

ユーザーの動作が休暇中に発生するかどうかを指定します。

season

オプション

季節。

longitude

オプション

ユーザーの場所の経度。

latitude

オプション

ユーザーの場所の緯度。