全部產品
Search
文件中心

Artificial Intelligence Recommendation:資料準備

更新時間:Jun 11, 2025

在使用PAI-Rec搭建推薦系統前,需要準備基礎資料,分析使用者特徵,用於模型訓練與校準。本文為您介紹部分典型情境的資料規範。

背景資訊

特徵資料一般包含以下三張基礎資料表:

  • 使用者表

    包含與使用者相關的特徵資料,用於描述使用者的個人資訊、偏好和行為習慣。

    使用者表中使用者ID不重複,使用者表和行為表可通過使用者唯一ID進行關聯,應包含使用者基礎屬性資訊,如年齡、性別、所屬城市、積分、註冊時間和使用者標籤等。每天一個分區,記錄所有使用者資訊。

  • 物品表

    包含推薦物品的詳細資料,用於描述物品的屬性和特性。

    商品表中商品ID不重複,物品表和行為表可通過商品唯一ID進行關聯,應包含商品基礎屬性資訊,如一級類目、二級類目、價格、標題、顏色、規格、上架時間、作者ID和粉絲數量等。每天一個分區,記錄所有的物品資訊。

  • 行為表

    包含使用者和物品之間的行為,例如使用者在什麼時間對什麼物品做了什麼行為。

前提條件

建立MaxCompute專案,並綁定至DataWorks工作空間

操作步驟

為了方便您快速上手體驗,PAI-Rec在MaxCompute的pai_online_project專案中預置了三張表,您可將資料複製至自己的專案中使用。

  1. 登入DataWorks控制台,在左側導覽列單擊資料開發與營運 > 資料開發

  2. 選擇已建立的DataWorks工作空間後,單擊進入資料開發

  3. 滑鼠移至上方至建立,選擇建立節點 > MaxCompute > ODPS SQL,在彈出的頁面中配置節點參數,然後單擊確認

  4. 在建立節點地區運行以下SQL命令,將使用者表、物料表、Label表從pai_online_project專案同步到自己的MaxCompute專案中。

    -- 使用者資訊表
    CREATE TABLE IF NOT EXISTS rec_sln_demo_user_table(
      user_id BIGINT COMMENT '使用者唯一ID',
      gender STRING COMMENT '性別',
      age BIGINT COMMENT '年齡',
      city STRING COMMENT '城市',
      item_cnt BIGINT COMMENT '創作內容數',
      follow_cnt BIGINT COMMENT '累計關注數',
      follower_cnt BIGINT COMMENT '累計粉絲數',
      register_time BIGINT COMMENT '註冊時間',
      tags STRING COMMENT '使用者標籤'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    INSERT OVERWRITE TABLE rec_sln_demo_user_table PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_user_table
    WHERE ds > "20221231" and ds < "20230217";
    -- 商品資訊表
    CREATE TABLE IF NOT EXISTS rec_sln_demo_item_table(
      item_id BIGINT COMMENT '內容ID',
      duration DOUBLE COMMENT '視頻時間長度',
      title STRING COMMENT '標題',
      category STRING COMMENT '一級標籤',
      author BIGINT COMMENT '作者',
      click_count BIGINT COMMENT '累計點擊數',
      praise_count BIGINT COMMENT '累計點贊數',
      pub_time BIGINT COMMENT '發布時間'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    INSERT OVERWRITE TABLE rec_sln_demo_item_table PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_item_table
    WHERE ds > "20221231" and ds < "20230217";
    -- 日誌行為表
    CREATE TABLE IF NOT EXISTS rec_sln_demo_behavior_table(
      request_id STRING COMMENT '埋點ID/請求ID',
      user_id STRING COMMENT '使用者唯一ID',
      exp_id STRING COMMENT '實驗ID',
      page STRING COMMENT '頁面',
      net_type STRING COMMENT '網路型號',
      event_time BIGINT COMMENT '行為時間',
      item_id STRING COMMENT '內容ID',
      event STRING COMMENT '行為類型',
      playtime DOUBLE COMMENT '播放時間長度/閱讀時間長度'
    ) PARTITIONED BY (ds STRING) STORED AS ALIORC;
    INSERT OVERWRITE TABLE rec_sln_demo_behavior_table PARTITION(ds)
    SELECT *
    FROM pai_online_project.rec_sln_demo_behavior_table
    WHERE ds > "20221231" and ds < "20230217";

您也可以參考附錄:常見情境的資料規範,自行準備使用者表、物品表和行為表。

附錄:常見情境的資料規範

電商推薦情境

下表列出了電商情境中使用者表物品表行為表的建議欄位。如果還有其他未涵蓋的特徵欄位,可自行追加,欄位越豐富完善,推薦效果越好。欄位名稱無需與表格中的完全一致。

使用者表

系統內全部註冊使用者表,建議每天一個分區,每個分區為當天全量使用者的快照。

欄位名稱

是否必填

欄位說明

user_id

已登入使用者必填

使用者ID。

user_id_type

可選

使用者註冊類型,包括App註冊帳號、手機號、微訊號或其它。

device_id

可選

裝置ID​。

gender

可選

性別。

age/birthday

可選

年齡/出生日期。

purchasing

可選

購買力,基於歷史資料統計/建模擷取。

country

可選

國家。

province

可選

省份。

city

可選

城市。

register_time

可選

註冊時間戳記。

單位:秒。例如,1520017038。

education

可選

使用者學曆。

career

可選

使用者職業。

last_login_time

可選

上次登入時間戳記。

單位:秒。例如,1520017038。

source

可選

使用者來源。

例如,頭條、微信等。

content

可選

使用者描述。

tags

可選

對使用者的標籤描述。

例如,足球、健身和戶外等。

物品表

系統內全量商品表。建議每天一個分區,每個分區為截止當天全量內容的快照。

欄位名稱

是否必填

欄位說明

item_id

商品唯一ID。

item_type

可選

商品類型。

source_id

可選

商品來源,導購電商填寫商品的來源平台。

例如,淘寶、天貓和京東等。

title

可選(建議填寫)

商品標題,用於語義層面深入分析,如果置空會損失部分演算法效果。

sub_title

可選

商品副標題。

pub_time

必填

發布時的時間戳記。

單位:秒

expire_time

可選

內容失效時間戳記。

單位:秒

category_level

可選(建議填寫)

類目層級數。

cate_id_path

可選(建議填寫)

全類目ID路徑。支援多級類目,用底線(_)串連。

cate_name_path

可選(建議填寫)

全類目名稱路徑。支援多級類目,用底線(_)串連。

cate1_id

可選(建議填寫)

一級類目ID。類目層級樹需遵循MECE原則(即不重疊,不遺漏),語義上不可交叉。

cate2_id

可選(建議填寫)

二級類目ID。類目層級樹需遵循MECE原則(即不重疊,不遺漏),語義上不可交叉。

cate_id

可選(建議填寫)

類目層級樹的末級葉子節點ID。

cate1_name

可選(建議填寫)

一級類目名稱。

cate2_name

可選(建議填寫)

二級類目名稱。

cate_name

可選(建議填寫)

葉子類目名稱。

brand_id

可選(建議填寫)

品牌ID。

shop_id

可選

店鋪ID。

description

可選

商品詳情描述。

price

必填

商品實際售賣價格。

origin_price

可選

商品原價。

discount

可選

折扣(price/origin_price)。

tags

可選

業務營運打上的商品標籤,例如參加活動的ID。

color

可選

顏色分類。

properties

可選(建議填寫)

商家填寫的商品屬性名稱/屬性值。

例如:{"material": "棉", "style": "通勤"}

postage

可選

運費。包郵商品運費填0。

image_url

可選

商品圖片URL。提供公網可下載的連結。

video_url

可選

商品視頻URL。提供公網可下載的連結。

shop_dsr

可選

店鋪評分,也稱DSR動態評分(Detailed seller ratings)。

spu_id

可選(建議填寫)

標準產品單位ID。

sku_id

可選

最小貨存單位ID

prov

可選

商品所在省份。

city

可選

商品所在城市。

rate

可選

好評率。

行為表

最近一段時間App的行為資料或情境內的行為資料,建議至少選擇30~60天。

為了擷取使用者完整的行為,盡量上報使用者在全站的行為,不僅收集推薦情境(home_feed),還收集如熱門情境(hot_items)和搜尋情境(search)的曝光、點擊等行為。在搜尋情境,則記錄搜尋字詞(query)。

欄位名稱

是否必填

欄位說明

user_id

已登入使用者必填

使用者ID。

device_id

可選

使用者裝置ID。

item_id

必填

商品ID

item_type

可選

商品類型。

event

必填

行為類型,包括曝光、停留、點擊和評價等。

event_time

必填

行為時間戳記。

單位:秒

event_value

可選

行為值,包括停留時間長度,購買件數和購買金額等。

request_id

可選(建議填寫)

請求ID,每次推薦的唯一識別碼。

缺少request_id會影響樣本的準確性,同時無法增加即時特徵。如果是建立推薦情境,可以暫時不使用request_id,但在搭建好推薦情境後,需要補上request_id,並調整訓練樣本產生代碼,重新準備訓練樣本以重新訓練模型。

exp_id

可選(建議填寫)

實驗桶ID。PAI-Rec推薦介面返回的實驗ID;如果不是PAI-Rec推薦的結果,填寫default等流量名稱。

request_info

可選

請求埋點資訊,推薦介面調用時返回該資訊,日誌記錄時帶上即可。

scene

必填

情境ID。

例如:home_feed表示首頁推薦流;hot_items表示熱賣欄目(不是推薦情境的行為也需要);search表示搜尋情境,搜尋情境需要填寫本次搜尋的query。

query

可選

搜尋字詞。

page

可選

頁面ID。

source_page

可選

上一頁面。可用於統計不同來源的效果。

position

可選

內容所在的位置資訊,即在推薦列表中的第幾個位置。

app_version

可選

App的版本號碼。

net_type

可選

網路型號。

例如,3G/4G/5G/Wifi。

ip

可選

用戶端IP資訊,用於提取國家、城市等特徵。

login

可選

是否登入使用者。

device_platform

可選

用戶端平台。

例如,iOS/Android/H5/msite。

device_system

可選

裝置作業系統。

例如,iOS、Android和PC。

device_model

可選

裝置型號。

device_brand

可選

裝置品牌/製造商。

longitude

可選

位置經度。

latitude

可選

位置緯度。

country

可選

國家。

province

可選

省份。

city

可選(建議填寫)

城市。

行為類型表

下表為電商行業中常見的幾種行為類型說明。

event

event_value

行為說明

expose

置空即可。

曝光。

click

置空即可。

點擊。

like

置空即可。

點贊。

unlike

置空即可。

踩。

comment

評論內容。

評論。

可用來挖掘使用者的購物體驗和商品品質。

collect

置空即可。

收藏。

stay

時間長度。

停留時間長度。

單位不限,請注意每條資料中具備相同單位約定。

cart

件數,單價,用英文逗號隔開。

例如:1,10000

加購。

單價:RMB,可精確到百分位(分)。

buy

件數,單價,用英文逗號隔開。

例如,1,10000

購買。

單價:RMB,可精確到百分位(分)。一條購買行為中,只能對應一個item_id,一個訂單多個item_id,需要進行拆分。

evaluate

離散的遞增或遞減的整數。

評價。

舉例:若使用星級評價,1~5星表示好評度遞增,則可設定對應關係為1星值取1、2星值取2……5星值取5。務必保證增減邏輯與實際好評和差評趨勢相對應。

dislike

負反饋。

內容推薦情境

下表列出了內容推薦情境中使用者表物品表行為表的建議欄位。如果還有其他未涵蓋的特徵欄位,可自行追加,欄位越豐富完善,推薦效果越好。欄位名稱無需與表格中的完全一致。

使用者表

系統內全部註冊使用者表,建議每天一個分區,每個分區為當天全量使用者的快照。

欄位名稱

是否必填

欄位說明

user_id

已登入使用者必填

使用者ID。

device_id

可選

裝置ID​。

register_time

可選(建議填寫)

註冊時間。

單位:秒。例如,1520017038。

gender

可選

性別。

age

可選

年齡。

country

可選

國家。

province

可選

省份。

city

可選

城市。

ip

可選

最後登入IP。

education

可選

使用者學曆。

career

可選

使用者職業。

item_cnt

可選

創作內容數。

favorite_cnt

可選

收藏數。

follow_cnt

可選

關注數。

follower_cnt

可選

粉絲數。

last_login_time

可選

上次登入時間。

tags

可選

對使用者的標籤描述。

例如,足球、健身和戶外等。

物品表

系統內全量內容表。建議每天一個分區,每個分區為截止當天全量內容的快照。

欄位名稱

是否必填

欄位說明

item_id

必填

內容ID。

item_type

多內容類型必填

內容類型。

例如,文章和視頻等。

status

必填

是否可推薦。

duration

可選(視頻必填)

視頻時間長度。

pub_time

必填

發布時間。

title

可選(建議填寫)

標題。

category

可選(建議填寫)

一級標籤,建議使用英文。

tags

可選

標籤,可以是多種標籤,用半形逗號或分號分割。

author

可選(建議填寫)

作者

abstract

可選

內容摘要。

content

可選

內容本文

image_url

可選

圖片URL,用於提取映像特徵。

video_url

可選

視頻URL,用於提取視頻特徵。

pv_count

可選

累計曝光數。

click_count

可選

累計點擊數。

praise_count

可選

累計點贊數。

comment_count

可選

累計評論數。

collect_count

可選

累計收藏數。

share_count

可選

累計分享數。

download_count

可選

累計下載數。

tip_count

可選

累計打賞數。

行為表

最近一段時間App的行為資料或情境內的行為資料,建議至少選擇30~60天。

欄位名稱

是否必填

欄位說明

user_id

已登入使用者必填

使用者唯一ID。

device_id

可選

使用者裝置ID。

item_id

必填

內容ID。

item_type

多內容類型必填

內容類型。

例如,文章和視頻等。

request_id

可選

請求ID,每次推薦的唯一識別碼。

缺少request_id會影響樣本的準確性,同時無法增加即時特徵。如果是建立推薦情境,可以暫時不使用request_id,但在搭建好推薦情境後,需要補上request_id,並調整訓練樣本產生代碼,重新準備訓練樣本以重新訓練模型。

request_info

可選(建議填寫)

埋點內容,如召回ID等。

exp_id

必填

實驗ID。PAI-Rec推薦介面返回的實驗ID;如果不是PAI-Rec推薦的結果,填寫default等流量名稱。

scene

多情境必填

情境。

page

可選(多頁面建議填寫)

頁面。

source_page

可選(多頁面建議填寫)

上一頁面。

position

可選

內容所在位置。

event

必填

行為類型,包括曝光、停留、點擊和評價等。

event_time

必填

行為發生時間。

playtime

可選(建議填寫)

播放時間長度/閱讀時間長度。

單位:秒。

comment

可選

評論內容。

net_type

可選

網路型號。

device_platform

可選(建議填寫)

用戶端平台。

device_brand

可選

用戶端品牌。

device_model

可選

用戶端機型。

device_system

可選

用戶端作業系統。

app_version

可選

App版本。

longitude

可選

位置經度。

latitude

可選

位置緯度。

country

可選

國家。

province

可選

省份。

city

可選(建議填寫)

城市。

ip

可選

最後登入IP。

視頻推薦

下表列出了視頻推薦情境中使用者表物品表行為表的建議欄位。如果還有其他未涵蓋的特徵欄位,可自行追加,欄位越豐富完善,推薦效果越好。欄位名稱無需與表格中的完全一致。

使用者表

欄位名稱

是否必填

欄位說明

user_id

必填

使用者ID。

age

可選

使用者年齡,可進行分段處理。

例如,0~12、12~18、18~24和25~34等,作為數值特徵,離散化之後作為類別特徵。

gender

可選

使用者性別。

例如,男、女或其他,作為類別特徵,也可以用0、1或2等整數來表明性別。

occupation

可選

使用者的職業資訊。

例如,學生、教師和工程師等,作為類別特徵。

education

可選

使用者的教育背景。

例如,高中、本科和碩士等,作為類別特徵。

income

可選

使用者的收入水平。

例如,低、中和高,作為類別特徵。

user_level

可選

使用者在平台上的等級或會員等級。

register_time

可選

使用者註冊賬戶的時間,單位是秒。可以轉換後按年、月、日分段,作為數值特徵,離散化之後作為類別特徵。

country

可選

使用者所在國家,作為類別特徵。

province

可選

使用者所在國家的省,作為類別特徵。

city

可選

使用者所在國家的城市,作為類別特徵。

active_time

可選

使用者在平台上的活躍時間段。

例如,早晨、下午和晚上等,作為類別特徵。

device_type

可選

使用者使用的裝置類型。

例如,PC、手機和平板等,作為類別特徵。

os

可選

使用者裝置上的作業系統。

例如,iOS、Android和Windows等,作為類別特徵。

browser

可選

使用者使用的瀏覽器類型。

例如,Chrome、Firefox和Safari等,作為類別特徵。

language

可選

使用者偏好的語言。

例如,英語、中文和西班牙語等,作為類別特徵。

interests

可選

使用者的興趣點。

例如,運動、音樂和旅行等,作為Tag特徵。

物品表

欄位名稱

是否必填

欄位說明

item_id

必填

物品ID,視頻內容的唯一識別碼。

category

可選

視頻內容的一級分類,作為類別特徵。

leaf_category

可選

視頻內容的葉子類目,作為類別特徵。

brand

可選

視頻內容的品牌或製作方,作為類別特徵。

video_type

可選

視頻的類型。

例如,電影、電視劇、紀錄片和短片等,作為類別特徵。

duration

可選

視頻的時間長度,可以離散化為短於10分鐘、10~30分鐘、超過30分鐘等,作為類別特徵。

title

可選

視頻的標題。

series_name

可選

視頻集名稱。

例如,《西遊記》。

series_total_number

可選

視頻集總共多少集。

series_number

可選

視頻集當前是第幾集。

例如,1表示第一集。

release_date

可選

視頻的發布日期,可以作為數值特徵。

單位:秒。

director

可選

視頻的導演。

actors

可選

視頻的主要演員,半形逗號分隔,多值作為tag特徵。

rating

可選

視頻的評分。

例如,IMDb評分、豆瓣評分等,作為數值特徵。

language

可選

視頻的原始語言。

例如,英語、中文和日語等,作為類別特徵。

has_subtitle

可選

視頻是否提供字幕。

region

可選

視頻的製作地區。

例如,好萊塢、寶萊塢和中國內地等,作為類別特徵。

tags

可選

視頻的標籤。

例如,喜劇、動作和愛情等,多值作為tag特徵。

行為表

為了擷取使用者完整的行為資料,建議儘可能上報使用者在全站的行為,包括推薦情境(home_feed)、熱門情境(hot_items)和搜尋情境(search)的曝光/點擊等行為。在搜尋情境中,需要記錄搜尋字詞(query)。

因為使用者在非推薦情境中的點擊、觀看等行為同樣能夠反映其偏好,是構建完整使用者畫像的重要資料來源。

欄位名稱

是否必填

欄位說明

request_id

可選

請求ID,每次推薦的唯一識別碼。

缺少request_id會影響樣本的準確性,同時無法增加即時特徵。如果是建立推薦情境,可以暫時不使用request_id,但在搭建好推薦情境後,需要補上request_id,並調整訓練樣本產生代碼,重新準備訓練樣本以重新訓練模型。

user_id

必填

使用者ID,使用者的唯一識別碼。

item_id

必填

物品ID,視頻內容的唯一識別碼。

event

必填

使用者對視頻內容的行為。

例如,曝光、點擊和點贊等,作為類別特徵。

event_value

必填

當event的值為watch(觀看),event_value可填寫值為觀看時間長度(單位:秒)。

timestamp

必填

使用者行為發生的時間,單位是秒。可以按小時、星期幾、是否節假日等分段,作為類別特徵。

scene

必填

情境。

例如:home_feed表示首頁推薦流;hot_items表示熱賣欄目(不是推薦情境的行為也需要);search表示搜尋情境,搜尋情境需要填寫本次搜尋的query。

query

可選

搜尋字詞。

device_type

可選

使用者使用的裝置類型。

例如,PC、手機和平板等,作為類別特徵。

browser

可選

使用者使用的瀏覽器類型。

例如,Chrome、Firefox和Safari等,作為類別特徵。

mobile_brand

可選

使用者手機的品牌,作為類別特徵。

os

可選

使用者裝置上的作業系統。

例如,iOS、Android和Windows等,作為類別特徵。

ip

可選

使用者的IP地址,可以通過IP定位得到所在省、城市特徵,作為類別特徵。

rating

可選

使用者對視頻內容評價的平均分數。

例如,滿分10分,該視頻分數是8.5。

weather

可選

使用者所在地的天氣情況。

例如,晴、雨和雪等,作為類別特徵。

holiday

可選

使用者行為發生時是否是節假日。

例如,春節和國慶節等,作為類別特徵。

season

可選

當前的季節。

例如,春、夏、秋和冬,作為類別特徵。

longitude

可選

使用者所在位置的經度,作為數值特徵,離散化之後作為類別特徵。

latitude

可選

使用者所在位置的緯度,作為數值特徵,離散化之後作為類別特徵。

直播推薦

下表列出了直播推薦情境中使用者表物品表行為表的建議欄位。如果還有其他未涵蓋的特徵欄位,可自行追加,欄位越豐富完善,推薦效果越好。欄位名稱無需與表格中的完全一致。

使用者表

欄位名稱

是否必填

欄位說明

user_id

必填

使用者ID。

age

可選

使用者年齡,可進行分段處理。

例如,0~12、12~18、18~24和25~34等,作為數值特徵,離散化之後作為類別特徵。

gender

可選

使用者性別。

例如,男、女或其他,作為類別特徵,也可以用0、1或2等整數來表明性別。

occupation

可選

使用者的職業資訊。

例如,學生、教師和工程師等,作為類別特徵。

education

可選

使用者的教育背景。

例如,高中、本科和碩士等,作為類別特徵。

income

可選

使用者的收入水平。

例如,低、中和高,作為類別特徵。

user_level

可選

使用者在平台上的等級或會員等級。

register_time

可選

使用者註冊賬戶的時間,單位是秒。可以轉換後按年、月、日分段,作為數值特徵,離散化之後作為類別特徵。

country

可選

使用者所在國家,作為類別特徵。

province

可選

使用者所在國家的省,作為類別特徵。

city

可選

使用者所在國家的城市,作為類別特徵。

active_time

可選

使用者在平台上的活躍時間段。

例如,早晨、下午和晚上等,作為類別特徵。

device_type

可選

使用者使用的裝置類型。

例如,PC、手機和平板等,作為類別特徵。

os

可選

使用者裝置上的作業系統。

例如,iOS、Android和Windows等,作為類別特徵。

browser

可選

使用者使用的瀏覽器類型。

例如,Chrome、Firefox和Safari等,作為類別特徵。

language

可選

使用者偏好的語言。

例如,英語、中文和西班牙語等,作為類別特徵。

interests

可選

使用者的興趣點。

例如,運動、音樂和旅行等,作為Tag特徵。

物品表

欄位名稱

是否必填

欄位說明

anchor_id

必填

物品ID,主播的唯一識別碼。

name

可選

主播的姓名。

nickname

可選

主播的暱稱,一般會顯示在直播頁面。

anchor_gender

可選

使用者的性別。

例如,男、女或其他,作為類別特徵。

language

可選

主播在直播過程中使用的語言。

包含漢語、英語和日語等。

level

可選

關於該主播在平台的等級。

category

可選

主播所屬的主要類別。

例如,才藝表演、遊戲解說等,作為類別特徵。

leaf_category

可選

更加細分的類別標籤,作為類別特徵。

rating

可選

觀眾對主播的整體評價分數,可以轉化為好評、中評和差評等形式,作為類別特徵。

status

可選

表示主播當前的狀態,比如是否正在直播。

review_count

可選

關於該主播的所有評論總數。

video_type

可選

直播的具體形式。

例如,現場直播、錄製回放等。

duration

可選

單次直播的期間長度。

release_date

可選

直播開始的確切日期。

director

可選

如果是預錄節目,則記錄導演名字;否則通常為空白。

actors

可選

參與直播的嘉賓名單。

subtitles

可選

是否提供了字幕服務。

region

可選

主播所在的地區。

tags

可選

與直播主題相關的關鍵詞列表。

follow_count

可選

主播粉絲數量。

行為表

欄位名稱

是否必填

欄位說明

request_id

可選

請求ID,每次推薦的唯一識別碼。

缺少request_id會影響樣本的準確性,同時無法增加即時特徵。如果是建立推薦情境,可以暫時不使用request_id,但在搭建好推薦情境後,需要補上request_id,並調整訓練樣本產生代碼,重新準備訓練樣本以重新訓練模型。

user_id

必填

使用者ID,使用者的唯一識別碼。

item_id

必填

物品ID,視頻內容的唯一識別碼。

event

必填

使用者對視頻內容的行為。

例如,曝光、點擊和點贊等,作為類別特徵。

event_value

必填

當event為打賞時,記錄具體金額;當event為點贊時,記錄點贊次數。

event_time

可選

精確到秒的行為發生時刻。

ip

可選

使用者的IP地址,可以通過IP定位得到所在省、城市特徵,作為類別特徵。

rating

可選

使用者給予主播的星級評價或其他形式的反饋。

scene

可選

區分不同訪問入口。

例如,首頁推薦和搜尋結果頁等。

device_type

可選

使用者進行互動時所使用的終端裝置。

browser

可選

使用者訪問時使用的瀏覽器軟體。

mobile_brand

可選

使用者行動裝置的品牌名稱。

os

可選

使用者裝置上的作業系統。

weather

可選

根據IP定位擷取的即時天氣情況。

holiday

可選

使用者行為發生時是否是節假日。

season

可選

當前的季節。

longitude

可選

使用者所在位置的經度。

latitude

可選

使用者所在位置的緯度。