全部產品
Search
文件中心

Platform For AI:基於對象特徵的推薦

更新時間:Jul 13, 2024

本文為您介紹如何基於對象特徵進行商品推薦。

前提條件

已建立工作空間,詳情請參見建立工作空間

背景資訊

該工作流程首先對一份真實電商的4月份和5月份資料進行模型訓練並產生預測模型,然後通過6月份的購物資料對該預測模型進行評估,最終選擇最優的模型,並將其部署為EAS服務供業務方調用。

重要

本工作流程使用的資料為真實電商脫敏資料,僅用於學習,請勿商用。

該工作流程資料和完整商務程序已經預置在Designer模板中,您通過拖拽組件即可快速實現一套基於協同過濾的推薦系統。同時,Designer支援模型一鍵部署,您可以一鍵將模型部署為EAS服務。

基於對象特徵的推薦情境通用流程

  1. 將資料匯入MaxCompute,產生有監督的結構化資料。

  2. 進行特徵工程,例如資料的預先處理和特徵衍生。特徵衍生的作用是擴充資料維度,使資料能更大限度地展示業務特點。

  3. 將資料拆分為兩份。其中一份作為訓練資料,通過分類演算法產生二分類模型。另一份作為預測資料,通過預測組件對模型效果進行測試。

  4. 通過評估組件,獲得模型效果。

資料集

本資料來源由天池大賽提供,根據時間將其分為4月份和5月份的購買行為資料和6月份的購買行為資料,具體欄位如下。

欄位名

含義

類型

描述

user_id

使用者編號

STRING

購物的使用者ID。

item_id

物品編號

STRING

被購買物品的編號。

active_type

購物行為

STRING

  • 0:表示點擊。

  • 1:表示購買。

  • 2:表示收藏。

  • 3:表示加入購物車。

active_date

購物時間

STRING

購物發生的時間。

工作流程的未經處理資料樣本如下。原始樣本資料

實現基於對象特徵的推薦

  1. 進入Designer頁面。

    1. 登入PAI控制台

    2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。

    3. 在工作空間頁面的左側導覽列選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。

  2. 構建工作流程。

    1. Designer頁面,單擊預置模板頁簽。

    2. 在模板列表,單擊基於對象特徵的推薦下的建立

    3. 建立工作流程對話方塊,配置參數(可以全部使用預設參數)。

      其中:工作流程資料存放區配置為OSS Bucket路徑,用於儲存工作流程運行中產出的臨時資料和模型。

    4. 單擊確定

      您需要等待大約十秒鐘,工作流程可以建立成功。

    5. 在工作流程列表,雙擊基於對象特徵的推薦工作流程,進入工作流程。

    6. 系統根據預置的模板,自動構建工作流程,如下圖所示。

      c4a0febf78030c372ff758f0946722da.png

      地區

      描述

      特徵工程。將僅有4個欄位的未經處理資料通過特徵工程的方法進行資料維度擴充,該實驗中的特徵包括推薦對象的特徵和被推薦對象的特徵:

      • 推薦對象為使用者(User),擴充的維度為每個User的總購買量、總點擊量及總點擊購買率(點擊量除以購買率,用於描述使用者購物的果斷性)。

      • 被推薦對象為商品(Item),擴充的維度為每個Item的購買量、點擊量及點擊購買率(購買量除以點擊率)。

      特徵工程後,資料集從原始的4個欄位擴充到10個欄位,如下圖所示。特徵工程後的資料

      該實驗使用了羅吉斯迴歸演算法進行模型訓練。

      您可以單擊羅吉斯迴歸二分類-1組件,在右側欄位設定頁簽,選中是否產生PMML複選框,即可產生PMML模型。

      模型評估,即使用預留的一部分未參與模型訓練的資料評估模型品質。通常,推薦情境都屬於二分類實驗,可以使用混淆矩陣和二分類評估組件評估模型預測結果。

  3. 運行實驗並查看輸出結果。

    1. 單擊畫布上方的運行

    2. 實驗運行結束後,按右鍵畫布中的羅吉斯迴歸二分類-1,在捷徑功能表,單擊模型選項 > 匯出PMML,即可匯出訓練完成的基於對象特徵的推薦模型。

    3. 按右鍵畫布中的預測,在捷徑功能表,單擊查看資料 > 預測結果輸出,即可查看模型預測結果。

  4. 查看模型評估結果。

    1. 按右鍵畫布中的二分類評估-1,在捷徑功能表,單擊可視化分析

    2. 二分類評估-1地區,單擊評估圖表頁簽,查看ROC曲線。

      AOC曲線其中藍色地區的面積為AUC值,面積越大表示模型品質越高。

    3. 按右鍵畫布中的混淆矩陣-1,在捷徑功能表,單擊可視化分析

    4. 混淆矩陣-1地區的混淆矩陣頁簽,查看預測評估指標。

      混淆矩陣評估結果

  5. 線上部署模型。

    如果模型效果達到預期,則可以單擊畫布上方的模型列表,將其部署為線上服務。具體操作,請參見單模型部署線上服務