すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:ユーザーとアイテムの特徴に基づいて製品を推奨する

最終更新日:Jul 22, 2024

このトピックでは、ユーザーとアイテムの機能に基づいて製品レコメンデーションモデルを作成する方法について説明します。

前提条件

ワークスペースが作成済み。 詳細については、「ワークスペースの作成」をご参照ください。

背景情報

このサンプルパイプラインでは、4月と5月の実際のeコマースデータを使用してモデルをトレーニングし、6月のデータを使用してモデルを評価します。 モデルのパフォーマンスが検証された後、モデルはオンラインサービスとしてElastic Algorithm Service (EAS) にデプロイされます。

重要

サンプルパイプラインは、eコマースプラットフォームからの匿名化された実データを使用します。 データは商用目的ではありません。

サンプルパイプラインと関連データは、Machine Learning Designerが提供するプリセットテンプレートに含まれています。 テンプレート内のコンポーネントをドラッグして、協調フィルタリングに基づいて推奨モデルを作成できます。 次に、Machine Learning Designerでトレーニングしたモデルを数回クリックするだけでEASにデプロイできます。

一般的なワークフロー

image
  1. MaxComputeにデータをインポートして、教師付き構造化データを生成します。

  2. データの前処理やフィーチャの派生などのフィーチャエンジニアリング操作を実行します。 機能派生は、ビジネス固有の特性をより適切にキャプチャするために、既存のデータから新しいデータを生成します。

  3. データを2つのデータセットに分割します。 1つのデータセットを使用して、バイナリ分類モデルをトレーニングします。 他のデータセットを使用して、モデルのパフォーマンスを評価します。

  4. モデルのパフォーマンスを評価します。

データセット

サンプルパイプラインでは、Tianchi Big Data Competitionのデータセットを使用します。 データセットには、4月から6月までのeコマースプラットフォームのショッピングデータが含まれています。 次の表に、データセットのフィールドを示します。

項目

短い説明

データ型

完全な説明

user_id

User ID

STRING

アイテムを購入したユーザーのID。

item_id

アイテムID

STRING

購入したアイテムのID。

active_type

ショッピング行動

STRING

  • 0: アイテムをクリックします。

  • 1: アイテムを購入します。

  • 2: お気に入りにアイテムを追加します。

  • 3: ショッピングカートにアイテムを追加します。

active_date

購入日

STRING

ユーザーがアイテムを購入した日付。

次の図は、サンプルパイプラインで使用される生データを示しています。 原始示例数据

手順

  1. Machine Learning Designerページに移動します。

    1. PAIコンソールにログインします。

    2. 左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。

    3. ワークスペースページの左側のナビゲーションウィンドウで、モデル开発とトレーニング > ビジュアルモデリング (デザイナー)機械学習デザイナーページに移動します。

  2. パイプラインを作成します。

    1. Visualized Modeling (Designer) ページで、プリセットテンプレートタブをクリックします。

    2. [プリセットテンプレート] タブで、オブジェクト特性に基づく推奨事項をクリックし、作成.

    3. [パイプラインの作成] ダイアログボックスで、パラメーターを設定します。 デフォルト値を使用できます。

      Pipeline Data Pathパラメーターに指定された値は、パイプラインのランタイム中に生成された一時データおよびモデルのObject Storage Service (OSS) バケットパスです。

    4. [OK] をクリックします。

      パイプラインの作成には約10秒かかります。

    5. [パイプライン] タブで、ダブルクリックします。オブジェクト特性に基づく推奨事項パイプラインを開きます。

    6. キャンバス上のパイプラインのコンポーネントを表示します。 次の図は、プリセットテンプレートに基づいて自動的に作成されるパイプラインを示しています。

      c4a0febf78030c372ff758f0946722da.png

      セクション

      説明

      このセクションのコンポーネントは、元のデータセットに基づいて次のフィーチャの新しいデータを生成するフィーチャエンジニアリングを実行します。

      • ユーザー機能: 生成されたデータには、各ユーザーの購入数、クリック数、クリック対購入の比率が含まれます。 クリック対購入の比率は、クリック数を購入数で割ることによって計算されます。 この比率は、ショッピング活動におけるユーザの決定性を反映する。

      • アイテムの特徴: 生成されたデータには、各アイテムの購入数、クリック数、購入対クリックの比率が含まれます。 購入対クリックの比率は、購入数をクリック数で割ることによって計算されます。

      フィーチャエンジニアリング後、次の図に示すように、データセットは4フィールドから10フィールドに拡張されます。 特征工程后的数据

      このセクションのコンポーネントでは、論理回帰アルゴリズムを使用してモデルをトレーニングします。

      トレーニング済みモデルを保存するには、[バイナリ分類のロジスティック回帰] コンポーネントをクリックし、右側のウィンドウで [フィールド設定] タブをクリックし、[PMMLを生成するかどうか] を選択します。

      このセクションのコンポーネントでは、モデルのトレーニングに使用されていないデータを使用して、モデルのパフォーマンスを評価します。 ほとんどの場合、Confusion MatrixおよびBinary Classification Evaluationコンポーネントを使用して、推奨モデルのパフォーマンスを評価できます。

  3. パイプラインを実行し、予測結果を表示します。

    1. キャンバスの左上隅で、実行アイコンが表示されます。

    2. パイプラインの実行が完了したら、バイナリ分類のロジスティック回帰キャンバス上のコンポーネントを選択し、モデルオプション > PMMLファイルへのエクスポートトレーニング済みモデルをエクスポートします。

    3. を右クリックし、予測キャンバス上のコンポーネントを選択し、データの表示 > 予測結果出力モデルの予測結果を表示します。

  4. モデルの評価結果を表示します。

    1. キャンバス上のバイナリ分類評価コンポーネントを右クリックし、ビジュアル分析を選択します。

    2. では、バイナリ分類評価セクションをクリックし、評価チャート受信機動作特性 (ROC) 曲線を見るためのタブ。

      AOC曲线青色領域は、曲線下面積 (AUC) 値を表す。 青い領域が大きいほど、モデルの品質が高いことを示します。

    3. キャンバス上の混乱マトリックスコンポーネントを右クリックし、ビジュアル分析を選択します。

    4. では、混乱マトリックスセクションをクリックし、混乱マトリックスタブで評価結果を表示します。

      混淆矩阵评估结果

  5. モデルをデプロイします。

    モデルのパフォーマンスが期待どおりの場合は、キャンバスの上部にある [モデル] をクリックして、モデルをオンラインサービスとしてデプロイします。 詳細については、「オンラインサービスとしてのモデルのデプロイ」をご参照ください。