このコンポーネントを使用して、EasyRecモデルに対するオフライン予測を実行できます。
前提条件
モデルトレーニングコンポーネントを使用してモデルをトレーニングしました。 詳細については、「モデルトレーニング」をご参照ください。
Machine Learning Designerでコンポーネントを構成する
入力ポート
ポート (左から右) | 推奨上流コンポーネント | PAIコマンドのパラメータ | 必須 |
入力モデル |
| saved_model_dir | 可 |
入力テーブル |
| input_table | 可 |
コンポーネントパラメータ
タブ | パラメーター | 必須 | 説明 | PAIコマンドのパラメータ | デフォルト値 |
パラメーター設定 | 入力フィーチャ列 | 不可 | トレーニング用に入力テーブルから選択されたフィーチャ列。 このパラメーターと [除外列] パラメーターを同時に指定することはできません。 | selected_cols | デフォルト値なし |
除外列 | 不可 | 入力テーブルから除外する列。 このパラメーターと [フィーチャ列の入力] パラメーターを同時に指定することはできません。 | excluded_cols | デフォルト値なし | |
予約済み列 | 不可 | 予約する生成された列の名前。 | reserved_cols | デフォルト値なし | |
出力列 | 不可 | MaxComputeテーブルの出力列。 | output_cols | probs double | |
miniBatchサイズ | 不可 | ミニバッチのサイズ。バッチに含まれるサンプルの最小数を示します。 | batch_size | 1024 | |
アルゴリズムのバージョンの指定 | 可 | このパラメーターは、[詳細オプション] を選択した場合に使用できます。 実行するアルゴリズムパッケージを選択します。
| スクリプト | デフォルト値なし | |
チューニング | 労働者数 | 不可 | ワーカーノードの数。 | clusterパラメーターとして渡されます。 | 1 |
ワーカーCPU | 不可 | 各ワーカーのCPU番号。 値1は1つのCPUコアを示します。 | 6 | ||
ワーカーメモリ | 不可 | 各ワーカーノードのメモリサイズ。 100の値は100 MBを示します。 | 30000 | ||
ワーカーGPU | 不可 | ほとんどのEasyRecトレーニングではGPUは必要ありません。 | 0 |
出力ポート
ポート (左から右) | データ型 | PAIコマンドのパラメータ |
出力テーブル | MaxComputeテーブル | output_table |
PAIコマンドとパラメータ
PAI -project algo_public -name easy_rec_ext
-Darn="acs:ram::xxx:role/aliyunodpspaidefaultrole"
-Dbatch_size="1024"
-Dbuckets="oss://rec_sln_demo/"
-Dcluster="{\"worker\": {\"count\": 1, \"cpu\": 600, \"gpu\": 0, \"memory\": 30000}}"
-Dcmd="predict"
-Dinput_table="odps://pai_hangzhou/tables/pai_temp_flow_inpwi02on49ooub78p_node_dn3y3lvucm862jr71n_outputTable"
-Dlifecycle="28"
-DossHost="oss-cn-hangzhou-internal.aliyuncs.com"
-Doutput_cols="item_emb string"
-Doutput_table="odps://pai_hangzhou/tables/pai_temp_flow_da1nuzwmbdfyw5kajy_node_5jgko0vlrjiwawp6y8_outputTable"
-Dreserved_cols="item_id"
-Dsaved_model_dir="oss://rec_sln_demo/EasyRec/deploy/rec_sln_demo_dssm_recall_v1/20230425/export/final/item"
-Dscript="oss://rec_sln_demo/easy_rec_ext_0.6.1_res.tar.gz";パラメーター | 必須 | 説明 |
saved_model_dir | 可 | エクスポートされたモデルファイルのディレクトリ。 |
input_table | 可 | 入力テーブルの名前。 |
output_table | 不可 | 自動的に作成される出力テーブル。 |
reserved_cols | 不可 | output_tableにコピーされる列。 複数の列はコンマ (,) で区切ります。 |
output_cols | 不可 | 出力テーブルの列の名前とデータ型。 複数の列はコンマ (,) で区切ります。 |
batch_size | 不可 | ミニバッチのサイズ。 |
arn | 可 | arnの値を取得するには、次の操作を実行します。PAIコンソールにログインします。 左側のナビゲーションウィンドウで、[アクティベーションと権限付与] > [依存サービス] を選択します。 [デザイナー] セクションでOSSを見つけ、[操作] 列の [権限の表示] をクリックします。 |
バケット | 可 | モデルファイルが存在するバケットとモデルが保存されているバケット。 複数のバケットを使用する場合は、複数のバケットをコンマ (,) で区切ります。 例: |
ossHost | 可 | OSSのエンドポイント。 エンドポイントの詳細については、「リージョンおよびエンドポイント」をご参照ください。 |
スクリプト | 不可 | EasyRec TARパッケージが保存されているOSSバケットのパス。 EasyRec TARパッケージの設定方法の詳細については、EasyRecドキュメントの「リリースとアップグレード」をご参照ください。 |
例:
次の図に示すように、パイプラインを作成します。

セクション
説明
① ② ③
パラメーターの設定方法の詳細については、「モデルトレーニングの例」をご参照ください。
④
Model TrainingコンポーネントをModel Predictionの左側の入力ポートに接続し、Read Table-2コンポーネントをModel Predictionの右側の入力ポートに接続します。 [除外列] を [clk] に設定し、[予約列] にuser_idおよび [pid] を選択します。
パイプラインの実行後、モデル予測コンポーネントを右クリックし、[データの表示] > [出力テーブル] を選択します。

詳細については、「Vector Recall」の「13_rec_sln_demo_dssm_recall_item_embedding_v1」をご参照ください。