Machine Learning Designerはバッチ予測をサポートしています。 モデルを使用して、リアルタイムの結果を必要としないビジネスシナリオのデータセットに定期的なバッチ予測を実装できます。 このトピックでは、Machine Learning Designerでバッチ予測を実装する方法について説明します。
開発環境でのバッチ予測の実装
Designerは、さまざまなアルゴリズムとシナリオをサポートするさまざまな予測コンポーネントを提供します。 これらのコンポーネントは、キャンバス上に直接ドラッグアンドドロップできます。
左側のコンポーネントペインに表示されているモデルのトレーニングコンポーネントと予測コンポーネント (FMアルゴリズムなど) のペアを直接使用してモデルをトレーニングし、そのモデルを使用してバッチ予測を実装できます。
使用するアルゴリズムで使用できる予測コンポーネントがない場合は、モデルのトレーニング後に汎用予測コンポーネントを使用してバッチ予測を実装できます。
重要汎用予測コンポーネントは、OfflineModelモデルのみをサポートします。 PMML (Predictive Model Markup Language) モデルはサポートしていません。
既存のモデルが利用可能な場合は、コンポーネントを使用してモデルと予測データをインポートすることもできます。 次に、予測コンポーネントをコンポーネントの下流ノードとして接続して、予測と展開を実装します。
定期的にバッチ予測パイプラインをスケジュールする
バッチ予測パイプラインがテストに合格した後、パイプラインをDataWorksに送信し、定期的にスケジュールすることができます。
オフラインでトレーニングされたモデルを本番環境に同期します。
ワークスペースがDataWorks標準モードの場合、開発環境と本番環境はMaxComputeデータを別々に保持します。 したがって、オフライン予測ワークフローを定期的にスケジュールする前に、オフラインでトレーニングされたモデルを本番環境に同期する必要があります。
モデルのエクスポートとインポートMaxComputeオフラインモデルコンポーネントの使用 (推奨)
Model Exportコンポーネントを使用して、トレーニング済みのOfflineModelモデルをObject Storage Service (OSS) にエクスポートします。次に、定期的にスケジュールされたパイプラインのImport MaxCompute Offline modelコンポーネントを使用して、モデルをOSSからインポートします。
MaxComputeオフラインモデルのコピーとMaxComputeオフラインモデルの読み取りコンポーネントの使用
説明レプリケート操作を実行するには、ワークスペース管理者アカウントまたは運用アカウントを使用する必要があります。 詳細については、「権限」をご参照ください。
Copy MaxCompute Offline Modelコンポーネントを使用して、トレーニング済みのOfflineModelモデルを本番環境にレプリケートします。次に、定期的にスケジュールされたパイプラインでMaxCompute Offline modelの読み取りコンポーネントを使用して、本番環境でモデルを読み取ります。
DataWorksタスクを使用して、Machine Learning Designerでパイプラインをスケジュールします。
関連ドキュメント
オフライン予測の結果が期待どおりの場合は、モデルをEASオンラインサービスとしてデプロイするか、オフラインデータ処理パイプラインをパッケージ化してパイプラインをEASオンラインサービスとしてデプロイできます。