DataWorks は、Data Studio のさまざまなノードに共通のランタイム環境を含む公式イメージを提供します。これらのイメージを直接使用することも、それらをベースにカスタムイメージを作成することもできます。このトピックでは、公式イメージについて説明します。
概要
Data Studio で、ノードにイメージを指定しない場合、DataWorks はデフォルトの標準イメージを使用します。デフォルトのイメージは、特殊なタスク要件を満たさない可能性のある基本的な環境を提供します。公式のベースイメージを使用して、さまざまなタスクタイプに標準化された環境を提供できます。公式イメージは事前設定済みです。公式イメージをベースにカスタムイメージを作成し、構成を追加してより多くのシナリオをサポートできます。
イメージリスト
サポートされているバージョンとリージョンについては、DataWorks コンソールをご参照ください。
DataWorks は以下のイメージを提供します。
イメージ名 | イメージの説明 | 適用可能なタスク |
dataworks_pyodps_py311_task_pod | DataWorks PyODPS ノードの公式イメージ。このイメージは Python 3.11 を使用します。 | |
dataworks_pairec_task_pod | 公式の DataWorks PAI-Rec イメージ。PAI-Rec によって生成されたアルゴリズムを実行するために使用されます。feature_store ソフトウェア開発キット (SDK) と pyfg のバージョンについては、コンソールをご参照ください。 | |
dataworks_pyodps_task_pod | DataWorks PyODPS ノードの公式イメージ。このイメージは Python 3.7 を使用します。 | |
dataworks_emr_base_task_pod | EMR クラスターのベースイメージです。EMR Serverless Spark、EMR on ECS DataLake、EMR on ECS Custom のクラスタータイプをサポートします。
| |
dataworks_shell_jdk17_task_pod | DataWorks Shell ノードの公式イメージ。このイメージは JDK 17 を提供します。 | |
dataworks_shell_task_pod | DataWorks Shell ノードの公式イメージ。このイメージは JDK 7 を提供します。Subprocess パラメーターの受け渡しをサポートするカスタムランタイム環境が必要な場合は、このイメージをベースにカスタムイメージを作成します。 | |
dataworks_python_task_pod | DataWorks Python ノードの公式イメージ。このイメージは Python 3.7 を使用します。 | |
dataworks_cdh_custom_task_pod | DataWorks CDH クラスターのベースイメージ。このイメージは直接使用できません。Data Studio でイメージを使用する前に、カスタムイメージを作成して | |
dataworks_controller_task_pod | 代入ノードの公式イメージ。カスタムランタイム環境で代入ノードまたは代入パラメーターを使用して子孫ノードにパラメーターを渡すには、このイメージをベースにカスタムイメージを作成します。 | |
dataworks-mcp | DataWorks Agent タスクを開発するため。システム情報: py3.11-ubuntu22.04。 | |
dataworks-notebook | Notebook タスクを開発するため。システム情報: py3.11-ubuntu22.04。 | |
dataworks_notebook_task_pod | DataWorks Notebook の Ubuntu イメージです。ロールインジェクションをサポートします。 | |
dataworks-maxcompute | 個人開発環境用の MaxCompute イメージを作成するため。システム情報: py3.11-ubuntu20.04。 |
イメージを使用する
Data Studio では、ワークスペースにアタッチされている公式イメージとカスタムイメージを使用できます。
新しい Data Studio でイメージを使用する: ノード開発ページで、右側の [デバッグ設定] および [スケジューリング設定] ペインで、テスト実行および本番実行用の リソースグループ と イメージ を構成できます。
レガシー DataStudio でイメージを使用する: ノード開発ページで、[パラメーターを指定して実行] をクリックし、表示されるダイアログボックスで テスト実行 と 本番実行 の リソースグループ と イメージ を構成できます。または、右側の [スケジューリング設定] ページで構成することもできます。
個人開発環境でイメージを使用する: インスタンスを作成するときに、[イメージ設定] セクションで公式イメージを選択できます。
リソースグループとイメージを構成する際は、次の点に注意してください:
スケジューリングリソースグループ: サーバーレスリソースグループを選択します。
イメージ: 公式イメージ または 公開済みのカスタムイメージ を選択します。