すべてのプロダクト
Search
ドキュメントセンター

DataWorks:DataWorks の公式イメージ

最終更新日:Dec 17, 2025

DataWorks は、Data Studio のさまざまなノードに共通のランタイム環境を含む公式イメージを提供します。これらのイメージを直接使用することも、それらをベースにカスタムイメージを作成することもできます。このトピックでは、公式イメージについて説明します。

概要

Data Studio で、ノードにイメージを指定しない場合、DataWorks はデフォルトの標準イメージを使用します。デフォルトのイメージは、特殊なタスク要件を満たさない可能性のある基本的な環境を提供します。公式のベースイメージを使用して、さまざまなタスクタイプに標準化された環境を提供できます。公式イメージは事前設定済みです。公式イメージをベースにカスタムイメージを作成し、構成を追加してより多くのシナリオをサポートできます。

イメージリスト

重要

サポートされているバージョンとリージョンについては、DataWorks コンソールをご参照ください。

DataWorks は以下のイメージを提供します。

イメージ名

イメージの説明

適用可能なタスク

dataworks_pyodps_py311_task_pod

DataWorks PyODPS ノードの公式イメージ。このイメージは Python 3.11 を使用します。

PyODPS 3

dataworks_pairec_task_pod

公式の DataWorks PAI-Rec イメージ。PAI-Rec によって生成されたアルゴリズムを実行するために使用されます。feature_store ソフトウェア開発キット (SDK) と pyfg のバージョンについては、コンソールをご参照ください。

dataworks_pyodps_task_pod

DataWorks PyODPS ノードの公式イメージ。このイメージは Python 3.7 を使用します。

PyODPS 2

PyODPS 3

dataworks_emr_base_task_pod

EMR クラスターのベースイメージです。EMR Serverless SparkEMR on ECS DataLakeEMR on ECS Custom のクラスタータイプをサポートします。

  • このイメージには、DataWorks で EMR タスクを送信するための基本コンポーネントのみが含まれており、EMR コンポーネントの実行環境は含まれていません。DataLake や Custom などの半マネージドクラスターの場合、ご利用の EMR クラスターのバージョンに一致するコンポーネントをインストールするために、カスタムイメージを作成する必要があります。

  • CUSTOM および DATALAKE クラスタータイプを使用する場合、まず EMR Gateway 環境を初期化する必要があります。クラスタータイプとバージョン番号を入力します。

    sh /home/admin/init_emr_component.sh DATALAKE EMR-バージョン番号
    説明

    EMR Gateway 環境の初期化に失敗した場合、クラスターのバージョンがイメージリポジトリにない可能性があります。サポートについては、チケットを起票してください。

dataworks_shell_jdk17_task_pod

DataWorks Shell ノードの公式イメージ。このイメージは JDK 17 を提供します。

Shell

dataworks_shell_task_pod

DataWorks Shell ノードの公式イメージ。このイメージは JDK 7 を提供します。Subprocess パラメーターの受け渡しをサポートするカスタムランタイム環境が必要な場合は、このイメージをベースにカスタムイメージを作成します。

dataworks_python_task_pod

DataWorks Python ノードの公式イメージ。このイメージは Python 3.7 を使用します。

Python

dataworks_cdh_custom_task_pod

DataWorks CDH クラスターのベースイメージ。このイメージは直接使用できません。Data Studio でイメージを使用する前に、カスタムイメージを作成して CDH parcel をインストールする必要があります。

CDH

dataworks_controller_task_pod

代入ノードの公式イメージ。カスタムランタイム環境で代入ノードまたは代入パラメーターを使用して子孫ノードにパラメーターを渡すには、このイメージをベースにカスタムイメージを作成します。

代入ノード

dataworks-mcp

DataWorks Agent タスクを開発するため。システム情報: py3.11-ubuntu22.04。

個人開発環境

dataworks-notebook

Notebook タスクを開発するため。システム情報: py3.11-ubuntu22.04。

dataworks_notebook_task_pod

DataWorks Notebook の Ubuntu イメージです。ロールインジェクションをサポートします。

dataworks-maxcompute

個人開発環境用の MaxCompute イメージを作成するため。システム情報: py3.11-ubuntu20.04。

イメージを使用する

Data Studio では、ワークスペースにアタッチされている公式イメージとカスタムイメージを使用できます。

  • 新しい Data Studio でイメージを使用する: ノード開発ページで、右側の [デバッグ設定] および [スケジューリング設定] ペインで、テスト実行および本番実行用の リソースグループイメージ を構成できます。

  • レガシー DataStudio でイメージを使用する: ノード開発ページで、[パラメーターを指定して実行] をクリックし、表示されるダイアログボックスで テスト実行本番実行リソースグループイメージ を構成できます。または、右側の [スケジューリング設定] ページで構成することもできます。

  • 個人開発環境でイメージを使用する: インスタンスを作成するときに、[イメージ設定] セクションで公式イメージを選択できます。

説明

リソースグループとイメージを構成する際は、次の点に注意してください:

  • スケジューリングリソースグループ: サーバーレスリソースグループを選択します。

  • イメージ: 公式イメージ または 公開済みのカスタムイメージ を選択します。