すべてのプロダクト
Search
ドキュメントセンター

DataWorks:チェックノード

最終更新日:Jun 11, 2026

DataWorks のチェックノードは、MaxCompute パーティションテーブル、FTP ファイル、OSS ファイル、HDFS ファイル、OSS-HDFS ファイル、またはリアルタイム同期タスクなどのターゲットオブジェクトの可用性を検証します。チェックノードは、チェックポリシーが満たされると成功します。タスクがターゲットオブジェクトに依存している場合は、チェックノードを使用してオブジェクトの可用性を検証し、そのタスクをチェックノードのダウンストリーム依存関係として設定します。チェックが成功すると、チェックノードも成功となり、ダウンストリームタスクがトリガーされます。このトピックでは、チェックノードがチェックできるオブジェクト、使用可能なポリシー、およびノードの設定方法について説明します。

サポートされているオブジェクトとチェックポリシー

チェックノードは、データソースとリアルタイム同期タスクのみをチェックできます。チェックポリシーは次のとおりです:

  • データソース

    • MaxCompute パーティションテーブルまたは DLF (Paimon パーティションテーブル)

      説明

      チェックノードは MaxCompute パーティションテーブル をサポートしますが、MaxCompute 非パーティションテーブル はサポートしていません。

      チェックノードは、MaxCompute パーティションテーブルのデータの準備が完了しているかどうかを判断するために、次の 2 つのチェックポリシーを提供します。

      • ポリシー 1: ターゲットパーティションが存在するかどうかをチェックする

        ターゲットパーティションが存在する場合、チェックノードはデータ生成が完了し、データが利用可能であると判断します。

      • ポリシー 2: ターゲットパーティションが指定期間内に更新されたかどうかをチェックする

        ターゲットパーティションが指定期間内に更新された場合、チェックノードはデータ生成が完了し、データが利用可能であると判断します。

    • FTP、OSS、HDFS、または OSS-HDFS ファイル

      ターゲットファイルが存在する場合、チェックノードはそれが利用可能であると判断します。

  • リアルタイム同期タスク

    チェックは、チェックノードのスケジューリング時刻に基づきます。その時刻までにリアルタイム同期タスクがデータの書き込みを完了している場合、チェックに合格します。

また、チェック間隔 (連続するチェック間の時間) と停止条件 (最大チェック数またはチェック期限) を指定する必要があります。最大チェック数に達した、またはチェック期限を過ぎたにもかかわらずチェックに合格しない場合、チェックノードは失敗します。これらのポリシーの設定方法については、「ステップ 2: チェックポリシーの設定」をご参照ください。

説明
  • チェックノードはターゲットオブジェクトを定期的にチェックします。チェックの想定開始時刻に基づいて、チェックノードのスケジューリング時刻を設定する必要があります。スケジューリング条件を満たすと、チェックノードは停止ポリシーに基づいてチェックに合格または失敗するまで、実行中のままです。スケジューリング設定の詳細については、「ステップ 3: タスクスケジューリングの設定」をご参照ください。

  • チェックノードは、チェックが完了するまでスケジューリングリソースを占有します。

制限事項

  • リソースグループの制約: チェックノードのタスクは、サーバーレスリソースグループでのみ実行できます。サーバーレスリソースグループの購入方法と使用方法については、「サーバーレスリソースグループの使用」をご参照ください。

  • データソースの制限: プロトコルSFTP に設定されており、キー 認証を使用するFTP データソースサポートされていません

  • ノード機能の制約

    • チェックノードでチェックできるオブジェクトは 1 つのみです。タスクが複数のオブジェクト (複数の MaxCompute パーティションテーブルなど) に依存している場合は、オブジェクトごとにチェックノードを作成してください。

    • チェックノードのチェック間隔は、130 分の範囲内である必要があります。

  • DataWorksエディションの制約: チェックノードは DataWorks Professional Edition 以降でのみ使用できます。以前のエディションを使用している場合は、アップグレードできます。詳細については、「DataWorksエディションの課金」をご参照ください。

  • サポートされているリージョン: チェックノードは、中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深圳)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、ドイツ (フランクフルト)、英国 (ロンドン)、米国 (シリコンバレー)、米国 (バージニア) リージョンのワークスペースで使用できます。

前提条件

  • チェックノードが データソース をチェックする場合、まずオブジェクトタイプに基づいて対応するデータソースを作成する必要があります。

    オブジェクトタイプ

    準備

    参照

    MaxCompute パーティションテーブル

    1. MaxCompute コンピュートエンジンが作成され、DataStudio にバインドされています。

      DataWorks で MaxCompute コンピュートエンジンを作成してバインドすると、MaxCompute データソースが自動的に作成されます。

    2. MaxCompute パーティションテーブルが存在する必要があります。

    FTP ファイル

    FTP データソースが存在する必要があります。

    DataWorks では、FTP サービスからデータにアクセスするには、そのサービスを FTP データソースとして登録する必要があります。

    FTP データソースの作成

    OSS ファイル

    OSS データソースが作成され、そのアクセスモードが [アクセスキー] に設定されています。

    DataWorks では、OSS バケット内のデータにアクセスするには、そのバケットを OSS データソースとして登録する必要があります。

    説明

    チェックノードは、RAM ロールベースの認可で設定された OSS データソースには対応していません。

    HDFS ファイル

    HDFS データソースが存在する必要があります。

    DataWorks では、HDFS サービス内のデータにアクセスするには、そのサービスを HDFS データソースとして登録する必要があります。

    HDFS データソースの作成

    OSS-HDFS ファイル

    OSS-HDFS データソースが存在する必要があります。

    DataWorks では、OSS-HDFS サービスのデータにアクセスするには、そのサービスを OSS-HDFS データソースとして登録する必要があります。

    OSS-HDFS データソースの追加

  • チェックノードが リアルタイム同期タスク をチェックする場合、Kafka から MaxCompute にデータを同期するタスクにのみ対応しています。チェックノードを使用する前に、リアルタイム同期タスクを作成してください。詳細については、「リアルタイム同期タスクの設定 (旧バージョン)」をご参照ください。

ステップ 1:チェックノードの作成

  1. DataStudioページに移動します。

    DataWorks コンソールにログインします。 左側のナビゲーションウィンドウで、[データモデリングと開発] > [DataStudio] を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[DataStudioに移動] をクリックします。

  2. image.png アイコンをクリックし、Create Node > General > Check Node を選択します。

    画面の指示に従って、ノードパスや名前などの情報を入力します。

ステップ 2:チェックポリシーの設定

ビジネス要件に応じて、チェックノードを設定してデータソースまたはリアルタイム同期タスクをチェックし、対応するポリシーを設定します。

データソース

MaxCompute パーティションテーブル

次の表にパラメーターを示します。

パラメーター

説明

[Data Source Type]

MaxCompute を選択します。

[Data Source Name]

チェック対象の MaxCompute パーティションテーブルが含まれるデータソース。

利用可能なデータソースがない場合は、New data source をクリックして作成します。詳細については、「MaxCompute コンピュートエンジンの追加」をご参照ください。

[Table Name]

チェック対象の MaxCompute パーティションテーブル。

説明

選択したデータソースから MaxCompute パーティションテーブルのみを選択できます。

[Partition]

チェック対象のテーブルパーティション。

Table Name パラメーターを設定した後、テーブル情報をプレビューしてパーティション名を表示できます。スケジューリングパラメーターを使用してパーティション名を取得することもできます。詳細については、「スケジューリングパラメーターのフォーマット」をご参照ください。

[Condition for Check Passing]

チェックに合格するための方法と条件。次の 2 つのチェック方法のいずれかを選択できます。

  • パーティションの存在:対象のパーティションが存在するかどうかをチェックします。

    • 存在:パーティションが存在する場合、チェックに合格し、プラットフォームはパーティションテーブルが利用可能であるとみなします。

    • 存在しない:パーティションが存在しない場合、チェックに合格します。

  • LastModifiedTime に基づく検証:対象のパーティションのデータが指定された期間内に更新されたかどうかをチェックします。

    • 更新なし:更新が発生しなかった場合、チェックに合格し、プラットフォームはパーティションのデータが完全に書き込まれ、パーティションテーブルが利用可能であるとみなします。

    • 更新あり:更新が発生した場合、チェックに合格します。

    説明
    • 更新のチェックは、5、10、15、20、25、または 30 分の期間内でのみ可能です。

    • LastModifiedTime の詳細については、「テーブルの変更時刻の変更」をご参照ください。

[Policy for Stopping Check]

チェックノードタスクの停止ポリシー。チェック期限または最大チェック数を設定し、チェック頻度を設定できます。

  • 期限の設定:期間とチェックを実行する間隔を指定します。指定された期間内にチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は、1~30 分である必要があります。

    • 上流タスクの遅延により、設定された期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

  • チェック回数の上限設定:最大チェック数とチェックを実行する間隔を指定します。最大試行回数を超えてもチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は 1 ~ 30 分の範囲である必要があります。

    • チェックノードタスクの最大実行時間は 24 時間 (1,440 分) です。最大チェック数はチェック間隔に依存します。たとえば、間隔が 5 分の場合、タスクは最大 288 回のチェックを実行できます。間隔が 10 分の場合、タスクは最大 144 回のチェックを実行できます。UI 上の実際の値が優先されます。

FTP ファイル

次の表にパラメーターを示します。

パラメーター

説明

[Data Source Type]

FTP を選択します。

[Data Source Name]

チェック対象の FTP ファイルが含まれるデータソース。

利用可能なデータソースがない場合は、New data source をクリックして作成します。詳細については、「FTP データソースの作成」をご参照ください。

[Object Path]

チェックする FTP ファイルのパス、たとえば/var/ftp/test/

このパスが存在する場合、その場所にファイルが存在すると見なされます。

パスを入力するか、スケジューリングパラメーターを使用してパスを取得できます。詳細については、「スケジューリングパラメーターのフォーマット」をご参照ください。

[Condition for Check Passing]

FTP ファイルのチェックに合格するための条件。

  • FTP ファイルが存在する場合、チェックに合格し、プラットフォームはファイルが利用可能であるとみなします。

  • FTP ファイルが存在しない場合、このチェックは失敗し、プラットフォームはファイルが利用不可であるとみなします。

[Policy for Stopping Check]

チェックノードタスクの停止ポリシー。チェック期限または最大チェック数を設定し、チェック頻度を設定できます。

  • 期限の設定:期間とチェックを実行する間隔を指定します。指定された期間内にチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は、1~30 分である必要があります。

    • 上流タスクの遅延により、設定された期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

  • チェック回数の上限設定:最大チェック数とチェックを実行する間隔を指定します。最大試行回数を超えてもチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は 1 ~ 30 分の範囲である必要があります。

    • チェックノードタスクの最大実行時間は 24 時間 (1,440 分) です。最大チェック数はチェック間隔に依存します。たとえば、間隔が 5 分の場合、タスクは最大 288 回のチェックを実行できます。間隔が 10 分の場合、タスクは最大 144 回のチェックを実行できます。UI 上の実際の値が優先されます。

OSS ファイル

[チェックオブジェクト][データソース] に、[チェック合格条件][ファイルが存在する] に設定します。[チェック停止ポリシー] では、[期限の設定] または [チェック回数の上限設定] を選択し、間隔、期限、またはチェック回数を設定できます。たとえば、チェック間隔を 5 分に設定できます。注:上流タスクの遅延により、設定されたチェック期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

次の表にパラメーターを示します。

パラメーター

説明

[Data Source Type]

OSS を選択します。

[Data Source Name]

チェック対象の OSS ファイルが存在するデータソース。

利用可能なデータソースがない場合は、New data source をクリックして作成します。詳細については、「OSS データソースの作成」をご参照ください。

[Object Path]

チェック対象の OSS ファイルのパス。OSS コンソールにログインし、対象バケットの詳細ページに移動し、File Management > Files > OSS Object ページでパスを表示できます。

説明

デフォルトでは、ノードは選択された OSS データソースのバケット情報を使用します。

パスを入力する際は、oss:// プレフィックスまたはバケット名含めないでください。また、パスをスラッシュ (/) で始めないことをお勧めします。

OSS ファイルパスのフォーマット

  • パスがスラッシュ (/) で終わる場合、チェックノードは OSS に同じ名前のフォルダーが存在するかどうかを検証します。

    例:user/ は、user という名前のフォルダーが存在するかどうかをチェックします。

  • パスがスラッシュ (/) で終わらない場合、チェックノードは OSS に同じ名前のファイルが存在するかどうかを検証します。

    例:user は、user という名前のファイルが存在するかどうかをチェックします。

フォルダーチェックの制限事項:フォルダーが存在するかどうかをチェックする必要がある場合は、次の点にご注意ください。

  • たとえば put /a/b/1.txt のようにファイルを直接アップロードしても、/a/a/b といったフォルダーは作成されず、/a/b/1.txt という名前のオブジェクトが作成されるだけです。 コンソールには仮想フォルダー /a/b/ が表示されますが、このフォルダーは実際には存在しないため、確認しても見つけることはできません。

  • 段階的なアップロードパス (たとえば put /aput /a/bput /a/b/1.txt) では、/a/a/b に 0 KB のフォルダーオブジェクトが作成されます。 ファイルとフォルダーオブジェクトの両方が作成されるため、フォルダーを確認すると、それらは存在します。

[Condition for Check Passing]

OSS ファイルのチェックに合格するための条件。

  • OSS ファイルが存在する場合、チェックに合格し、プラットフォームはファイルが利用可能であるとみなします。

  • OSS ファイルが存在しない場合、このチェックは失敗し、プラットフォームはファイルが利用不可であるとみなします。

[Policy for Stopping Check]

チェックノードタスクの停止ポリシー。チェック期限または最大チェック数を設定し、チェック頻度を設定できます。

  • 期限の設定:期間とチェックを実行する間隔を指定します。指定された期間内にチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は、1~30 分である必要があります。

    • 上流タスクの遅延により、設定された期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

  • チェック回数の上限設定:最大チェック数とチェックを実行する間隔を指定します。最大試行回数を超えてもチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は 1 ~ 30 分の範囲である必要があります。

    • チェックノードタスクの最大実行時間は 24 時間 (1,440 分) です。最大チェック数はチェック間隔に依存します。たとえば、間隔が 5 分の場合、タスクは最大 288 回のチェックを実行できます。間隔が 10 分の場合、タスクは最大 144 回のチェックを実行できます。UI 上の実際の値が優先されます。

HDFS ファイル

上流タスクの遅延により、設定されたチェック期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。次の表にパラメーターを示します。

パラメーター

説明

[Data Source Type]

HDFS を選択します。

[Data Source Name]

チェック対象の HDFS ファイルが存在するデータソース。

利用可能なデータソースがない場合は、New data source をクリックして作成します。詳細については、「HDFS データソースの作成」をご参照ください。

[Object Path]

チェックする HDFS ファイルのパス、たとえば/user/dw_test/dw

このパスが存在する場合、その場所にファイルが存在すると見なされます。

パスを入力するか、スケジューリングパラメーターを使用してパスを取得できます。詳細については、「スケジューリングパラメーターのフォーマット」をご参照ください。

[Condition for Check Passing]

HDFS ファイルのチェックに合格するための条件。

  • HDFS ファイルが存在する場合、チェックに合格し、プラットフォームはファイルが利用可能であるとみなします。

  • HDFS ファイルが存在しない場合、このチェックは失敗し、プラットフォームはファイルが利用不可であるとみなします。

[Policy for Stopping Check]

チェックノードタスクの停止ポリシー。チェック期限または最大チェック数を設定し、チェック頻度を設定できます。

  • 期限の設定:期間とチェックを実行する間隔を指定します。指定された期間内にチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は、1~30 分である必要があります。

    • 上流タスクの遅延により、設定された期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

  • チェック回数の上限設定:最大チェック数とチェックを実行する間隔を指定します。最大試行回数を超えてもチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は 1 ~ 30 分の範囲である必要があります。

    • チェックノードタスクの最大実行時間は 24 時間 (1,440 分) です。最大チェック数はチェック間隔に依存します。たとえば、間隔が 5 分の場合、タスクは最大 288 回のチェックを実行できます。間隔が 10 分の場合、タスクは最大 144 回のチェックを実行できます。UI 上の実際の値が優先されます。

OSS-HDFS ファイル

[チェックオブジェクト][データソース] に設定します。[チェック停止ポリシー] セクションで、[期限の設定] または [チェック回数の上限設定] を選択します。デフォルトでは、チェック間隔は 5 分です。上流タスクの遅延により、設定されたチェック期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。次の表にパラメーターを示します。

パラメーター

説明

[Data Source Type]

OSS-HDFS を選択します。

[Data Source Name]

チェック対象の OSS-HDFS ファイルが存在するデータソース。

利用可能なデータソースがない場合は、New data source をクリックして作成します。詳細については、「OSS-HDFS データソースの追加」をご参照ください。

[Object Path]

チェック対象の OSS-HDFS ファイルのパス。OSS コンソールにログインし、対象バケットの詳細ページに移動し、File Management > Files > [HDFS] ページでパスを表示できます。

OSS-HDFS ファイルパスのフォーマット:

  • ファイルパスが / で終わる場合、チェックノードは、OSS_HDFS に入力パスと同じ名前のフォルダーが存在するかどうかを確認します。

    たとえば、user/ は user フォルダーが存在するかどうかを確認します。

  • ファイルパスが / で終わらない場合、チェックノードは、OSS-HDFS に入力パスと同じ名前のファイルが存在するかどうかを確認します。

    たとえば、user はユーザーファイルが存在するかどうかをチェックします。

[Condition for Check Passing]

OSS-HDFS ファイルのチェックに合格するための条件。

  • OSS-HDFS ファイルが存在する場合、チェックに合格し、プラットフォームはファイルが利用可能であるとみなします。

  • OSS-HDFS ファイルが存在しない場合、このチェックは失敗し、プラットフォームはファイルが利用不可であるとみなします。

[Policy for Stopping Check]

チェックノードタスクの停止ポリシー。チェック期限または最大チェック数を設定し、チェック頻度を設定できます。

  • 期限の設定:期間とチェックを実行する間隔を指定します。指定された期間内にチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は、1~30 分である必要があります。

    • 上流タスクの遅延により、設定された期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

  • チェック回数の上限設定:最大チェック数とチェックを実行する間隔を指定します。最大試行回数を超えてもチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は 1 ~ 30 分の範囲である必要があります。

    • チェックノードタスクの最大実行時間は 24 時間 (1,440 分) です。最大チェック数はチェック間隔に依存します。たとえば、間隔が 5 分の場合、タスクは最大 288 回のチェックを実行できます。間隔が 10 分の場合、タスクは最大 144 回のチェックを実行できます。UI 上の実際の値が優先されます。

リアルタイム同期タスク

次の表にパラメーターを示します。

パラメーター

説明

[Check Object]

Real-time Synchronization Task を選択します。

[Real-time Synchronization Task]

チェック対象のリアルタイム同期タスク。

説明
  • Kafka から MaxCompute にデータを同期するタスクのみが対象です。

  • 既存のリアルタイム同期タスクを選択できない場合は、そのタスクが本番環境に公開されているかどうかを確認してください。

[Policy for Stopping Check]

チェックノードタスクの停止ポリシー。チェック期限または最大チェック数を設定し、チェック頻度を設定できます。

  • 期限の設定:期間とチェックを実行する間隔を指定します。指定された期間内にチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は、1~30 分である必要があります。

    • 上流タスクの遅延により、設定された期限を過ぎてからチェックノードが開始された場合でも、ノードは実行されますが、チェックは 1 回しか実行されません。

  • チェック回数の上限設定:最大チェック数とチェックを実行する間隔を指定します。最大試行回数を超えてもチェックに合格しない場合、タスクは自動的に停止し、失敗します。

    説明
    • チェック間隔は 1 ~ 30 分の範囲である必要があります。

    • チェックノードタスクの最大実行時間は 24 時間 (1,440 分) です。最大チェック数はチェック間隔に依存します。たとえば、間隔が 5 分の場合、タスクは最大 288 回のチェックを実行できます。間隔が 10 分の場合、タスクは最大 144 回のチェックを実行できます。UI 上の実際の値が優先されます。

ステップ 3:タスクスケジューリングの設定

チェックノードを使用してパーティションデータを定期的にチェックする必要がある場合は、ノード編集タブの右側のペインで Scheduling をクリックし、必要に応じてノードのスケジューリングプロパティを設定します。詳細については、「基本プロパティの設定」をご参照ください。

一般的な自動トリガーノードと同様に、チェックノードでも、スケジューリング依存関係やスケジューリング時間などのスケジューリングプロパティを設定する必要があります。DataWorks では、各ノードにアップストリーム依存関係が必要です。チェックノードに実際のアップストリーム依存関係がない場合は、ビジネスワークフローの複雑さに応じて、その依存関係をゼロロードノードまたはワークスペースのルートノードに設定できます。詳細については、「ゼロロードノードの作成」をご参照ください。

説明

ノードを送信する前に、プロパティの Rerun attributeParent Nodes を設定する必要があります。

ステップ 4: タスクの送信と発行

ノードタスクを設定した後、送信して発行する必要があります。タスクが発行されると、スケジューリング設定に基づいて定期的に実行されます。

  1. ツールバーの 保存 アイコンをクリックして、ノードを保存します。

  2. ツールバーの 提交 アイコンをクリックして、ノードタスクを送信します。

    Submission ダイアログボックスで、Change Description を入力します。ノードの送信後に、コードレビューとスモークテストを実行することもできます。

    説明
    • ノードを送信する前に、Rerun attributeParent Nodes のプロパティを設定する必要があります。

    • コードレビューは、タスクコードの品質管理に役立ち、レビューされていない誤ったコードが本番環境に発行されることで発生しうるエラーを防ぎます。コードレビューを有効にすると、送信されたコードは、発行される前にレビュアーが承認する必要があります。詳細については、「コードレビュー」をご参照ください。

    • スケジュールされたノードタスクが期待どおりに実行されることを確認するため、発行前にタスクのスモークテストを実行することを推奨します。詳細については、「スモークテスト」をご参照ください。

標準モードのワークスペースを使用している場合は、ノード編集タブの右上隅にある Deploy をクリックして、タスクを本番環境に発行する必要があります。詳細については、「タスクの発行」をご参照ください。

次のステップ

チェックノードがオペレーションセンターに送信・公開されると、その設定に基づいて定期的に実行されます。オペレーションセンターでは、チェック結果を表示し、関連する O&M オペレーションを実行できます。詳細については、「自動トリガーノードの基本的な O&M オペレーション」をご参照ください。