すべてのプロダクト
Search
ドキュメントセンター

DataWorks:タスク監視

最終更新日:Apr 08, 2025

アラーム機能を使用すると、カスタムアラートルールを構成して、ノードのステータスとリソース使用量を監視できます。 この機能では、ノード間の依存関係が複雑なシナリオで、取得したいデータが期待どおりに生成されるように、インテリジェントベースラインを構成することもできます。 さらに、ビジネス要件に基づいてリソースグループのカスタム O&M ルールを構成し、リソースグループで実行されているノードインスタンスの自動 O&M を実装できます。

モジュール

次の表は、アラーム機能によって提供されるモジュールを示しています。

モジュール

説明

スマートベースライン

ベースラインを使用すると、DataWorks はベースライン内のノードがスケジュールどおりに完了するのを妨げる例外を特定し、その例外に関するアラート通知をできるだけ早く送信できます。 これにより、ベースライン内のノード間の依存関係が複雑なシナリオで、取得したいデータが期待どおりに生成されます。 スマートベースラインページでは、次の操作を実行できます。

  • ベースラインを作成および管理します。 詳細については、「ベースラインの管理」をご参照ください。

  • ベースラインインスタンスと特定のベースラインインスタンスの詳細を表示します。 詳細については、「ベースラインインスタンスの管理」をご参照ください。

  • イベントと特定のイベントの詳細を表示します。 詳細については、「イベントの管理」をご参照ください。

ルール管理

オペレーションセンターページの左側のナビゲーションウィンドウで、[アラーム] > [ルール管理] を選択します。 表示されるページで、グローバルアラートルールを管理し、ビジネス要件に基づいてカスタムアラートルールを構成できます。

  • グローバルアラートルール: DataWorks は、組み込みのグローバルアラートルールを提供して、自動トリガーノードのステータスを監視します。 これにより、自動トリガーノードで発生する例外が、自動トリガーノードインスタンスのスケジューリングと実行に影響を与えるのを防ぎます。 組み込みのグローバルアラートルールは、ワークスペースレベルのアラートルールではありません。 詳細については、「自動トリガーノードのステータス監視」をご参照ください。

  • カスタムアラートルール:

    • DataWorks では、自動トリガーノードが定期的にスケジュールされると、自動トリガーノードインスタンスが生成されます。 [自動トリガーノード] のカスタムアラートルールを構成して、自動トリガーノードインスタンスのステータスを監視できます。 詳細については、「自動トリガーノードインスタンスのステータス監視」をご参照ください。

    • リアルタイムコンピューティングノードのカスタムアラートルールを構成して、ノードのステータスを監視できます。 リアルタイムコンピューティングノードのカスタムアラートルールを構成する場合は、[オブジェクト] パラメーターを [リアルタイムコンピューティングノード] に設定する必要があります。 詳細については、「リアルタイムコンピューティングノードのステータス監視」をご参照ください。

    • 排他的リソースグループのカスタムアラートルールを構成して、排他的リソースグループのリソース使用量を監視できます。 排他的リソースグループのカスタムアラートルールを構成する場合は、[オブジェクトタイプ] パラメーターを [Data Integration の排他的リソースグループ] または [スケジューリングの排他的リソースグループ] に設定する必要があります。 詳細については、「リソース使用量」をご参照ください。

アラート管理

オペレーションセンターページの左側のナビゲーションウィンドウで、[アラーム] > [アラート管理] を選択します。 表示されるページで、カスタムアラートルールに基づいて生成されたアラート、グローバルアラートルールに基づいて生成されたアラート、ベースラインアラートなど、アラートを表示できます。

スケジュール

オペレーションセンターページの左側のナビゲーションウィンドウで、[アラーム] > [スケジュール] を選択します。 表示されるページで、カスタムシフトスケジュールを構成できます。 アラートルールの通知方法を指定する場合、シフトスケジュールを選択できます。 これにより、シフトスケジュールに基づいて、アラート通知を当番のエンジニアに送信できます。

説明

シフトスケジュールでは、プライマリとセカンダリの両方の当番エンジニアを構成できます。 デフォルトでは、アラート通知はプライマリの当番エンジニアに送信されます。 アラート通知が2回送信された後、プライマリの当番エンジニアがアラートを処理しない場合、後続のアラート通知はプライマリとセカンダリの両方の当番エンジニアに送信されます。

自動

ビジネス要件に基づいて、排他的リソースグループの O&M ルールを作成し、作成されたアラートルールに O&M ルールを関連付けることができます。 関連付けられたアラートルールがトリガーされると、DataWorks は、指定された排他的リソースグループで実行され、指定された [フィルター条件] を満たすノードインスタンスに対して自動 O&M を実行します。

説明

O&M ルールは、スケジューリングの排他的リソースグループ用に構成されたアラートルールにのみ関連付けることができます。

ノードステータス監視

監視対象オブジェクト

カスタムアラートルールとインテリジェントベースラインを構成して、リソース使用量と、自動トリガーノード、自動トリガーノードインスタンス、およびリアルタイムコンピューティングノードのステータスを監視できます。

  • 自動トリガーノードのステータス

    DataWorks は、毎晩 [自動トリガーノード] に対して翌日実行するようにスケジュールされている [自動トリガーノードインスタンス] を生成します。 DataWorks は、組み込みのグローバルアラートルールを提供して、[自動トリガーノード] を定期的に監視し、インスタンスが期待どおりに自動トリガーノードに対して生成およびスケジュールされるようにします。 例外が発生した場合、DataWorks はアラート通知を送信します。 組み込みのグローバルアラートルールは、ワークスペースレベルのアラートルールではありません。 これらのルールには、[孤立ノードのアラートルール][ループを形成するノードのアラートルール] が含まれます。

    ルールタイプ

    監視対象オブジェクト

    トリガー条件

    説明

    グローバルアラートルール

    孤立ノード: このタイプのノードは他のノードに依存しません。

    孤立ノードが生成されると、アラート通知が自動的に送信されます。 できるだけ早くアラートを処理することをお勧めします。

    説明

    DataWorks では、ワークスペースのルートノードを除き、作成した各自動トリガーノードには先祖ノードが必要です。 先祖ノードが自動トリガーノードに構成されていない場合、自動トリガーノードをスケジュールすることはできません。 孤立ノードは、自動的に実行するようにスケジュールすることはできません。 孤立ノードに多数の子孫ノードがある場合、深刻な結果が発生する可能性があります。

    • DataWorks は、毎日 09:00:00、12:00:00、および 16:00:00 に自動トリガーノードのステータスをスキャンします。 孤立ノードまたはノード依存関係ループが検出されると、DataWorks は指定された方法を使用してアラート通知を送信します。 ただし、スキャンの 10 分前に生成された例外は、現在のスキャンサイクルには含まれません。 これらの例外は、後続のスキャンサイクルに含まれます。

    • グローバルアラートルールは、DataWorks で自動的に作成される組み込みルールです。 グローバルアラートルールに基づいてアラートがトリガーされると、デフォルトでショートメッセージまたはメールでノードオーナーにアラート通知が送信されます。 [ルール管理] ページで、グローバルアラートルールのアラート連絡先を変更できます。

    • [ルール管理] ページで、グローバルアラートルールを無効にできます。

    ループを形成するノード: このタイプのノードは、その子孫ノードに依存し、子孫ノードと依存関係ループを形成します。

    ノード依存関係ループが形成されると、アラート通知が自動的に送信されます。 できるだけ早くアラートを処理することをお勧めします。

    説明

    このタイプのノードは、自動的に実行するようにスケジュールすることはできません。

  • 自動トリガーノードインスタンスのステータス

    DataWorks では、自動トリガーノードが定期的にスケジュールされると、自動トリガーノードインスタンスが生成されます。 [自動トリガーノード] のカスタムアラートルールを構成して、[自動トリガーノードのインスタンス] のステータスを監視できます。 指定されたオブジェクトのカスタムアラートルールを構成し、重要なノードのインテリジェントベースラインを構成できます。

    ルールタイプ

    監視対象オブジェクト

    トリガー条件

    カスタムアラートルール

    [ノード][ベースライン][ワークスペース]、または [ワークフロー] オブジェクトタイプのノード

    • 指定されたオブジェクトタイプのノードが、[完了][未完了][エラー][サイクル内で未完了][時間超過]、および [ノードが自動的に再実行された後もエラーが続く] のいずれかの状態にある場合、アラート通知が送信されます。

    • ノードのオブジェクトタイプが [ワークスペース] で、ノードが [インスタンス生成] および [インスタンス数の変動] のいずれかの状態とその前の状態にある場合、アラート通知が送信されます。

    インテリジェントベースライン

    ベースライン内のノードと、ベースライン内のノードのデータ生成に影響を与える先祖ノード

    説明
    • ベースラインの優先順位を指定して、ベースライン内のノードがスケジュールどおりに実行され、ノードのデータが期待どおりに生成されるようにすることができます。

    • 自動トリガーノードが重要で、自動トリガーノードとその先祖ノード間の依存関係が複雑な場合は、自動トリガーノードを特定のベースラインに移動できます。

    • [ベースラインアラート]:

      DataWorks が、コミットされた完了時刻までにベースライン内のノードの実行が完了できないと予測した場合、DataWorks は指定された通知方法を使用してベースラインアラート通知を送信します。 詳細については、「コアロジック: ベースラインアラート」をご参照ください。

    • [イベントアラート]:

      ベースライン内のノードでエラーが報告された場合、ベースライン内のノードの先祖ノードでエラーが報告された場合、またはキークリエイトパス内のノードの速度が低下した場合、イベントが生成され、DataWorks はイベントアラート通知を送信します。 詳細については、「イベントの管理」をご参照ください。

  • リアルタイムコンピューティングノードのステータス

    • ルールタイプ: カスタムアラートルール

    • 監視対象オブジェクト: リアルタイムコンピューティングノード

    • トリガー条件: リアルタイムコンピューティングノードで [エラー] が発生した場合、アラートが報告されます。

  • リソース使用量

    • ルールタイプ: カスタムアラートルール

    • 監視対象オブジェクト: スケジューリングの排他的リソースグループと Data Integration の排他的リソースグループ

    • トリガー条件:

      • [リソースグループの使用量] パラメーターの値が特定の期間にわたって特定のパーセンテージを超えると、アラートが報告されます。

      • [リソースグループでリソースを待機しているインスタンスの数] パラメーターの値が特定の期間にわたって特定の数を超えると、アラートが報告されます。

通知方法

アラートルールを構成した後、DataWorks がアラートルールがトリガーされたことを検出すると、メール、ショートメッセージ、電話、または DingTalk メッセージなど、指定した通知方法を使用してアラート通知が送信されます。 これにより、問題をできるだけ早く特定してトラブルシューティングできます。

ルールタイプ

通知方法

アラート頻度制御

カスタムアラートルール、グローバルアラートルール、およびインテリジェントベースライン

  • アラート通知は、[メール][ショートメッセージ]、または [電話] によって、ノードオーナー、指定されたオーナー、またはシフトスケジュール内の当番エンジニアなどの指定された担当者に送信できます。 中国本土の電話番号を使用して送信されるアラート通知のみがサポートされています。

  • アラート通知は、[DingTalk チャットボット] または [Webhook URL] によって DingTalk グループに送信できます。

    説明
    • DataWorks Basic Edition は、グループベースの Webhook URL に基づく DingTalk、Lark、および WeCom へのアラート通知をサポートしています。

    • Basic Edition でのグループベースの Webhook URL に基づくアラート通知の送信機能に加えて、DataWorks Enterprise Edition では、カスタム Webhook URL を構成してアラート通知を送信することもできます。

    • カスタム Webhook を構成する場合は、アプリケーションのリンクをクリックするか、プリセールスまたはアフターサービスの DataWorks DingTalk グループに参加できます。 DingTalk グループに参加すると、DingTalk チャットボットに直接連絡するか、当番の技術担当者に連絡できます。 次の図は、DataWorks DingTalk グループの QR コードを示しています。 技术支持二维码

[最大アラート数][最小アラート間隔]、および [クワイエットアワー] のパラメーターを使用して、アラート頻度を制御できます。

説明
  • 最大アラート数: 送信できるアラート通知の最大数。 送信されるアラート通知の数が指定されたしきい値を超えると、アラート通知は送信されなくなります。

  • 最小アラート間隔: アラート通知が送信される最小間隔。 アラートが報告されたノードがこのパラメーターで指定された期間中に正常になると、アラート通知は送信されなくなります。

  • クワイエットアワー: このパラメーターで指定された期間中は、アラート通知は送信されません。

    たとえば、ノードの「トリガー条件」パラメーターを [時間超過][エラー]、および [未完了] に設定し、「クワイエットアワー」パラメーターを 00:00 から 08:00 までの期間に設定します。 この期間中に、ノードがタイムアウトしたり、ノードでエラーが発生したり、ノードが完了しなかったりした場合、DataWorks はアラート通知を送信しません。 08:00 以降も例外が存在する場合、DataWorks はアラート通知を送信します。

スケジューリングの排他的リソースグループで実行されているノードインスタンスの自動 O&M

自動 O&M 機能を使用すると、DataWorks はスケジューリングの排他的リソースグループで実行されているノードインスタンスで O&M 操作を実行できます。 DataWorks は、作成した O&M ルールと、O&M ルールに関連付けられているアラートルールに基づいて O&M 操作を実行します。

  • トリガー条件: 関連付けられたアラートルールがトリガーされます。

    説明
    • [リソースグループのリソース使用量][リソースグループでリソースを待機しているノードインスタンスの数] が監視されます。

    • 自動 O&M は、スケジューリングの排他的リソースグループで実行されているノードインスタンスに対してのみ実行できます。

  • 自動 O&M を実行できるノードインスタンス: 次の [フィルター条件] を指定して、目的のノードインスタンスを検索できます: [インスタンスタイプ][スケジューリングサイクル][優先順位][ステータス]、および [ワークスペース]

  • O&M 操作: 実行中のノードインスタンスを終了します。

    説明

    一度に最大 2,000 個のノードインスタンスを終了できます。

アラート情報の表示

指定されたノードインスタンスに対して生成されたアラートに関する情報は、ノードインスタンスの有向非循環グラフ (DAG) またはインテリジェント診断ページで表示できます。

  • ノードインスタンスの DAG でアラート情報を表示する

    アラートルールが構成されていて、現在の時点から 24 時間以内にアラートが生成されたノードインスタンスの場合、次の操作を実行してアラート情報を表示できます。オペレーションセンターページの左側のナビゲーションウィンドウで、[自動トリガーノード O&M] > [自動トリガータスク] を選択します。 表示されるページで、ノードインスタンスを見つけて、ノードインスタンスの DAG を開きます。 DAG ページで、ノードインスタンスの右上隅にある赤いドットをクリックします。 [監視の詳細] ペインで、インスタンスを生成する監視対象ノードが追加されているルールまたはベースラインを表示し、各ルールまたはベースラインのステータスを表示します。 赤いドットは、次の図の 2 でマークされた領域に表示されます。 また、[アラーム情報を表示] ペインの右上隅にある [監視の詳細] をクリックしてアラート管理ページに移動し、このページでアラートの詳細を表示することもできます。 さらに、[ルール/ベースライン名] 列のルールの名前をクリックしてルール管理ページに移動し、ルールの構成の詳細を表示することもできます。

    説明

    次の図の 1 でマークされた領域にある [過去 24 時間にアラームを生成したノード] チェックボックスをオンにして、目的のノードインスタンスを検索できます。

    报警信息

  • インテリジェント診断ページでアラート情報を表示する

    アラートルールが構成されているノードの場合、次の操作を実行して、ノードに対して生成されたインスタンスに関するアラート情報を表示できます。 [インテリジェント診断] ページに移動します。 目的のノードインスタンスを見つけてクリックします。 表示されるページのエンドツーエンド診断タブで、プロンプトメッセージの横にある [詳細を表示] をクリックします。 [監視の詳細] ペインで、インスタンスを生成する監視対象ノードが追加されているルールまたはベースラインを表示し、各ルールまたはベースラインのステータスを表示します。 また、[アラーム情報を表示] ペインの右上隅にある [監視の詳細] をクリックしてアラート管理ページに移動し、このページでアラートの詳細を表示することもできます。 さらに、[ルール/ベースライン名] 列のルールの名前をクリックしてルール管理ページに移動し、ルールの構成の詳細を表示することもできます。运行诊断

  • アラート管理ページでアラート情報を表示する

    アラート管理ページで生成されたすべてのアラートを表示し、「アラームの詳細」ページでアラートの詳細(アラートをトリガーしたアラートルール、トリガー条件、アラートの原因など)を表示できます。 詳細については、「アラート詳細の表示」をご参照ください。