アラーム機能を使用すると、カスタムアラートルールを構成して、ノードのステータスとリソース使用量を監視できます。 この機能では、ノード間の依存関係が複雑なシナリオで、取得したいデータが期待どおりに生成されるように、インテリジェントベースラインを構成することもできます。 さらに、ビジネス要件に基づいてリソースグループのカスタム O&M ルールを構成し、リソースグループで実行されているノードインスタンスの自動 O&M を実装できます。
モジュール
次の表は、アラーム機能によって提供されるモジュールを示しています。
モジュール | 説明 |
ベースラインを使用すると、DataWorks はベースライン内のノードがスケジュールどおりに完了するのを妨げる例外を特定し、その例外に関するアラート通知をできるだけ早く送信できます。 これにより、ベースライン内のノード間の依存関係が複雑なシナリオで、取得したいデータが期待どおりに生成されます。 スマートベースラインページでは、次の操作を実行できます。
| |
オペレーションセンターページの左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、グローバルアラートルールを管理し、ビジネス要件に基づいてカスタムアラートルールを構成できます。
| |
オペレーションセンターページの左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、カスタムアラートルールに基づいて生成されたアラート、グローバルアラートルールに基づいて生成されたアラート、ベースラインアラートなど、アラートを表示できます。 | |
オペレーションセンターページの左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、カスタムシフトスケジュールを構成できます。 アラートルールの通知方法を指定する場合、シフトスケジュールを選択できます。 これにより、シフトスケジュールに基づいて、アラート通知を当番のエンジニアに送信できます。 説明 シフトスケジュールでは、プライマリとセカンダリの両方の当番エンジニアを構成できます。 デフォルトでは、アラート通知はプライマリの当番エンジニアに送信されます。 アラート通知が2回送信された後、プライマリの当番エンジニアがアラートを処理しない場合、後続のアラート通知はプライマリとセカンダリの両方の当番エンジニアに送信されます。 | |
ビジネス要件に基づいて、排他的リソースグループの O&M ルールを作成し、作成されたアラートルールに O&M ルールを関連付けることができます。 関連付けられたアラートルールがトリガーされると、DataWorks は、指定された排他的リソースグループで実行され、指定された [フィルター条件] を満たすノードインスタンスに対して自動 O&M を実行します。 説明 O&M ルールは、スケジューリングの排他的リソースグループ用に構成されたアラートルールにのみ関連付けることができます。 |
ノードステータス監視
監視対象オブジェクト
カスタムアラートルールとインテリジェントベースラインを構成して、リソース使用量と、自動トリガーノード、自動トリガーノードインスタンス、およびリアルタイムコンピューティングノードのステータスを監視できます。
自動トリガーノードのステータス
DataWorks は、毎晩 [自動トリガーノード] に対して翌日実行するようにスケジュールされている [自動トリガーノードインスタンス] を生成します。 DataWorks は、組み込みのグローバルアラートルールを提供して、[自動トリガーノード] を定期的に監視し、インスタンスが期待どおりに自動トリガーノードに対して生成およびスケジュールされるようにします。 例外が発生した場合、DataWorks はアラート通知を送信します。 組み込みのグローバルアラートルールは、ワークスペースレベルのアラートルールではありません。 これらのルールには、[孤立ノードのアラートルール] と [ループを形成するノードのアラートルール] が含まれます。
ルールタイプ
監視対象オブジェクト
トリガー条件
説明
グローバルアラートルール
孤立ノード: このタイプのノードは他のノードに依存しません。
孤立ノードが生成されると、アラート通知が自動的に送信されます。 できるだけ早くアラートを処理することをお勧めします。
説明DataWorks では、ワークスペースのルートノードを除き、作成した各自動トリガーノードには先祖ノードが必要です。 先祖ノードが自動トリガーノードに構成されていない場合、自動トリガーノードをスケジュールすることはできません。 孤立ノードは、自動的に実行するようにスケジュールすることはできません。 孤立ノードに多数の子孫ノードがある場合、深刻な結果が発生する可能性があります。
DataWorks は、毎日 09:00:00、12:00:00、および 16:00:00 に自動トリガーノードのステータスをスキャンします。 孤立ノードまたはノード依存関係ループが検出されると、DataWorks は指定された方法を使用してアラート通知を送信します。 ただし、スキャンの 10 分前に生成された例外は、現在のスキャンサイクルには含まれません。 これらの例外は、後続のスキャンサイクルに含まれます。
グローバルアラートルールは、DataWorks で自動的に作成される組み込みルールです。 グローバルアラートルールに基づいてアラートがトリガーされると、デフォルトでショートメッセージまたはメールでノードオーナーにアラート通知が送信されます。 [ルール管理] ページで、グローバルアラートルールのアラート連絡先を変更できます。
[ルール管理] ページで、グローバルアラートルールを無効にできます。
ループを形成するノード: このタイプのノードは、その子孫ノードに依存し、子孫ノードと依存関係ループを形成します。
ノード依存関係ループが形成されると、アラート通知が自動的に送信されます。 できるだけ早くアラートを処理することをお勧めします。
説明このタイプのノードは、自動的に実行するようにスケジュールすることはできません。
自動トリガーノードインスタンスのステータス
DataWorks では、自動トリガーノードが定期的にスケジュールされると、自動トリガーノードインスタンスが生成されます。 [自動トリガーノード] のカスタムアラートルールを構成して、[自動トリガーノードのインスタンス] のステータスを監視できます。 指定されたオブジェクトのカスタムアラートルールを構成し、重要なノードのインテリジェントベースラインを構成できます。
ルールタイプ
監視対象オブジェクト
トリガー条件
[ノード]、[ベースライン]、[ワークスペース]、または [ワークフロー] オブジェクトタイプのノード
指定されたオブジェクトタイプのノードが、[完了]、[未完了]、[エラー]、[サイクル内で未完了]、[時間超過]、および [ノードが自動的に再実行された後もエラーが続く] のいずれかの状態にある場合、アラート通知が送信されます。
ノードのオブジェクトタイプが [ワークスペース] で、ノードが [インスタンス生成] および [インスタンス数の変動] のいずれかの状態とその前の状態にある場合、アラート通知が送信されます。
ベースライン内のノードと、ベースライン内のノードのデータ生成に影響を与える先祖ノード
説明ベースラインの優先順位を指定して、ベースライン内のノードがスケジュールどおりに実行され、ノードのデータが期待どおりに生成されるようにすることができます。
自動トリガーノードが重要で、自動トリガーノードとその先祖ノード間の依存関係が複雑な場合は、自動トリガーノードを特定のベースラインに移動できます。
[ベースラインアラート]:
DataWorks が、コミットされた完了時刻までにベースライン内のノードの実行が完了できないと予測した場合、DataWorks は指定された通知方法を使用してベースラインアラート通知を送信します。 詳細については、「コアロジック: ベースラインアラート」をご参照ください。
[イベントアラート]:
ベースライン内のノードでエラーが報告された場合、ベースライン内のノードの先祖ノードでエラーが報告された場合、またはキークリエイトパス内のノードの速度が低下した場合、イベントが生成され、DataWorks はイベントアラート通知を送信します。 詳細については、「イベントの管理」をご参照ください。
リアルタイムコンピューティングノードのステータス
ルールタイプ: カスタムアラートルール
監視対象オブジェクト: リアルタイムコンピューティングノード
トリガー条件: リアルタイムコンピューティングノードで [エラー] が発生した場合、アラートが報告されます。
リソース使用量
ルールタイプ: カスタムアラートルール
監視対象オブジェクト: スケジューリングの排他的リソースグループと Data Integration の排他的リソースグループ
トリガー条件:
[リソースグループの使用量] パラメーターの値が特定の期間にわたって特定のパーセンテージを超えると、アラートが報告されます。
[リソースグループでリソースを待機しているインスタンスの数] パラメーターの値が特定の期間にわたって特定の数を超えると、アラートが報告されます。
通知方法
アラートルールを構成した後、DataWorks がアラートルールがトリガーされたことを検出すると、メール、ショートメッセージ、電話、または DingTalk メッセージなど、指定した通知方法を使用してアラート通知が送信されます。 これにより、問題をできるだけ早く特定してトラブルシューティングできます。
ルールタイプ | 通知方法 | アラート頻度制御 |
カスタムアラートルール、グローバルアラートルール、およびインテリジェントベースライン |
| [最大アラート数]、[最小アラート間隔]、および [クワイエットアワー] のパラメーターを使用して、アラート頻度を制御できます。 説明
|
スケジューリングの排他的リソースグループで実行されているノードインスタンスの自動 O&M
自動 O&M 機能を使用すると、DataWorks はスケジューリングの排他的リソースグループで実行されているノードインスタンスで O&M 操作を実行できます。 DataWorks は、作成した O&M ルールと、O&M ルールに関連付けられているアラートルールに基づいて O&M 操作を実行します。
トリガー条件: 関連付けられたアラートルールがトリガーされます。
説明[リソースグループのリソース使用量] と [リソースグループでリソースを待機しているノードインスタンスの数] が監視されます。
自動 O&M は、スケジューリングの排他的リソースグループで実行されているノードインスタンスに対してのみ実行できます。
自動 O&M を実行できるノードインスタンス: 次の [フィルター条件] を指定して、目的のノードインスタンスを検索できます: [インスタンスタイプ]、[スケジューリングサイクル]、[優先順位]、[ステータス]、および [ワークスペース]。
O&M 操作: 実行中のノードインスタンスを終了します。
説明一度に最大 2,000 個のノードインスタンスを終了できます。
アラート情報の表示
指定されたノードインスタンスに対して生成されたアラートに関する情報は、ノードインスタンスの有向非循環グラフ (DAG) またはインテリジェント診断ページで表示できます。
ノードインスタンスの DAG でアラート情報を表示する
アラートルールが構成されていて、現在の時点から 24 時間以内にアラートが生成されたノードインスタンスの場合、次の操作を実行してアラート情報を表示できます。オペレーションセンターページの左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、ノードインスタンスを見つけて、ノードインスタンスの DAG を開きます。 DAG ページで、ノードインスタンスの右上隅にある赤いドットをクリックします。 [監視の詳細] ペインで、インスタンスを生成する監視対象ノードが追加されているルールまたはベースラインを表示し、各ルールまたはベースラインのステータスを表示します。 赤いドットは、次の図の 2 でマークされた領域に表示されます。 また、[アラーム情報を表示] ペインの右上隅にある [監視の詳細] をクリックしてアラート管理ページに移動し、このページでアラートの詳細を表示することもできます。 さらに、[ルール/ベースライン名] 列のルールの名前をクリックしてルール管理ページに移動し、ルールの構成の詳細を表示することもできます。
説明次の図の 1 でマークされた領域にある [過去 24 時間にアラームを生成したノード] チェックボックスをオンにして、目的のノードインスタンスを検索できます。

インテリジェント診断ページでアラート情報を表示する
アラートルールが構成されているノードの場合、次の操作を実行して、ノードに対して生成されたインスタンスに関するアラート情報を表示できます。 [インテリジェント診断] ページに移動します。 目的のノードインスタンスを見つけてクリックします。 表示されるページのエンドツーエンド診断タブで、プロンプトメッセージの横にある [詳細を表示] をクリックします。 [監視の詳細] ペインで、インスタンスを生成する監視対象ノードが追加されているルールまたはベースラインを表示し、各ルールまたはベースラインのステータスを表示します。 また、[アラーム情報を表示] ペインの右上隅にある [監視の詳細] をクリックしてアラート管理ページに移動し、このページでアラートの詳細を表示することもできます。 さらに、[ルール/ベースライン名] 列のルールの名前をクリックしてルール管理ページに移動し、ルールの構成の詳細を表示することもできます。

アラート管理ページでアラート情報を表示する
アラート管理ページで生成されたすべてのアラートを表示し、「アラームの詳細」ページでアラートの詳細(アラートをトリガーしたアラートルール、トリガー条件、アラートの原因など)を表示できます。 詳細については、「アラート詳細の表示」をご参照ください。
