カスタムアラートルールを使用すると、ビジネス要件に基づいて、指定されたノードのステータスまたはリソース使用状況を監視できます。 これにより、例外を早期に特定して処理できます。 このトピックでは、ルール管理ページでカスタムアラートルールを作成する方法について説明します。 また、DingTalk チャットボットを追加する方法と、チャットボットの webhook URL を取得する方法についても説明します。
制限
カスタムアラートルールは、[自動トリガーノードインスタンス] にのみ有効です。 自動トリガーノードに対して生成されたテストインスタンスとデータバックフィルインスタンスの結果は監視されません。
カスタムアラートルールでは、次のアラート通知方法がサポートされています。[メール]、[ショートメッセージ]、[電話]、[DingTalk チャットボット]、[Webhook URL]。 サポートされているアラート通知方法の次の制限事項に注意してください。
[電話]:電話によるアラートは、中国本土の携帯電話番号に対してのみサポートされています。
[Webhook URL]:
DataWorks Basic Edition では、グループベースの webhook URL に基づいて、DingTalk、Lark、WeCom へのアラート通知がサポートされています。
DataWorks Enterprise Edition では、Basic Edition のグループベースの webhook URL に基づいてアラート通知を送信する機能に加えて、カスタム webhook URL を構成してアラート通知を送信することもできます。
説明カスタム webhook の構成方法については、「インテリジェントモニタリング:カスタム webhook を使用して送信されるアラートメッセージの形式」をご参照ください。 構成が完了したら、チケットを送信して、Alibaba Cloud DataWorks テクニカルサポートに連絡して、さらに処理を進めてください。
[エラーのあるインスタンス、エラーのあるインスタンスの割合、ノードログにキーワードが含まれる] などのトリガー条件は、DataWorks Professional Edition 以降のエディションでのみ構成できます。 詳細については、「DataWorks エディション間の違い」をご参照ください。 DataWorks をアクティブ化する方法については、「購入ガイド」をご参照ください。
アラートルールを変更できるのは、ルール所有者、テナント管理者、Alibaba Cloud アカウントのみです。
注意事項
次の表は、カスタムアラートルールを使用して自動トリガーノードインスタンスを監視する場合の、さまざまなアラートトリガー条件に対応する監視時間範囲を示しています。
監視時間範囲 | トリガー条件 | 説明 |
データタイムスタンプ(前日、T で表される) |
| DataWorks は、データタイムスタンプが前日でスケジュール時間が当日である自動トリガーノードインスタンスを監視します。 トリガー条件のいずれかが満たされると、アラートが報告されます。 |
データタイムスタンプ(前日、T で表される)と前日の前日(T-1 で表される) |
| DataWorks は、データタイムスタンプが前日でスケジュール時間が当日である自動トリガーノードインスタンスと、データタイムスタンプが前日の前日でスケジュール時間が前日である自動トリガーノードインスタンスを監視します。 トリガー条件のいずれかが満たされると、アラートが報告されます。 |
データタイムスタンプ(前日、T で表される)、前日の前日(T-1 で表される)、前日の2日前(T-2 で表される) |
| DataWorks は、次の自動トリガーノードインスタンスを監視します。データタイムスタンプが前日でスケジュール時間が当日である自動トリガーノードインスタンス、データタイムスタンプが前日の前日でスケジュール時間が前日である自動トリガーノードインスタンス、データタイムスタンプが前日の2日前でスケジュール時間が前日の前日である自動トリガーノードインスタンス。 トリガー条件のいずれかが満たされると、アラートが報告されます。 |
必要な時間範囲内にない自動トリガーノードインスタンスの場合、インスタンスがトリガー条件を満たしていてもアラートは報告されません。 さまざまなトリガー条件に対応する監視ルールの詳細については、このトピックのカスタムアラートルールの作成セクションをご参照ください。
ルール管理ページに移動する
オペレーションセンターページに移動します。
DataWorks コンソール にログインします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[オペレーションセンターに移動] をクリックします。
オペレーションセンターページの左側のナビゲーションウィンドウで、 を選択します。
説明自動トリガーノードページに移動し、複数のノードを選択して、下部にある [アクション] > [アラートルールの追加] を選択して、ノードのカスタムアラートルールを作成することもできます。 詳細については、「自動トリガータスクの表示と管理」をご参照ください。
カスタムアラートルールの作成
ルール管理ページで、ビジネス要件に基づいてカスタムアラートルールを作成できます。
基本情報セクションのパラメーターを構成する
パラメーター | 説明 |
[ルール名] | カスタムアラートルールの名前。 |
[オブジェクトタイプ] | 監視するオブジェクトのタイプ。 有効値:[ノード]、[ベースライン]、[ワークスペース]、[ワークフロー]、[スケジューリング専用の排他的リソースグループ]、[Data Integration 専用の排他的リソースグループ]。 説明 このパラメーターが [ベースライン] に設定されている場合、指定されたベースラインに属するノードのステータスのみを監視できます。 ベースラインに属するノードの祖先ノードのステータスも監視する場合は、「概要」をご参照ください。 |
[ルールオブジェクト] | 監視するオブジェクト。 監視するオブジェクトを追加するには、[ルールオブジェクト] フィールドにオブジェクトの名前または ID を入力し、表示されるオブジェクトを選択して、[追加] をクリックします。 次のタイプのオブジェクトを追加できます。 追加できるオブジェクトの最大数は、選択したオブジェクトタイプによって異なります。
|
[ホワイトリストに追加] | 監視範囲内にあるが、監視したくないノードを指定します。 このパラメーターは、[オブジェクトタイプ] パラメーターを [ベースライン]、[ワークスペース]、または [ワークフロー] に設定した場合にのみ必須です。 ノードをホワイトリストに追加するには、[ホワイトリストに追加] フィールドにノードの名前または ID を入力し、[追加] をクリックします。 説明 ホワイトリストには最大 50 個のノードを追加できます。 ホワイトリストに追加したノードは監視されません。 |
[リソースグループ名] | 監視する排他的リソースグループの名前。 このパラメーターは、[オブジェクトタイプ] パラメーターを [スケジューリング専用の排他的リソースグループ] または [Data Integration 専用の排他的リソースグループ] に設定した場合にのみ必須です。 |
トリガー条件セクションのパラメーターを構成する
カスタムアラートルールのロジックでは、ノードがフリーズ状態にある場合、ノードは完了と見なされます。
オブジェクトタイプ | トリガー条件 | 説明 |
[ノード]、[ベースライン]、[ワークスペース]、または [ワークフロー] | [完了] | ノードは、実行開始時から監視されます。 ノードが正常に実行されると、アラートが報告されます。
説明 1 時間ごとに実行するようにスケジュールされているノードの場合、ノードはすべてのサイクルで正常に実行された後にのみ完了と見なされます。 |
[未完了] | ノードは、実行開始時から監視されます。 指定された時点でノードがまだ実行されている場合、アラートが報告されます。 説明 このトリガー条件タイプのアラートルールは、インテリジェントベースライン機能を使用して提供されるアラートポリシーとは異なります。 インテリジェントベースライン機能を使用すると、ベースライン内のノードが時間どおりに完了できない原因となる例外を検出できます。 例外が検出されると、システムは例外に関するアラート通知をできるだけ早く送信します。 詳細については、「概要」をご参照ください。 シナリオ例:
説明 1 時間ごとまたは 1 分ごとに実行するようにスケジュールされているノードの場合、システムは、当日のすべてのサイクルで指定された時点でノードが完了しているかどうかを確認します。 | |
[エラー] | ノードは、実行開始時から監視されます。 ノードの実行中にエラーが発生した場合、アラートが報告されます。 説明 ノードインスタンスでエラーが発生した場合、[運用センター] の [自動トリガーノード O&M] 配下にある [自動トリガーインスタンス] ページの General 列に
| |
[エラーのあるインスタンス] | 当日にエラーが発生したインスタンスの数が指定されたしきい値に達した場合、アラートが報告されます。 エラーは、データ品質チェックの失敗、またはコードロジックの実行の失敗である可能性があります。 [オブジェクトタイプ] パラメーターが [ワークスペース] に設定され、[トリガー条件] パラメーターが [エラーのあるインスタンス] に設定されている場合、しきい値を指定する必要があります。 説明
| |
[エラーのあるインスタンスの割合] | ワークスペースでエラーが発生したインスタンス数の当日インスタンスの総数に対する割合が指定されたしきい値に達した場合、アラートが報告されます。 [オブジェクトタイプ] パラメーターが [ワークスペース] に設定され、[トリガー条件] パラメーターが [エラーのあるインスタンスの割合] に設定されている場合、しきい値を指定する必要があります。 説明
| |
[ノードログにキーワードが含まれる] | 当日にノードの実行ログにキーワードが含まれている場合、アラートが報告されます。 [オブジェクトタイプ] パラメーターが [ワークスペース] に設定され、[トリガー条件] パラメーターが [ノードログにキーワードが含まれる] に設定されている場合、キーワードを指定する必要があります。 説明
| |
[サイクル内で未完了] | 指定されたサイクルの終わりにノードがまだ実行されている場合、アラートが報告されます。 ほとんどの場合、このトリガー条件は、1 時間ごとに実行するようにスケジュールされているノードインスタンスに対して構成できます。 ワークフローに対して [トリガー条件] パラメーターが [サイクル内で未完了] に設定されている場合、システムは、指定したサイクル数(N)に基づいて、ワークフロー内で日、時間、または分ごとに実行するようにスケジュールされているノードを監視します。 ノードのノードインスタンスの数が N 未満の場合、システムはノードに対して報告されたアラートを無視します。 たとえば、サイクル数を 3 に設定し、ワークフローに 2 つのノードが含まれているとします。 次の例は、アラートと監視の詳細を示しています。
| |
[タイムアウト] | ノードは、実行開始時から監視されます。 指定された期間が終了した後もノードがまだ実行されている場合、アラートが報告されます。 ほとんどの場合、このトリガー条件を構成して、ノードの期間を監視できます。 | |
[ノードの自動再実行後もエラーが持続する] | ノードは、実行開始時から監視されます。 ノードの再実行後もエラーが持続する場合、アラートが報告されます。 説明 ノードの実行中にエラーが発生するたびにアラートを報告する場合は、トリガー条件を [エラー] に設定できます。 | |
[インスタンスが生成された] | [オブジェクトタイプ] パラメーターが [ワークスペース] に設定されている場合にのみ、トリガー条件を [インスタンスが生成された] に設定できます。 | |
[インスタンス数の変動] | [オブジェクトタイプ] パラメーターが [ワークスペース] に設定されている場合にのみ、トリガー条件を [インスタンス数の変動] に設定できます。 DataWorks は、毎日 24:00 より前に翌日に実行する必要がある自動トリガーノードインスタンスを生成します。 ワークスペースで生成される自動トリガーノードインスタンスの数が、ワークスペースで履歴的に生成される自動トリガーノードインスタンスの平均数と比較して大幅に変動すると、アラートが報告されます。 | |
[スケジューリング専用の排他的リソースグループ] または [Data Integration 専用の排他的リソースグループ] | [リソースグループの使用率] | [リソースグループの使用率] パラメーターの値が特定の期間に特定のパーセンテージを超えると、アラートが報告されます。 例:[リソースグループの使用率] パラメーターの値が 15 分間 50% を超えると、アラートが報告されます。 |
[リソースグループでリソースを待機しているインスタンスの数] | [リソースグループでリソースを待機しているインスタンスの数] パラメーターの値が特定の期間に特定の数を超えると、アラートが報告されます。 例:[リソースグループでリソースを待機しているインスタンスの数] パラメーターの値が 15 分間 10 を超えると、アラートが報告されます。 |
アラート詳細セクションのパラメーターを構成する
アラート通知方法 | アラート連絡先 | 説明 |
[メール]、[SMS][、または電話] | [アラート連絡先] には、[ノード所有者]、[シフトスケジュール]、または [その他] を選択できます。 |
|
[DingTalk チャットボット] または [WebHook] | グループのメンバーを指定できます。 |
|
アラート頻度制御セクションのパラメーターを設定する
パラメーター | 説明 |
最大アラート数 | アラートが報告される最大回数です。アラートが報告された回数が指定されたしきい値を超えると、アラートは報告されなくなります。 |
最小アラート間隔 | アラートが報告される最小間隔です。 |
アラート通知の送信不可期間 | システムは、このパラメーターで指定された期間中はアラート通知を送信しません。 たとえば、「トリガー条件」パラメーターをノードに対して [タイムアウト]、[エラー]、または [未完了] に設定し、「アラート通知の送信不可期間」パラメーターを |
[OK] をクリックします。アラートルールが作成されます。 [ルール管理] ページで、ルールに対応する「アクション」列の [詳細の表示]、[無効化、有効化]、または [削除] をクリックして、関連する操作を実行できます。
詳細の表示: 必要なルールの基本情報を表示します。
有効化 または 無効化: ルールを有効または無効にします。ルールを有効にして、ルールが設定されているノードのステータスを監視できます。アラート管理ページでアラートの詳細を表示できます。詳細については、「アラートの詳細を表示する」をご参照ください。
削除: ルールを削除します。
カスタムアラートルールの変更
アラートルールを変更できるのは、ルール所有者、テナント管理者、および Alibaba Cloud アカウント のみです。
シナリオ演習: DingTalk グループにアラート通知を送信する
アラート通知を送信する DingTalk グループを開き、右上隅にある [グループ設定] アイコンをクリックします。
グループ設定パネルで、[グループアシスタント] をクリックします。
[グループアシスタント] パネルで、[ロボットを追加] をクリックします。
[チャットボット] ダイアログボックスで、
アイコンをクリックします。
[追加するロボットを選択してください] セクションで、[カスタム] をクリックします。
[ロボットの詳細] メッセージで、[追加] をクリックします。
[ロボットを追加] ダイアログボックスで、パラメーターを設定します。
パラメーター
説明
チャットボット名
カスタムチャットボットの名前。
グループに追加
チャットボットが追加される DingTalk グループ。 このグループは変更できません。
カスタムキーワード
カスタムキーワードを指定すると、メッセージに指定されたキーワードが少なくとも 1 つ含まれている場合にのみ、メッセージを送信できます。 DataWorks をキーワードとして追加する必要があります。 このキーワードは大文字と小文字が区別されます。
説明最大 10 個のキーワードを指定できます。 メッセージに指定されたキーワードが少なくとも 1 つ含まれている場合にのみ、メッセージを送信できます。
利用規約を読み、[<<DingTalk カスタムロボットサービス利用規約>> を読んで同意しました] を選択し、[完了] をクリックします。
セキュリティ設定が完了したら、チャットボットの [Webhook URL] をコピーし、[完了] をクリックします。
重要Webhook URL は機密情報として扱ってください。 Webhook URL が漏洩した場合、ビジネスが危険にさらされる可能性があります。
ルール管理 ページに移動し、[カスタムルールの作成] をクリックします。 カスタムルールの作成ダイアログボックスで、アラート通知方法パラメーターを [DingTalk チャットボット] に設定し、DingTalk からコピーした [チャットボット Webhook URL] を [DingTalk チャットボット] セクションの [Webhook URL] 列に貼り付けます。
よくある質問
Q: アラート通知が多すぎるのを防ぐにはどうすればよいですか?
A: アラート頻度制御セクションで、最大アラート最小値、アラート間隔アラート、およびサイレント期間パラメーターを設定します。詳細については、このトピックのアラート頻度制御のパラメーターを設定するセクションをご参照ください。