MaxCompute を使用する場合、リソースの状態を把握するために、MaxCompute サブスクリプション リソースと従量課金ジョブの消費を監視する必要がある場合があります。これは、リソースをスペックアップしたり、ジョブをできるだけ早く計画したりするのに役立ちます。 アラーム ルールを構成することもできます。リソースの状態がアラーム ルールと一致する場合、CloudMonitor は自動的にアラーム通知を送信します。このようにして、リソースの状態をできるだけ早く把握できます。
監視とアラーム スキーム
MaxCompute の監視とアラーム機能を使用すると、次の操作を実行できます。
CloudMonitor を使用して メトリック を構成します。このようにして、サブスクリプション リソースとリアルタイム ジョブ消費を監視できます。
説明MaxCompute コンソール にログインし、[概要] ページの [アラームとリスク警告] セクションで、各メトリックのアラーム数を確認できます。
ダッシュボードでモニタリング チャートを表示して、メトリックのリアルタイムの変化を把握します。 詳細については、「ダッシュボードを構成する」をご参照ください。
カスタム アラーム ルールを構成し、アラーム連絡先を追加します。メトリックの値が指定されたアラームしきい値に達するか、それを超えると、CloudMonitor は指定された連絡先にアラーム通知を自動的に送信します。 アラーム通知は、電話、ショートメッセージ、メール、または DingTalk チャットボットを使用して送信できます。 詳細については、「アラーム ルールを構成する」をご参照ください。
MaxCompute クライアントを使用して、SQL 文のリソース消費を監視します。 SQL 文のリソース消費を監視する方法の詳細については、「SQL 文で消費される最大リソース」をご参照ください。
メトリック
次の表に、メトリックを示します。
メトリック タイプ | メトリック カテゴリ | メトリック | 説明 |
MaxCompute_Subscription | level1 | レベル 1 のプリペイド クォータ CPU 使用率 | レベル 1 クォータの CPU 使用率(予約済み CU と弾力的に予約済み CU の CPU 使用率の合計)。単位:%。システムは 1 分ごとにデータを収集します。 |
レベル 1 のプリペイド クォータ CPU 使用量 | レベル 1 クォータの使用済み CPU コアの合計数。単位:コア。システムは 1 分ごとにデータを収集します。 | ||
レベル 1 のプリペイド クォータ メモリ使用率 | レベル 1 クォータのメモリ使用量(予約済み CU と弾力的に予約済み CU のメモリ使用量の合計)。単位:%。システムは 1 分ごとにデータを収集します。 | ||
レベル 1 のプリペイド クォータ メモリ使用量 | レベル 1 クォータの使用済みメモリ リソースの合計サイズ。単位:MB。システムは 1 分ごとにデータを収集します。 | ||
level2 | レベル 2 のプリペイド クォータ CPU 使用率 | レベル 2 クォータの CPU 使用率(minCU で指定された予約済み CU と弾力的に予約済み CU の CPU 使用率の合計)。単位:%。システムは 1 分ごとにデータを収集します。 | |
レベル 2 のプリペイド クォータ CPU 使用量 | レベル 2 クォータの使用済み CPU コアの合計数。単位:コア。システムは 1 分ごとにデータを収集します。 | ||
レベル 2 のプリペイド クォータ メモリ使用率 | レベル 2 クォータのメモリ使用量(minCU で指定された予約済み CU と弾力的に予約済み CU のメモリ使用量の合計)。単位:%。システムは 1 分ごとにデータを収集します。 | ||
レベル 2 のプリペイド クォータ メモリ使用量 | レベル 2 クォータの使用済みメモリ リソースの合計サイズ。単位:MB。システムは 1 分ごとにデータを収集します。 | ||
レベル 2 のプリペイド クォータ ジョブ待機数 | レベル 2 クォータを使用する待機ジョブの数。システムは 1 分ごとにデータを収集します。 | ||
MaxCompute - 一般 | Tunnel | プロジェクト別 Tunnel ダウンロード トラフィック | プロジェクトごとのリアルタイム ダウンロード トラフィック。最大ダウンロード トラフィックしきい値 (バイト/分) を設定できます。しきい値に達するか、それを超えると、アラームがトリガーされます。 |
プロジェクト別 Tunnel アップロード トラフィック | プロジェクトごとのリアルタイム アップロード トラフィック。最大アップロード トラフィックしきい値 (バイト/分) を設定できます。しきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
プロジェクト別 Tunnel 日次ダウンロード データサイズ | プロジェクトごとの日次累積ダウンロード データ量。最大データ量しきい値 (MB) を設定できます。しきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
プロジェクト別 Tunnel 日次アップロード データサイズ | プロジェクトごとの日次累積アップロード データ量。最大データ量しきい値 (MB) を設定できます。しきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
プロジェクト別 Tunnel スロット | 選択したプロジェクトの現在の同時実行性 (スロット数)。しきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
テナント別 Tunnel スロット | 選択したテナントの現在の同時実行性 (スロット数)。しきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
ジョブ | ジョブ実行時間 | MaxCompute プロジェクト配下のすべてのジョブを監視します。ジョブの実行時間 (待機時間を含む) がしきい値を超えると、システムは構成されたアラーム ルールに従ってアラーム連絡先にアラーム通知を送信します。 重要 実行時間が 1 分未満のジョブは監視できません。 | |
SQL のジョブ実行時間 | MaxCompute プロジェクト配下のすべての SQL タイプのジョブを監視します。SQL ジョブの実行時間 (待機時間を含む) がしきい値を超えると、システムは構成されたアラーム ルールに従ってアラーム連絡先にアラーム通知を送信します。 重要 実行時間が 1 分未満のジョブは監視できません。 | ||
コスト | Storage API 読み取り日次消費量 | プロジェクトごとの日次累積 Storage API 読み取りデータ消費量 (単位:GiB)。消費量がしきい値に達するか、それを超えると、アラームがトリガーされます。 説明 各テナントは、毎月 1 TB の無料データ読み取り/書き込みクォータを利用できます。監視は、データ消費量が 1 TB を超えると開始されます。 | |
Storage API 読み取り月次消費量 | プロジェクトごとの月次累積 Storage API 読み取りデータ消費量 (単位:GiB)。消費量がしきい値に達するか、それを超えると、アラームがトリガーされます。 説明 各テナントは、毎月 1 TB の無料データ読み取り/書き込みクォータを利用できます。監視は、データ消費量が 1 TB を超えると開始されます。 | ||
Storage API 書き込み日次消費量 | プロジェクトごとの日次累積 Storage API 書き込みデータ消費量 (単位:GiB)。消費量がしきい値に達するか、それを超えると、アラームがトリガーされます。 説明 各テナントは、毎月 1 TB の無料データ読み取り/書き込みクォータを利用できます。監視は、データ消費量が 1 TB を超えると開始されます。 | ||
Storage API 書き込み月次消費量 | プロジェクトごとの月次累積 Storage API 書き込みデータ消費量 (単位:GiB)。消費量がしきい値に達するか、それを超えると、アラームがトリガーされます。 説明 各テナントは、毎月 1 TB の無料データ読み取り/書き込みクォータを利用できます。監視は、データ消費量が 1 TB を超えると開始されます。 | ||
従量課金ジョブの日次消費量 (人民元) | プロジェクトごとの日次累積 SQL および MapReduce ジョブ コスト。日次最大コスト (人民元) を設定できます。コストがこのしきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
従量課金ジョブの日次消費量 (米ドル) | プロジェクトごとの日次累積 SQL および MapReduce ジョブ コスト。日次最大コスト (米ドル) を設定できます。コストがこのしきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
従量課金ジョブの月次消費量 (人民元) | プロジェクトごとの月次累積 SQL および MapReduce ジョブ コスト。月次最大コスト (人民元) を設定できます。コストがこのしきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
従量課金ジョブの月次消費量 (米ドル) | プロジェクトごとの月次累積 SQL および MapReduce ジョブ コスト。月次最大コスト (米ドル) を設定できます。コストがこのしきい値に達するか、それを超えると、アラームがトリガーされます。 | ||
ストレージ | プロジェクト別標準ストレージ サイズ | プロジェクトの標準ストレージ サイズ。単位:GB。システムは 1 時間ごとにデータを収集します。 | |
プロジェクト別低頻度ストレージ サイズ | プロジェクトのIAストレージ サイズ。単位:GB。システムは 1 時間ごとにデータを収集します。 | ||
プロジェクト別過去 30 日間の低頻度アクセス率 | 式: | ||
プロジェクト別長期ストレージ サイズ | プロジェクトの長期ストレージ サイズ。単位:GB。システムは 1 時間ごとにデータを収集します。 | ||
プロジェクト別過去 180 日間の長期アクセス率 | 式: |
メトリックのダッシュボードまたはアラーム ルールを構成できます。 詳細については、「ダッシュボードを構成するアラームルールを構成する」および「」をご参照ください。
アラーム ルールを構成する
CloudMonitor コンソール にログオンします。
左側のナビゲーションウィンドウで、
を選択します。[カスタムダッシュボード] ページで、[ダッシュボードの作成] をクリックします。表示されたページの右上隅にある [チャートの追加] をクリックします。
[新しいボード] ページで、チャートの種類とメトリックを選択します。
操作
パラメータ
説明
チャートの種類の選択
折れ線
ビジネス要件に基づいてチャートの種類を選択します。ダッシュボードでは、折れ線、面グラフ、表、ヒートマップ、円グラフのチャートの種類が提供されています。
面グラフ
表
ヒートマップ
円グラフ
メトリックの選択
製品名
[ダッシュボード] タブの [クラウドサービス] ドロップダウンリストから、MaxCompute のメトリックタイプを選択します。 MaxCompute のメトリックタイプの詳細については、「メトリック」をご参照ください。
メトリック名
[監視指標] ドロップダウンリストからメトリックを選択します。 MaxCompute のメトリックの詳細については、「メトリック」をご参照ください。
リソース
[リソース] ドロップダウンリストから、監視するリージョンとプロジェクトを選択します。
構成が完了したら、[OK] をクリックします。その後、[カスタムダッシュボード] でメトリックのチャートを表示できます。
説明監視チャートを追加する方法の詳細については、「カスタムダッシュボードの監視チャートを管理する」をご参照ください。
ダッシュボードを構成する
詳細については、「メトリクス」をご参照ください。
リソースグループのメトリックに対してアラームをトリガーするようにアラームルールを構成できます。このようにして、MaxCompute_ サブスクリプションのクォータグループにある CU の CPU 使用率またはメモリ使用率が指定されたしきい値を超えると、アラームがトリガーされます。たとえば、監視対象のリソースグループに 150 CU を構成した場合、CU の CPU 使用率は 100% で、すべての CU の最大 CPU 使用率は 15000% です。次のアラームルールを構成できます。CU の CPU 使用率が指定されたしきい値 12000% を超えると、アラームがトリガーされます。アラームを受信した場合、リソースグループはほぼ完全に使用されています。ジョブの送信を続けると、ジョブがキューに入れられる可能性があります。ビジネス要件に基づいて、リソースグループの構成をスペックアップしたり、ジョブを計画したりできます。このシナリオでアラームルールを構成するには、次の手順を実行します。
CloudMonitor コンソール にログオンします。
左側のナビゲーションウィンドウで、
を選択します。[アラームルール] ページで、[アラームルールの作成] をクリックします。
[アラームルールの作成] パネルで、このシナリオのアラームルールパラメーターを構成します。パラメーターの詳細については、「アラームルールの作成」をご参照ください。アラーム連絡先の構成方法の詳細については、「アラーム連絡先またはアラーム連絡グループの作成」をご参照ください。
次の表は、上記のシナリオでアラームルールに構成する必要がある主要なパラメーターを示しています。
パラメーター
説明
製品
[製品] ドロップダウンリストから MaxCompute_ サブスクリプション を選択します。
リソース範囲
インスタンス を選択します。
関連リソース
リージョン: 表示されるパネルの左上隅にある [リージョン] ドロップダウンリストから、MaxCompute プロジェクトが存在するリージョンを選択します。
クォータグループ: クォータグループリストから、監視するクォータグループを選択します。クォータグループの詳細については、「クォータ管理 (新規)」をご参照ください。
ルールの追加
ルール名: アラームルールの名前。
メトリックタイプ: 単一メトリック を選択します。
メトリック: ドロップダウンリストから サブスクリプションクォータ CPU 使用率 を選択します。
説明[ルールの説明] ドロップダウンリストから QuotaGroupJobWaitQueue を選択することもできます。 CPU 使用率が高く、多数のジョブが N 期間連続してキューに入れられている場合は、手動による介入が必要になる場合があります。
[確認] をクリックします。
参照資料
従量課金制コンピューティング タスクの消費制限と関連アラームの詳細については、「消費制御」をご参照ください。