MaxCompute のリソース(サブスクリプションリソース、従量課金ジョブの消費)をモニタリングすることで、その運用状況を把握し、必要に応じてリソースのスペックアップやジョブのスケジュール調整が可能になります。また、アラートルールを設定することもできます。指定された条件をメトリックが満たすと、Cloud Monitor が自動的に通知を送信し、異常の早期検出および迅速な対応を支援します。
モニタリングおよびアラートのソリューション
MaxCompute では、以下の方法でモニタリングおよびアラート機能を提供しています。
Cloud Monitor を使用して、サブスクリプションリソース、リアルタイムジョブの消費に関するメトリックをモニタリングします。
ダッシュボードを使用して、各メトリックのモニタリングチャートをリアルタイムで表示し、変化を追跡します。
カスタムのアラートルールを作成し、アラート連絡先を登録します。メトリックが指定されたしきい値に達した場合、またはそれを超えた場合、Cloud Monitor が指定された連絡先に対して自動的に通知を送信します。対応する通知方法には、電話通話、SMS、電子メール、DingTalk チャットボットがあります。
MaxCompute コンソールにログインします。概要ページページの警告とリスク警告セクションで、各メトリックごとのアラート数を確認できます。
MaxCompute クライアントを使用して、個別の SQL ジョブの消費をモニタリングします。SQL 消費のモニタリングについて詳しくは、「単一 SQL 消費制限」をご参照ください。
メトリック
以下の表に、MaxCompute でサポートされるメトリクスタイプおよびメトリックの一覧を示します。
メトリクスタイプ | メトリックカテゴリ | メトリック | 説明 |
MaxCompute-サブスクリプションコンピューティングクォータ | level1 | レベル 1 クォータ CPU 使用率 | レベル 1 クォータの CPU 使用量を、合計量(予約 CUs + フレキシブル予約 CUs)に対する割合で表した値です。単位:%。データは 1 分ごとに収集されます。 |
レベル 1 クォータ CPU 使用量 | レベル 1 クォータの CPU 総使用量です。単位:コア。データは 1 分ごとに収集されます。 | ||
レベル 1 クォータ MEM 使用率 | レベル 1 クォータのメモリ使用量を、合計メモリ(予約 + フレキシブル予約)に対する割合で表した値です。単位:%。データは 1 分ごとに収集されます。 | ||
レベル 1 クォータ MEM 使用量 | レベル 1 クォータのメモリ使用量です。単位:MB。データは 1 分ごとに収集されます。 | ||
level2 | レベル 2 クォータ CPU 使用率 | レベル 2 クォータの CPU 使用量を、合計量(予約 Min CUs + フレキシブル予約 CUs)に対する割合で表した値です。単位:%。データは 1 分ごとに収集されます。 | |
レベル 2 クォータ CPU 使用量 | レベル 2 クォータの CPU 総使用量です。単位:コア。データは 1 分ごとに収集されます。 | ||
レベル 2 クォータ MEM 使用率 | レベル 2 クォータのメモリ使用量を、合計メモリ(予約 Min + フレキシブル予約)に対する割合で表した値です。単位:%。データは 1 分ごとに収集されます。 | ||
レベル 2 クォータ MEM 使用量 | レベル 2 クォータのメモリ使用量です。単位:MB。データは 1 分ごとに収集されます。 | ||
レベル 2 クォータ 待機ジョブ数 | レベル 2 クォータ内の待機ジョブ数です。単位:件。データは 1 分ごとに収集されます。 | ||
MaxCompute-一般 | Tunnel | プロジェクトレベル Tunnel ダウンロードトラフィック | このメトリックは、プロジェクトレベルでのリアルタイムダウンロードトラフィックを測定します。最大ダウンロードトラフィック(バイト/分)を設定できます。このしきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 |
プロジェクトレベル Tunnel アップロードトラフィック | このメトリックは、プロジェクトレベルでのリアルタイムアップロードトラフィックを測定します。最大アップロードトラフィック(バイト/分)を設定できます。このしきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
プロジェクトレベル Tunnel 日次累計ダウンロード量 | このメトリックは、プロジェクトの日次累計ダウンロード量を測定します。最大データ量(MB)を設定できます。このしきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
プロジェクトレベル Tunnel 日次累計アップロード量 | このメトリックは、プロジェクトの日次累計アップロード量を測定します。最大データ量(MB)を設定できます。このしきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
プロジェクトレベル現在の Tunnel 同時実行数 (スロット) | このメトリックは、選択したプロジェクトによって使用中の同時実行スロット数を測定します。しきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
テナントレベル現在の Tunnel 同時実行数 (スロット) | このメトリックは、選択したテナントによって使用中の同時実行スロット数を測定します。しきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
ジョブ | ジョブ ランタイム | このメトリックは、MaxCompute プロジェクト内のすべてのジョブを監視します。ジョブのランタイム(待機時間含む)が指定されたしきい値を超えると、設定済みのアラートルールに基づき、アラート連絡先にアラート通知が送信されます。 重要 ランタイムが 1 分未満のジョブはモニタリングできません。 | |
ジョブ ランタイム (SQL タイプ) | このメトリックは、MaxCompute プロジェクト内のすべての SQL ジョブを監視します。SQL ジョブのランタイム(待機時間含む)が指定されたしきい値を超えると、設定済みのアラートルールに基づき、アラート連絡先にアラート通知が送信されます。 重要 ランタイムが 1 分未満のジョブはモニタリングできません。 | ||
ジョブランタイム (SQL タイプ、提出者別) | このメトリックは、MaxCompute プロジェクト内のすべての SQL ジョブのランタイム(待機時間含む)を監視します。SQL ジョブのランタイムが指定されたしきい値を超えると、設定済みのアラートルールに基づき、アラート連絡先にアラート通知が送信されます。通知にはジョブ提出者の情報が含まれており、受信者がジョブの所有者を特定できるようになります。 重要 ランタイムが 1 分未満のジョブはモニタリングできません。 | ||
コスト | 日次 ストレージ API 読み取り消費量 | このメトリックは、プロジェクトレベルでのストレージ API の読み取りによる日次累計データ消費量(単位:GiB)を測定します。しきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 説明 各テナントには、ストレージ API を介したデータの読み取りおよび書き込みに対して月間 1 TB の無料クォータが付与されています。消費量が 1 TB を超えた時点でモニタリングが開始されます。 | |
月次 ストレージ API 読み取り消費量 | このメトリックは、プロジェクトレベルでのストレージ API の読み取りによる月次累計データ消費量(単位:GiB)を測定します。しきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 説明 各テナントには、ストレージ API を介したデータの読み取りおよび書き込みに対して月間 1 TB の無料クォータが付与されています。消費量が 1 TB を超えた時点でモニタリングが開始されます。 | ||
日次 ストレージ API 書き込み消費量 | このメトリックは、プロジェクトレベルでのストレージ API の書き込みによる日次累計データ消費量(単位:GiB)を測定します。しきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 説明 各テナントには、ストレージ API を介したデータの読み取りおよび書き込みに対して月間 1 TB の無料クォータが付与されています。消費量が 1 TB を超えた時点でモニタリングが開始されます。 | ||
月次 ストレージ API 書き込み消費量 | このメトリックは、プロジェクトレベルでのストレージ API の書き込みによる月次累計データ消費量(単位:GiB)を測定します。しきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 説明 各テナントには、ストレージ API を介したデータの読み取りおよび書き込みに対して月間 1 TB の無料クォータが付与されています。消費量が 1 TB を超えた時点でモニタリングが開始されます。 | ||
日次従量課金ジョブ消費額 (USD) | このメトリックは、プロジェクトレベルでの SQL および MapReduce ジョブの日次累計コストを測定します。最大日次コストしきい値 (USD) を設定できます。このしきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
月次従量課金ジョブ消費額 (USD) | このメトリックは、プロジェクトレベルでの SQL および MapReduce ジョブの月次累計コストを測定します。最大月次コストしきい値 (USD) を設定できます。このしきい値に達した場合、またはそれを超えた場合にアラートがトリガーされます。 | ||
ストレージ | プロジェクトレベル 標準 ストレージサイズ | プロジェクトで使用されている標準ストレージの合計量です。単位:GB。データは 1 時間ごとに収集されます。 | |
プロジェクトレベル IA ストレージサイズ | プロジェクトで使用されている IA ストレージの合計量です。単位:GB。データは 1 時間ごとに収集されます。 | ||
プロジェクトレベル 過去 30 日間の IA ストレージアクセス率 | この値は、以下の式で算出されます: | ||
プロジェクトレベル アーカイブ ストレージサイズ | プロジェクトで使用されているアーカイブストレージの合計量です。単位:GB。データは 1 時間ごとに収集されます。 | ||
プロジェクトレベル 過去 180 日間のアーカイブストレージアクセス率 | この値は、以下の式で算出されます: |
これらのメトリックに対して、ダッシュボードまたはアラートルールを設定できます。詳しくは、「ダッシュボードの設定」または「アラートルールの設定」をご参照ください。
ダッシュボードの設定
Cloud Monitor コンソールにログインします。
左側のナビゲーションウィンドウで、を選択します。
カスタムディスクページで、ダッシュボードの作成をクリックします。大皿を作成ダイアログボックスで、大きな市場名を入力し、フォルダを選択してから、OK をクリックします。
新しく作成したダッシュボードの名前をクリックします。表示されるページで、可視化ウィジェットの追加をクリックします。
ページの右上隅で、折れ線グラフ、横棒グラフ、統計グラフ、ゲージ、メーター、円グラフ、テーブル、ファセットチャート、ストリームチャート、ヒストグラムなどのチャートタイプを選択できます。
クエリ分析領域で、クラウドサービス監視をデータソースプラグインとして選択します。その後、他のメトリックを構成できます。
モニタリングチャートの管理方法については、「カスタムダッシュボード内のモニタリングチャートの管理」をご参照ください。
アラートルールの設定
メトリックセクションで説明されている任意のメトリックに対してアラートルールを設定できます。
以下の例では、リソースグループに対するアラートルールの設定方法を示します。目的は、サブスクリプション MaxCompute クォータグループの CU またはメモリ使用率が指定値を超えたときにアラートをトリガーすることです。監視対象のリソースグループが 150 CUs で構成されていると仮定します。1 コアが完全に使用されている場合、使用率は 100% となります。したがって、このリソースグループの最大使用率は 15,000% です。アラートしきい値を 12,000% より大きい値に設定できます。アラートを受信した場合、リソースグループが満杯に近づいていることを意味し、後続のジョブがキューに並ぶ可能性があります。これにより、必要に応じてリソースグループのスペックアップやジョブの再スケジュールが可能になります。
Cloud Monitor コンソールにログインします。
左側のナビゲーションウィンドウで、をクリックします。
アラームルールページで、アラームルールを作成をクリックします。
アラームルールを作成ページで、シナリオに応じてアラートルールのパラメーターを構成します。パラメーターの詳細については、「アラートルールの作成」をご参照ください。アラート連絡先の構成方法については、「アラート連絡先またはアラート連絡先グループの作成」をご参照ください。
以下の表に、本シナリオにおける主要なパラメーターを示します。
パラメーター
説明
製品
ドロップダウンリストから、MaxCompute_Subscription を選択します。
リソース
ドロップダウンリストから、インスタンスリスト を選択します。
関連リソース
インスタンスの追加 をクリックします。インスタンスの追加ページで、ご利用の MaxCompute プロジェクトが配置されているリージョンのサブスクリプションクォータグループを選択し、OK をクリックします。クォータグループの詳細については、「コンピューティングリソースのクォータ管理」をご参照ください。
ルールの内容
をクリックし、ルールの説明を追加するパネルで、以下のパラメーターを構成します:
アラームルール名:アラートルールの名前を入力します。
インジケータータイプ: シンプルメトリック を選択します。
モニタリングメトリック:ドロップダウンリストから、対応する CPU 使用量メトリックを選択します。
説明追加したインスタンスがレベル 1 クォータグループの場合、 を選択します。追加したインスタンスがレベル 2 クォータグループの場合、 を選択します。
待機ジョブ数の監視も可能です。CPU 使用率が高く、複数の統計期間にわたって多くのジョブが待機している場合は、リソース割り当ての見直しが必要になる可能性があります。
OK をクリックして、アラートルールの設定を完了します。
関連ドキュメント
従量課金コンピューティングジョブの消費制限およびアラートの設定については、「消費制御」をご参照ください。