モニタリング機能を使用して、Elastic Compute Service (ECS) インスタンスで発生する問題を特定してトラブルシューティングし、問題やリスクがビジネスに影響を与える前に潜在的なリスクに対処できます。
できるだけ早い機会にシステムイベントを処理する
システムがO&M操作を実行するか、問題が発生し、操作または問題がECSインスタンスの操作に影響を与える可能性があると判断すると、システムはシステムイベントを生成します。 システムイベントは、ソリューションやイベントサイクルなどの情報を提供します。 インスタンスの再起動や停止などのイベントの結果がビジネスに影響を与えないように、システムイベントをできるだけ早く処理することを推奨します。 詳細については、「概要」をご参照ください。
サブスクリプションインスタンスの有効期限が切れると、次の図に示すように、ECSコンソールにシステムイベントが表示されます。
次の図に示すように、[メッセージセンター] コンソールの [共通設定] ページで、インスタンスの有効期限、サービスのO&M、およびインスタンスの障害に関する内部メッセージが有効になっていることを確認します。 それ以外の場合、ECSコンソールでシステムイベントを受信できません。
インスタンスの実行メトリックのモニタリング
Alibaba Cloudは、インスタンスの実行メトリックを収集して表示し、インスタンスのリアルタイムおよび履歴の実行ステータスを理解するのに役立ちます。 実行メトリックに基づいて、インスタンスが期待どおりに実行されるかどうかを確認できます。 インスタンスのCPU使用率が一貫して高い場合、インスタンスのプロセスが異常であるかどうか、またはインスタンスの設定が要件を満たしていないかどうかを確認できます。
ECSコンソールの [インスタンスの詳細] ページの [モニタリング] タブ、またはCloudMonitorコンソールの [ホストモニタリング] ページで、インスタンスの実行メトリックを表示できます。 詳細については、「ECSインスタンスのモニタリング情報の表示」および「概要」をご参照ください。
ECSコンソールの [インスタンスの詳細] ページの [モニタリング] タブには、インスタンスの次の実行メトリックが表示されます。
CPU使用率、ディスク読み取り /書き込みパフォーマンス、パケット転送速度など、コンピューティング、ストレージ、ネットワークリソースの使用量
バースト可能インスタンスのCPUクレジット使用率

CloudMonitorコンソールの [ホストモニタリングの詳細] ページの [OSモニタリング] タブに、インスタンスの次の実行メトリックが表示されます。
CPU使用率、ディスク読み取り /書き込みパフォーマンス、パケット転送速度など、コンピューティング、ストレージ、ネットワークリソースの使用量
インスタンスのアクティブなプロセス
GPU高速化インスタンスのGPUメモリ使用量

アラート機能を使用して通知をトリガーする
CloudMonitorのアラート機能を使用して、特定のイベントとインスタンス実行メトリックのアラートルールを設定できます。 指定されたイベントが発生した場合、またはメトリックを実行しているインスタンスが異常な場合、連絡先に電子メールで通知されます。 これにより、手動のO&Mワークロードが削減されます。 詳細については、「イベント通知の設定」および「ECSインスタンスのアラートの設定」をご参照ください。
次の図に示すように、イベントのアラートルールを設定できます。

次の図に示すように、メトリックを実行するインスタンスのアラートルールを設定できます。
