すべてのプロダクト
Search
ドキュメントセンター

Microservices Engine:デフォルトのアラート ルールの設定

最終更新日:Jan 08, 2025

このトピックでは、デフォルトのアラート ルールを設定する方法について説明します。

手順

  1. MSEコンソール にログインし、上部のナビゲーション バーでリージョンを選択します。

  2. 左側のナビゲーション ペインで、Microservices Registry > Instances を選択します。

  3. [インスタンス] ページで、管理するインスタンスを見つけ、[アクション] 列で [詳細] > [デフォルト アラートの設定] を選択します。

  4. [デフォルト アラートの設定] ダイアログ ボックスで、[アラート連絡先グループ] パラメーターのアラート連絡先グループを選択し、[OK] をクリックします。

    [OK] をクリックすると、次の表に示すデフォルトのアラート ルールが、選択した連絡先グループに自動的に追加されます。

    インスタンス タイプ

    インスタンス バージョン

    アラート ルール名

    説明

    解決策

    マイクロサービス レジストリ

    Basic Edition、Developer Edition、および Professional Edition

    インスタンスのCPU負荷が高すぎる

    インスタンス内のノードのCPU使用率が 80% を超えています。

    インスタンスのバージョンに欠陥があるか、インスタンスの容量が不足しています。[リスク管理] ページでリスク項目を確認し、提案に基づいて問題を解決してください。問題が解決した後もアラートが続く場合は、インスタンスをスケールアウトしてください。

    インスタンスのメモリ使用量が高すぎる

    インスタンス内のノードのメモリ使用量が 90% を超えています。

    ZooKeeper

    Basic Edition、Developer Edition、および Professional Edition

    ZooKeeperインスタンスでのCMS GCの発生回数が多い

    インスタンスで Concurrent Mark Sweep (CMS) のガベージ コレクション (GC) が発生する回数が 1 分間に 5 回を超えています。

    ZookeeperインスタンスでのCMS GCの期間が長すぎる

    インスタンスでの CMS GC の合計時間が 1 分間に 6 秒を超えています。

    Serverless

    スナップショット調整

    スナップショットのサイズが 20 MB を超え、上限である 25 MB に近づいています。

    スナップショットのサイズは 25 MB を超えることはできません。スナップショットを保存するためにより多くの容量が必要な場合は、

    スナップショットのサイズは 25 MB を超えることはできません。スナップショットを保存するためにより多くのスペースが必要な場合は、チケットを送信してください。

    Nacos

    Basic Edition、Developer Edition、および Professional Edition

    NacosインスタンスでのフルGCの発生回数が多い

    インスタンスでフル GC が発生する回数が 1 分間に 2 回を超えています。

    インスタンスの容量が不足しています。クライアントの構成ミスにより、接続リーク、重複登録、重複サブスクリプションなどの問題が発生していないか確認してください。このような問題が発生していない場合は、インスタンスをタイムリーにスケールアウトまたはアップグレードしてください。

    NacosインスタンスでのフルGCの期間が長すぎる

    インスタンスでのフル GC の合計時間が 1 分間に 5 秒を超えています。

    Basic Edition、Developer Edition、Professional Edition、および Serverless Edition

    Nacosサービスの使用量が高すぎる

    サービスの使用量が 90% を超えています。

    Nacosサービス プロバイダーの使用量が高すぎる

    サービス プロバイダーの使用量が 90% を超えています。

    Nacos接続の使用量が高すぎる

    接続の使用量が 90% を超えています。

    Nacos構成の使用量が高すぎる

    構成の使用量が 90% を超えています。

    Nacosロング ポーリングの使用量が高すぎる

    設定されたロング ポーリングの使用量が 90% を超えています。

    Nacosサービス プロバイダーの比率の大幅な減少

    現在 Nacos インスタンスに登録されているサービス プロバイダーの数が、3 分前と比較して 50% 以上減少しています。このアラート ルールに一致すると、アップストリーム サービスがダウンストリーム サービス プロバイダーを識別できない可能性があります。

    アプリケーションの障害または多数のアプリケーションのリリースにより、短期間で多数のサービスが切断されています。更新後にビジネス アプリケーションがリリースされているかどうかを確認してください。リリースされているアプリケーションがない場合は、ビジネス アプリケーションの CPU コア、メモリ、GC、ネットワークなどのリソースが正常かどうかを確認してください。

    Serverless

    TPS調整

    インスタンスで TPS 調整がトリガーされています。

    チケットを送信してください。

    サービス容量制限

    インスタンスのサービス容量が上限を超えています。

    接続制限

    インスタンスの接続数が上限を超えています。

    構成容量制限

    インスタンスの構成容量が上限を超えています。

    Ingress

    Professional Edition

    インスタンスのCPU負荷が高すぎる

    インスタンスのCPU使用率が 80% を超えています。

    インスタンスの容量が不足しています。プラグインのメモリ リークやロジック エラーなどの問題が発生していないか確認してください。このような問題が発生していない場合は、インスタンスをタイムリーにスケールアウトしてください。

    インスタンスのメモリ使用量が高すぎる

    インスタンスのメモリ使用量が 80% を超えています。

    Professional Edition および Serverless Edition

    ゲートウェイの精度が低い

    ゲートウェイ全体の精度が 80% 未満です。

    ゲートウェイ全体の精度が異常です。ゲートウェイの構成の問題またはゲートウェイのビジネス例外が発生していないか確認してください。

    カスタム ゲートウェイ プラグインの例外 (回復済み)

    カスタム ゲートウェイ プラグインが異常です。プラグインは自動的に回復しました。

    カスタム プラグインが失敗しました。プラグインのロジックを確認してください。