このトピックでは、デフォルトのアラート ルールを設定する方法について説明します。
手順
MSEコンソール にログインし、上部のナビゲーション バーでリージョンを選択します。
左側のナビゲーション ペインで、Microservices Registry > Instances を選択します。
[インスタンス] ページで、管理するインスタンスを見つけ、[アクション] 列で [詳細] > [デフォルト アラートの設定] を選択します。
[デフォルト アラートの設定] ダイアログ ボックスで、[アラート連絡先グループ] パラメーターのアラート連絡先グループを選択し、[OK] をクリックします。
[OK] をクリックすると、次の表に示すデフォルトのアラート ルールが、選択した連絡先グループに自動的に追加されます。
インスタンス タイプ
インスタンス バージョン
アラート ルール名
説明
解決策
マイクロサービス レジストリ
Basic Edition、Developer Edition、および Professional Edition
インスタンスのCPU負荷が高すぎる
インスタンス内のノードのCPU使用率が 80% を超えています。
インスタンスのバージョンに欠陥があるか、インスタンスの容量が不足しています。[リスク管理] ページでリスク項目を確認し、提案に基づいて問題を解決してください。問題が解決した後もアラートが続く場合は、インスタンスをスケールアウトしてください。
インスタンスのメモリ使用量が高すぎる
インスタンス内のノードのメモリ使用量が 90% を超えています。
ZooKeeper
Basic Edition、Developer Edition、および Professional Edition
ZooKeeperインスタンスでのCMS GCの発生回数が多い
インスタンスで Concurrent Mark Sweep (CMS) のガベージ コレクション (GC) が発生する回数が 1 分間に 5 回を超えています。
ZookeeperインスタンスでのCMS GCの期間が長すぎる
インスタンスでの CMS GC の合計時間が 1 分間に 6 秒を超えています。
Serverless
スナップショット調整
スナップショットのサイズが 20 MB を超え、上限である 25 MB に近づいています。
スナップショットのサイズは 25 MB を超えることはできません。スナップショットを保存するためにより多くの容量が必要な場合は、
スナップショットのサイズは 25 MB を超えることはできません。スナップショットを保存するためにより多くのスペースが必要な場合は、チケットを送信してください。
Nacos
Basic Edition、Developer Edition、および Professional Edition
NacosインスタンスでのフルGCの発生回数が多い
インスタンスでフル GC が発生する回数が 1 分間に 2 回を超えています。
インスタンスの容量が不足しています。クライアントの構成ミスにより、接続リーク、重複登録、重複サブスクリプションなどの問題が発生していないか確認してください。このような問題が発生していない場合は、インスタンスをタイムリーにスケールアウトまたはアップグレードしてください。
NacosインスタンスでのフルGCの期間が長すぎる
インスタンスでのフル GC の合計時間が 1 分間に 5 秒を超えています。
Basic Edition、Developer Edition、Professional Edition、および Serverless Edition
Nacosサービスの使用量が高すぎる
サービスの使用量が 90% を超えています。
Nacosサービス プロバイダーの使用量が高すぎる
サービス プロバイダーの使用量が 90% を超えています。
Nacos接続の使用量が高すぎる
接続の使用量が 90% を超えています。
Nacos構成の使用量が高すぎる
構成の使用量が 90% を超えています。
Nacosロング ポーリングの使用量が高すぎる
設定されたロング ポーリングの使用量が 90% を超えています。
Nacosサービス プロバイダーの比率の大幅な減少
現在 Nacos インスタンスに登録されているサービス プロバイダーの数が、3 分前と比較して 50% 以上減少しています。このアラート ルールに一致すると、アップストリーム サービスがダウンストリーム サービス プロバイダーを識別できない可能性があります。
アプリケーションの障害または多数のアプリケーションのリリースにより、短期間で多数のサービスが切断されています。更新後にビジネス アプリケーションがリリースされているかどうかを確認してください。リリースされているアプリケーションがない場合は、ビジネス アプリケーションの CPU コア、メモリ、GC、ネットワークなどのリソースが正常かどうかを確認してください。
Serverless
TPS調整
インスタンスで TPS 調整がトリガーされています。
チケットを送信してください。
サービス容量制限
インスタンスのサービス容量が上限を超えています。
接続制限
インスタンスの接続数が上限を超えています。
構成容量制限
インスタンスの構成容量が上限を超えています。
Ingress
Professional Edition
インスタンスのCPU負荷が高すぎる
インスタンスのCPU使用率が 80% を超えています。
インスタンスの容量が不足しています。プラグインのメモリ リークやロジック エラーなどの問題が発生していないか確認してください。このような問題が発生していない場合は、インスタンスをタイムリーにスケールアウトしてください。
インスタンスのメモリ使用量が高すぎる
インスタンスのメモリ使用量が 80% を超えています。
Professional Edition および Serverless Edition
ゲートウェイの精度が低い
ゲートウェイ全体の精度が 80% 未満です。
ゲートウェイ全体の精度が異常です。ゲートウェイの構成の問題またはゲートウェイのビジネス例外が発生していないか確認してください。
カスタム ゲートウェイ プラグインの例外 (回復済み)
カスタム ゲートウェイ プラグインが異常です。プラグインは自動的に回復しました。
カスタム プラグインが失敗しました。プラグインのロジックを確認してください。