Nacos モニタリングセンター - Microservices Engine - Alibaba Cloud ドキュメントセンター

モニタリングセンターは、MSE Nacos エンジンの稼働状況とパフォーマンスメトリックに関する詳細な情報を提供します。これを使用して、潜在的な問題やボトルネックを特定し、最適化戦略を適用し、エンジンの安定性と信頼性を向上させることで、システム中断のリスクを最小限に抑えることができます。このトピックでは、このモニタリングデータの表示方法について説明します。

前提条件

MSE がアクティベートされていること。
Nacos エンジンが作成されており、そのバージョンが 2.0.4 以降であること。

Grafana モニタリングダッシュボードの有効化

Basic Edition

Basic Edition エンジンの場合、Professional Edition にアップグレードすると、新しい Grafana モニタリングダッシュボードが自動的に有効になります。詳細については、「Nacos エンジンバージョンのアップグレード」をご参照ください。

Professional Edition

エンジンが Professional Edition のバージョン 2.0.3 以前の場合は、コンソールの [可観測分析] ページに移動して [モニタリングのアップグレード] をクリックし、[モニタリングのアップグレード] ダイアログボックスの指示に従って新しい Grafana モニタリングダッシュボードを有効にします。

新しい Grafana モニタリングダッシュボード

Grafana モニタリングダッシュボードを有効にしている場合、新しいバージョンでは、より幅広いモニタリングメトリックを利用できます。

MSE コンソールにログインし、上部メニューでリージョンを選択します。
ナビゲーションペインで、マイクロサービスの登録 > インスタンス を選択します。
インスタンス ページで、対象のインスタンスの名前をクリックします。
ナビゲーションペインで、[モニタリングセンター] を選択します。
説明
- デフォルトでは、ダッシュボードには過去 15 分間のデータが表示されます。右上隅のドロップダウンリストから、別の時間範囲を選択するか、カスタム範囲を指定できます。
- グラフ上のデータポイントにカーソルを合わせると、その時点における特定のノードのデータが分単位の粒度で表示されます。
- 右上隅の [更新] アイコンをクリックすると、モニタリングデータが更新されます。
- Overview タブでは、次の情報を確認できます。
  - Overview セクションでは、[ノード数]、[構成数]、[サービスプロバイダー数]、[1 秒あたりのクエリ数]、[1 秒あたりの操作数]、[接続数] などのメトリックを確認できます。
  - [使用量のウォーターマーク] セクションでは、構成の使用量、サービスプロバイダーの使用量、接続の使用量 を確認できます。
  説明
  Eureka クライアントを使用している場合、Eureka クライアントは短期接続を使用するため、[概要] タブの接続関連のメトリックは収集できません。
- [レジストリモニタリング] タブをクリックすると、[サービス数]、[サービスプロバイダー数]、[サービスサブスクライバー数]、[レジストリ TPS]、[レジストリ QPS]、[レジストリ書き込み RT]、[レジストリ読み取り RT] などのメトリックを確認できます。TPS は 1 秒あたりのトランザクション数、QPS は 1 秒あたりのクエリ数、RT は応答時間を表します。
  説明
  
  Nacos 2.0.4 以降のバージョンでは、Application Configuration Management (ACM) プロトコルを介したアドレス検出用に 4 つの内部サービスが提供されています。そのため、モニタリンググラフの [サービス数] と [サービスプロバイダー数] の値は、実際のカウントよりも 4 つ多くなります。これは想定される動作です。
  
  Eureka クライアントを使用している場合、Eureka クライアントはサブスクリプションではなくポーリングクエリを使用するため、サービスサブスクライバー数は収集できません。
- [構成センターモニタリング] タブをクリックすると、[構成数]、[構成リスナー数]、[構成センター TPS]、[構成センター QPS]、[構成センター書き込み RT]、[構成センター読み取り RT] などのメトリックを確認できます。
  
  説明
  [モニタリングセンター] ダッシュボードでは、Configuration Center Monitoring は構成クエリ QPS (1 秒あたりのクエリ数)、つまり 1 秒あたりに処理される構成読み取りリクエストの数を表しており、独立したトランザクション処理メトリックではありません。このメトリックを HTTP リクエスト数と組み合わせて、構成センターの全体的な負荷を評価できます。このタブでは、リアルタイムデータと履歴モニタリングデータの両方を利用できます。
- [プッシュモニタリング] タブをクリックすると、[サービスプッシュ成功率]、サービスプッシュレイテンシー、[サービスプッシュ TPS]、空のプッシュ比率 などのメトリックを確認できます。
  
  説明
  Eureka クライアントはポーリングクエリを使用するため、Nacos プッシュ機能はトリガーされません。その結果、プッシュ関連のメトリックは収集できません。
- [接続モニタリング] タブをクリックすると、[クライアントバージョン数] や [長期接続数] などのメトリックを確認できます。
  
  説明
  Eureka クライアントは短期接続を使用するため、[接続モニタリング] タブのメトリックは収集できません。
- [JVM モニタリング] タブをクリックすると、[Young GC 時間]、[Young GC] [回数]、[Full GC 時間]、[Full GC 回数]、[ヒープメモリ使用量] などの Java Virtual Machine (JVM) メトリックを確認できます。GC はガベージコレクションを表します。
- [リソースモニタリング] タブをクリックすると、受信トラフィック、送信トラフィック、[メモリ使用量]、[CPU 使用率]、[ノード数]、システムロード などのリソースメトリックを確認できます。
- [TopN モニタリング] タブをクリックすると、次の情報を確認できます。
  - [サービス TopN ダッシュボード] セクションでは、[上位 N サービスプロバイダー]、[上位 N サービスサブスクライバー]、[上位 N IP プッシュ失敗] を確認できます。
  - [構成 TopN ダッシュボード] セクションでは、[上位 N 構成変更] と [上位 N 構成リスナー] を確認できます。
(オプション) より高度なオブザーバビリティ機能を利用するには、右上隅の [Grafana Expert Edition にインポート] をクリックしてください。これにより、Grafana コンソールにリダイレクトされ、強力なマルチテナントダッシュボード機能を利用できます。
(オプション) エンジンモニタリングページを埋め込むには、右上隅の [<モニタリング名> を新しいウィンドウで開く] をクリックして、その直接 URL を取得します。<モニタリング名> は、現在のモニターの名前を表します。

たとえば、[レジストリモニタリング] タブで、右上隅の [レジストリモニタリングを新しいウィンドウで開く] をクリックすると、レジストリモニタリングページが新しいブラウザタブで開きます。

旧ダッシュボード

Grafana モニタリングダッシュボードを有効にしていない場合は、旧ダッシュボードを引き続き使用できます。ただし、より豊富なメトリックセットにアクセスするために、新しい Grafana ダッシュボードへのアップグレードを推奨します。手順については、「Grafana モニタリングダッシュボードの有効化」をご参照ください。

MSE コンソールにログインし、上部メニューでリージョンを選択します。
ナビゲーションペインで、マイクロサービスの登録 > インスタンス を選択します。
インスタンス ページで、対象のインスタンスの名前をクリックします。
ナビゲーションペインで、[可観測分析] をクリックします。
[可観測分析] ページで、Monitor タブをクリックすると、[サービス数]、[サービスプロバイダー数]、[サービス書き込み API の平均応答時間 (ms)] などのメトリックを確認できます。
説明
- デフォルトでは、ダッシュボードには過去 30 分間のデータが表示されます。[過去 30 分間]、[過去 1 時間]、[過去 6 時間]、[過去 24 時間] などの時間範囲を選択するか、カスタム時間範囲を指定できます。
- エンジン内の 3 つのノードのモニタリングデータは、異なる色で表示されます。グラフの下にあるノード名をクリックして、そのデータを表示または非表示にできます。グラフには少なくとも 1 つのノードが表示されている必要があります。
- グラフ上のデータポイントにカーソルを合わせると、その特定の時点における 3 つのノードすべてのデータが分単位の粒度で表示されます。
- 右上隅の [更新] アイコンをクリックすると、モニタリングデータが更新されます。

よくある質問

Q：モニタリングセンターに表示される Redis RT が異常に高い (例: 3.759 秒) のですが、この値は正確ですか?

ほとんどの場合、モニタリングダッシュボードで異常に高い Redis RT 値が表示されるのは、実際の Redis 応答時間ではなく、サンプリング方法によって生じる表示上のアーティファクトです。実際の Redis 応答時間を確認するには、インスタンスのリクエストログを確認してください。Redis RT の信頼できる参照元として、リクエストログに記録された応答時間を使用してください。

Q：モニタリングデータにノードの再起動またはフェイルオーバーイベントが表示されますが、ビジネストラフィックには影響がありません。原因は何ですか?

MSE インスタンスで基盤の異常が発生した場合、システムは単一ノードのフェイルオーバー、再起動、または移行操作をトリガーすることがあります。これらのイベントは、モニタリングデータに異常インジケーターまたはアラートとして反映されます。MSE Nacos エンジンはデフォルトでマルチノードクラスターデプロイ (デフォルトで 3 ノード) を使用するため、単一ノードのフェイルオーバーは通常の高可用性メカニズムの一部であり、通常、全体的なビジネスの可用性には影響しません。