すべてのプロダクト
Search
ドキュメントセンター

Application Real-Time Monitoring Service:Prometheus エージェントの HPA

最終更新日:Apr 24, 2025

Prometheus エージェントに十分なレプリカがない場合、メモリオーバーフローと再起動が連続して発生し、データの遅延や損失につながる可能性があります。 Managed Service for Prometheus は、Horizontal Pod Autoscaling (HPA) 機能を提供しており、ビジネス要件に基づいてエージェントレプリカの数を自動的に調整します。

HPA ポリシー

Prometheus エージェントは起動後、ターゲットをキャプチャしてタイムラインの数を取得し、各レプリカの収集能力に基づいて必要なレプリカの数を計算します。データ収集で複数のレプリカが必要な場合は、レプリカの数が自動的に増加します。HPA 機能を使用する場合、次のポリシーが適用されます。

  • Prometheus エージェントの単一レプリカが実行されている場合、マスターレプリカはターゲットを検出してキャプチャする必要があります。マスターレプリカのメモリ使用率が 75% を超えると、複数レプリカモードが自動的に使用されます。ただし、一度に過剰なターゲットがキャプチャされた場合、メモリ不足 (OOM) エラーが発生し、複数レプリカモードも使用されます。

  • Prometheus エージェントの複数のレプリカが同時に実行されている場合、マスターレプリカはターゲットを検出するだけで済みます。ワーカーレプリカはターゲットをキャプチャします。ワーカーレプリカのメモリ使用率が 60% を超えると、ターゲットをキャプチャするために使用されたタスクが再割り当てされ、ワーカーレプリカの数がシステムによって計算された必要な数に自動的に増加します。

    説明

    多要素協調スケジューリングのアルゴリズムに基づいて、各エージェントが 1 ラウンドあたりにキャプチャできるターゲットの総数とメトリックの総数の積の最大値は 40 億です。最大メモリ使用量は 70% です。各エージェントは最大 4,000,000 個のメトリックをキャプチャできます。

HPA 機能を有効にする

Helm バージョンが 1.0.0 以後にアップグレードされると、Prometheus エージェントの HPA 機能が自動的に有効になります。詳細については、[コンポーネントの更新] Helm v1.1.17 または Prometheus エージェント v4.0.0 の新機能と更新方法 を参照してください。

レプリカの数を調整する

Prometheus エージェントの自動スケールアウトでは、Prometheus エージェントによって収集されるレプリカの数が無制限に増加することはありません。デフォルトでは、Prometheus エージェントによって収集されるレプリカの最大数は 30 です。Prometheus エージェントは、データ損失につながる可能性があるため、自動スケールインをサポートしていません。エージェントレプリカの数を調整するには、次の手順を実行します。

  1. Application Real-Time Monitoring Service (ARMS) コンソール にログインします。[インスタンス] ページで、Prometheus インスタンスの名前をクリックします。

  2. 左側のナビゲーションペインで、設定 をクリックします。表示されるページで、設定 タブをクリックします。アクション 列の レプリカ をクリックします。表示されるダイアログボックスで、エージェントレプリカの数を指定し、OK をクリックします。ert

結果を確認する

エージェントレプリカの数を調整した後、Prometheus エージェントの自己監視ダッシュボードで、レプリカの数が変更されたかどうか、および監視が正常かどうかを確認できます。次の手順を実行します。

  1. ARMS コンソール にログインします。[インスタンス] ページで、Prometheus インスタンスの名前をクリックします。

  2. 左側のナビゲーションペインで、ダッシュボード をクリックします。Prometheus エージェントダッシュボードをクリックします。表示されるページで、Prometheus エージェントの実行状態、リアルタイムメトリックと履歴メトリックのキャプチャに費やされた時間、キャプチャされたターゲットの数、送信されたデータ量、およびリソース使用量を確認できます。詳細については、統合管理 を参照してください。