全部產品
Search
文件中心

Managed Service for Prometheus:Agent自動擴容能力說明

更新時間:Nov 15, 2025

Agent副本數量不足可能會導致Agent頻繁地因記憶體溢出而重啟,進而導致資料擷取延遲甚至丟失。藉助可觀測監控 Prometheus 版的Agent副本水平自動擴容功能,可以規避這一問題。

Prometheus Agent自動擴容(HPA)的觸發時機和策略

Prometheus Agent啟動後會進行目標抓取以此擷取時間軸數量,然後根據每個採集副本的採集能力進行計算所需副本數,若發現需要多副本採集時HPA會實現自動擴容。Prometheus Agent自動擴容的具體策略如下:

  • 當Agent單副本運行時:其Master副本既需要執行Targets服務發現又需要執行Targets抓取,當Master記憶體達到75%時,則會自動切換為多副本模式,但有時因為Targets一次性抓取太大,會造成Master OOM後再變為多副本。

  • 當Agent多副本運行時:其Master副本僅需執行Targets服務發現,由Worker副本執行Targets抓取。當Worker副本記憶體使用量超過60%時,會進行Targets抓取任務再分配,同時計算出所需的Worker副本數,實現自動擴容,以確保這些Worker副本的平均記憶體使用量不會超過60%。

    說明

    根據多因子協同調度演算法,每個Agent每輪可以抓取的總Target數量與總Metrics數量的乘積上限為40億,記憶體使用量上限為70%。而每個Agent可以抓取的Metrics數量級上限為4,000,000。

如何開啟

Prometheus Helm版本升級至v1.0.0或以上後,會自動啟用Prometheus Agent HPA。升級Helm版本的具體操作,請參見【組件升級】Helm1.1.17/Agent v4.0.0的升級內容與升級方式

Prometheus Agent自動擴容不會引發Agent採集副本數無上限增加(預設最大採集副本數為30),Prometheus Agent不會執行自動縮容,因為縮容可能會造成資料丟失問題。