當您需要自訂資料庫監控或者比較不同執行個體的運行情況時,通過監控大盤,您可以自由選擇監控的執行個體和指標,實現自訂指標監控、不同執行個體間的效能對比,以及進行多指標聯動分析,從而全面把握資料庫的健康情況。
前提條件
RDS PostgreSQL資料庫執行個體為高可用系列。
資料庫自治服務DAS從2022年5月20日開始逐步為RDS PostgreSQL提供監控大盤功能。
新增監控大盤
-
登入RDS管理主控台。
-
在左側導覽列中單擊運維與監控 > 性能監測。
-
在性能監測頁,單擊監控大盤頁簽。
-
在目標資料庫引擎頁簽,單擊新增監控大盤。
-
輸入新增監控大盤的名稱,單擊確定。
-
單擊選擇執行個體和指標,分別選中目標執行個體和需要監控的指標,並單擊
。說明-
選擇目標執行個體時,最多可同時選擇32個執行個體進行監控。
-
監控指標的含義請參見監控指標。
在選擇指標和執行個體彈窗中,勾選目標執行個體,並在選擇指標地區勾選需要監控的PostgreSQL指標(包含主機指標和PostgreSQL基礎監控兩類),然後單擊確認選擇。
-
-
單擊確認選擇即可。
說明如果需要修改大盤中的執行個體或指標,可以單擊添加執行個體和監控指標進行修改。
查看監控大盤中目標執行個體的指標趨勢
登入RDS管理主控台。
在左側導覽列中單擊運維與監控 > 性能監測。
在性能監測頁,選擇監控大盤頁簽。
在目標資料庫引擎頁簽,選擇需要查看的監控大盤,並設定查詢時間,即可查看該時間段內監控指標的趨勢圖。
說明選擇時間範圍時,結束時間需晚於開始時間,且間隔不超過七天。
通過執行個體篩選,選擇多個執行個體對比查看監控指標。
開啟自動重新整理,系統每5秒重新整理一次。
開啟聯動圖表,開啟多指標聯動,查看同一時間點中不同監控指標的值。
通過圖表布局,您可以設定每行顯示監控指標趨勢圖的數量。
單擊添加執行個體和監控指標,修改大盤中的執行個體或監控指標。
單擊某個監控指標趨勢圖中的詳情,放大該監控指標的趨勢圖,並且可以修改時間查看該監控指標不同時間的變化趨勢。
單擊某個監控指標趨勢圖中的移除,在監控大盤中刪除該監控指標。
監控指標
|
參數類型 |
參數 |
說明 |
|
主機指標 |
cpu_sys_ratio |
PostgreSQL進程的核心態CPU佔用率。 |
|
cpu_user_ratio |
PostgreSQL進程的使用者態CPU佔用率。 |
|
|
cpu_usage |
PostgreSQL進程的CPU佔用率。 |
|
|
mem_usage |
PostgreSQL進程的記憶體使用量率。 |
|
|
data.r_s |
data目錄所在磁碟讀IOPS。 |
|
|
data.iops |
data目錄所在磁碟IOPS。 |
|
|
data.w_s |
data目錄所在磁碟寫IOPS。 |
|
|
local_fs_size_total |
磁碟總空間。 |
|
|
data.fs.used |
data目錄所在磁碟總體使用量。 |
|
|
data.fs.usage |
data目錄所在磁碟總體使用率。 |
|
|
network_out_io |
PostgreSQL進程的網路流出流量。 |
|
|
network_io |
PostgreSQL進程的網路流量。 |
|
|
network_in_io |
PostgreSQL進程的網路流入流量。 |
|
|
PostgreSQL基礎監控 |
waiting_connection |
當前處於等待狀態的串連數。 |
|
idle_in_transaction |
當前處於空閑狀態的會話數。 |
|
|
active_session |
當前活躍串連數。 |
|
|
total_session |
當前串連總數。 |
|
|
tup_inserted |
每秒插入記錄數。 |
|
|
tup_deleted |
每秒刪除記錄數。 |
|
|
tup_updated |
每秒更新記錄數。 |
|
|
tup_returned |
每秒全表掃描記錄數。 |
|
|
tup_fetched |
每秒索引掃描回表記錄數。 |
|
|
tps |
PostgreSQL TPS。 |
|
|
xact_rollback |
每秒交易回復數。 |
|
|
xact_commit |
每秒事務提交數。 |
|
|
deadlocks |
每秒死結數。 |
|
|
oldest_snapshot |
膨脹點,多久以前的垃圾可以被回收。 |
|
|
max_sent_delay |
PostgreSQL備庫發送延遲。 |
|
|
max_replay_delay |
備庫APPLY延遲。 |
|
|
long_query_5s |
當前系統中執行時間大於等於5秒的SQL的數量。 |
|
|
long_query_1s |
當前系統中執行時間大於等於1秒的SQL的數量。 |
|
|
long_query_3s |
當前系統中執行時間大於等於3秒的SQL的數量。 |
|
|
long_idle_in_transaction_3s |
當前系統中,長期(大於等於3秒)處於閒置事務數量。 |
|
|
long_idle_in_transaction_5s |
當前系統中,長期(大於等於5秒)處於閒置事務數量。 |
|
|
long_idle_in_transaction_1s |
當前系統中,長期(大於等於1秒)處於閒置事務數量。 |
|
|
long_2pc_1s |
當前系統中,大於等於1秒未結束的2PC的事務數量。 |
|
|
long_2pc_5s |
當前系統中,大於等於5秒未結束的2PC的事務數量。 |
|
|
long_2pc_3s |
當前系統中,大於等於3秒未結束的2PC的事務數量。 |
監控指標含義也可以在控制台的監控大盤中單擊每個指標後的
查看。