總覽頁面協助您快速瞭解KMS執行個體的監控大盤,包含KMS執行個體規格、執行個體狀態以及監控項指標等,您也可以配置警示規則監控這些指標項。本文介紹如何查看KMS執行個體的監控大盤以及如何配置CloudMonitor警示。
概述
如果頁面提示“當前執行個體版本過低,若要查看全量監控指標,請提交工單確認升級時間”,請您升級KMS執行個體的鏡像版本。
KMS支援和CloudMonitor整合,在總覽頁面為您展示監控項指標的趨勢圖。關於CloudMonitor的詳細資料,請參見什麼是CloudMonitor。
您也可以根據業務的實際使用方式,設定CloudMonitor警示,提前識別並解決KMS使用中的問題。常見的警示規則設定項:
請求數每秒的平均值已達到閾值的90%。關於效能資料的詳細內容,請參見效能資料。
例如:您購買了計算效能規格為1000(次/秒)的軟體密鑰管理執行個體,可以設定連續3個周期執行個體總分鐘請求數閾值到達54,000(1000次/秒*60秒*90%)時進行預警,表示該指標的平均值已經超過了執行個體效能所能承受的90%,此時建議您升級執行個體的規格擴充性能。
連續3個周期出現4xx錯誤請求或5xx錯誤請求。
4xx錯誤請求,一般是非法請求或指定資源不存在等原因,您可以根據錯誤提示進行排查。5xx一般是服務當前不可用,請稍後重試或聯絡阿里雲技術支援人員。
前提條件
如果登入使用者是RAM使用者(子帳號),需在RAM控制台將唯讀訪問CloudMonitor的許可權(AliyunCloudMonitorReadOnlyAccess)授予RAM使用者。具體操作,請參見為RAM使用者授權。
查看KMS執行個體總覽和監控資料
登入Key Management Service控制台,在頂部功能表列選擇地區後,在左側導覽列單擊总览頁面。
選擇实例ID後,可查看KMS執行個體總覽和監控資料。
說明最多支援您查看30天內的監控項指標資料。
(可選)開啟自動重新整理開關,KMS會每隔1分鐘自動重新整理監控資料。

配置監控指標警示
方案一:在KMS中設定一鍵警示
KMS內建了通用警示規則,預設關閉,但僅支援針對4xx錯誤請求、5xx錯誤請求、請求時延設定警示。如需為其他指標設定警示,請使用方式情節二。
該方式的警示接收人,預設為系統建立的雲帳號警示連絡人,如需修改請到CloudMonitor控制台修改。具體操作,請參見修改警示連絡人或警示聯絡組。
登入Key Management Service控制台,在頂部功能表列選擇地區後,在左側導覽列單擊总览頁面。
選擇執行個體後,單擊一鍵警示並開啟開關。
說明開啟一鍵警示後,警示規則會作用於當前阿里雲帳號下的所有KMS執行個體。
如果您之前開啟過一鍵警示,並修改了警示規則。再次開啟一鍵警示時,警示規則會恢複到系統預設的警示規則。

(可選)禁用、修改、刪除系統預設的警示規則。
如果您只針對部分監控指標設定警示,或者需要設定更精細化的警示規則,可以禁用、修改警示規則。

方案二:在CloudMonitor中設定警示
登入Key Management Service控制台,在頂部功能表列選擇地區後,在左側導覽列單擊总览頁面。
在總覽頁面單擊設定警示規則,跳轉到CloudMonitor控制台。

在警示規則頁面,單擊建立警示規則完成配置。具體操作,請參見建立警示規則。
建立警示規則時,產品請選擇Key Management Service。
支援的CloudMonitor指標
監控項 | 指標含義 | 是否支援警示 | 彙總維度(dimensions) | 統計方法(statistics) |
執行個體分鐘請求數 | 一分鐘請求數。 | 是 | userId,regionId,instanceId | Value |
對稱加解密分鐘請求數 | 一分鐘對稱運算請求數。 | 是 | userId,regionId,instanceId | Value |
非對稱式加密分鐘請求數 | 一分鐘非對稱式加密請求數。 | 是 | userId,regionId,instanceId | Value |
非對稱解密分鐘請求數 | 一分鐘非對稱解密請求數。 | 是 | userId,regionId,instanceId | Value |
非對稱簽名分鐘請求數 | 一分鐘非對稱簽章要求數。 | 是 | userId,regionId,instanceId | Value |
非對稱驗簽分鐘請求數 | 一分鐘非對稱驗簽請求數。 | 是 | userId,regionId,instanceId | Value |
憑據運算分鐘請求數 | 一分鐘憑據請求數。 | 是 | userId,regionId,instanceId | Value |
其他分鐘請求數 | 一分鐘其他運算請求數。 | 是 | userId,regionId,instanceId | Value |
5xx 錯誤請求 | 一分鐘5xx 錯誤碼請求。 | 是 | userId,regionId,instanceId | Value |
4xx 錯誤請求 | 一分鐘4xx 錯誤碼請求。 | 是 | userId,regionId,instanceId | Value |
請求時延 | 一分鐘所有請求時延均值。 | 是 | userId,regionId,instanceId | Value |
KMS執行個體CPU利用率 | 執行個體CPU利用率。 | 是 | user_id,instance_id | Value |
KMS執行個體對稱QPS利用率 | 執行個體對稱QPS利用率。 | 是 | user_id,instance_id | Value |
KMS執行個體非對稱QPS利用率 | 執行個體非對稱QPS利用率。 | 是 | user_id,instance_id | Value |
配置樣本:KMS執行個體QPS監控警示
如果您希望觀察KMS執行個體的QPS使用率並預警潛在效能瓶頸,以此判斷是否需要升級KMS執行個體的規格,可以針對QPS相關的指標(執行個體分鐘請求數)設定動態閾值警示。當執行個體分鐘請求數到達規格的90%時,CloudMonitor進行警示。
以KMS執行個體的QPS是2000為例,執行個體分鐘請求數提醒的閾值需要設定為2000(次/秒)*60(秒)*90%=108,000次,詳細配置請流程請參見如下步驟。
登入Key Management Service控制台,在頂部功能表列選擇地區後,在左側導覽列單擊总览頁面。
在總覽頁面單擊設定警示規則,跳轉到CloudMonitor控制台。
在警示規則頁面,單擊建立警示規則,參考下表設定警示規則,然後單擊確定。
配置項
說明
產品
選擇Key Management Service。
資源範圍
選擇執行個體。
關聯資源
單擊添加資源,勾選要監控的KMS執行個體,然後單擊確定。
規則描述

規則名稱:自訂規則名稱。
指標類型:選擇簡單指標。
監控指標:選擇執行個體分鐘請求數,設定為警告,連續3個周期監控值>=108,000。
通道沉默周期
根據您的需求設定,通常保持預設24小時即可。
如果監控指標在通道沉默周期內持續超過警示閾值,在通道沉默周期內不會重複發送警示通知,如果監控指標在通道沉默周期後仍未恢複正常,則CloudMonitor再次發送警示通知。
生效時間、標籤、警示連絡人群組
請根據您的實際情況填寫。
進階設定
警示回調、推送渠道、恢複通知、無資料處理方法,保持預設即可。
相關文檔
KMS支援與Cloud Monitor (CMS)整合,提供系統事件的監控以及警示功能,詳情可參見警示事件。