OSS監控服務為您提供系統基本運行狀態、性能以及計量等方面的監控數據指標,並且提供自訂報警服務,幫助您跟蹤請求、分析使用方式、統計業務趨勢,及時發現以及診斷系統的相關問題。

OSS監控指標分類詳細,主要可以歸類為基礎服務指標、性能指標和計量指標,詳見OSS監控指標參考

高即時性

高即時性能夠暴露可能隱藏的峰穀問題,顯示出實際的波動情況,有助於分析和評估業務場景。OSS監控指標的即時性(除了計量指標)是按照分鐘粒度採集彙總的,輸出延時不超過1分鐘,即每分鐘內的用戶資訊都會彙總成一個值,並在一分鐘內輸出,代表這一分鐘的監控情況。

計量指標相關說明

為了保持和計費策略的統一,計量指標的收集和展現存在一定的特殊性,說明如下:

  • 計量指標數據是按照小時粒度輸出的,即每個小時內的資源計量資訊都會彙總成一個值,代表這個小時總的計量情況。
  • 計量指標數據會有近半個小時的延時輸出。
  • 計量指標數據的數據時間是指該數據所統計時間區間的開始時間。
  • 計量採集截止時間是當月最後一條計量數據所統計時間區間的結束時間,如果當月沒有產生任何一條計量監控數據,那麼計量資料擷取截止時間為當月1號0點。
  • 計量指標數據的展示都是盡最大可能推送的,準確計量請參考費用中心—使用記錄

舉個例子,假設用戶只使用PutObject這個請求上傳數據,每分鐘平均10次。那麼在2018-05-10 08:00:00到2018-05-10 09:00:00這一個小時時間區間內,用戶的PUT類請求數的計量數據值為600次(10*60分鐘),數據時間為2018-05-10 08:00:00,這條數據將會在2018-05-10 09:30:00左右被輸出。如果這條數據是從2018-05-01 00:00:00開始到現在的最後一條計量監控數據,那麼當月的計量資料擷取截止時間就是2018-05-10 09:00:00。如果2018年5月該用戶沒有產生任何的計量數據,那麼計量採集截止時間為2018-05-01 00:00:00。

OSS報警服務

每個帳號最多能夠設定1000項報警規則。除計量指標和統計指標,其他的監控指標均可配置為報警規則加入報警監控,並且一個監控指標可以配置為多個不同的報警規則。

監控數據保留原則

監控數據保留31天,過期自動清除,如果需要離線分析監控數據或者長期下載並保存曆史監控,需要使用工具或者編寫代碼來讀取Cloud Monitor資料存放區,請使參考OpenAPI訪問監控數據

控制台展示最近7天的數據,如果希望查詢7天以上的曆史數據,建議使用Cloud Monitor提供的SDK進行查詢,參考OpenAPI訪問監控數據

OpenAPI訪問監控數據

OSS服務的相關監控指標數據可以通過Cloud Monitor提供的OpenAPI訪問,使用方法可以參考如下文檔:

監控、診斷和故障排除

監控診斷和故障排除通過詳細介紹以下各個方面的內容幫助您更好的了解OSS服務的運行狀態並進行自主診斷和故障排除:

  • 服務監控

    介紹如何使用監控服務持續監控OSS儲存服務的健全狀態和性能。

  • 跟蹤診斷

    介紹如何使用OSS監控服務和logging記錄功能診斷問題;另外,還介紹如何關聯各種記錄檔中的相關資訊進行跟蹤診斷。

  • 故障排除

    提供常見的問題場景和故障排除方法。

注意事項

OSS Bucket全域唯一,如果刪掉Bucket之後再建立同名的Bucket,那麼被刪掉的Bucket的監控以及報警規則會作用在新的同名Bucket上。