當使用者的請求量超出OSS使用限制後會觸發OSS流控,觸發流控會對使用者的請求產生一定的影響。您只需要在CloudMonitor管理主控台進行簡單的配置,即可完成對OSS請求指標的即時監控,並在觸發流控時及時收到警示通知。
背景資訊
OSS提供了使用者層級和Bucket層級的流控,支援的類別主要包括頻寬流控和QPS流控。當您訪問OSS的QPS、頻寬超出OSS使用限制時,訪問速度會受到OSS流控的限制。如果觸發了頻寬流控,則訪問OSS的延遲會增加。如果觸發了QPS流控,則OSS會丟棄部分請求。關於頻寬流控和QPS流控的限制資訊,請參見使用限制及效能指標 。
您可以通過CloudMonitor管理主控台建立OSS流控事件警示規則,並指定在監測到使用者發送到OSS指定類型的請求量觸發流控或達到彙報閾值時,以簡訊、郵件和DingTalk機器人的方式向指定連絡人群組發送警示資訊。
前提條件
已建立用於接收流控警示資訊的連絡人群組,並向連絡人群組添加多個連絡人。具體操作,請參見建立警示連絡人或警示連絡人群組。
建立警示規則
-
在左側導覽列,選擇。
在事件監控頁簽,單擊另存新檔警示。
-
在建立/修改事件警示面板,設定以下參數,其他參數保留預設值,然後單擊確定。
|
參數 |
說明 |
|
警示規則名稱 |
設定為rule1。 |
|
產品類型 |
選擇Object Storage Service。 |
|
事件類型 |
選擇全部類型。 |
|
事件等級 |
選擇警告和資訊。 |
|
事件名稱 |
選擇全部事件。關於CloudMonitor支援的OSS流控事件的含義及說明,請參見CloudMonitor支援的OSS流控事件。 |
|
報警聯繫人組 |
選中警示方式下的警示通知,然後選擇已建立的警示連絡人群組。 |
|
通知方式 |
選擇Warning(簡訊+郵件+WebHook)。 |
以上事件警示規則配置完成後,如果請求觸發OSS流控或者超過彙報閾值,則CloudMonitor會自動向指定的連絡人發送警示通知。警示通知中包含警示資源、事件名稱、事件類別目錄以及事件詳情等資訊。關於警示通知的更多資訊,請參見警示通知。
流控警示為每分鐘一次,一分鐘內如果有30s或以上時間觸發流控則產生警示。彙報閾值為每10分鐘一次,只要1s內觸發彙報閾值則產生警示。
警示通知
如果指定連絡人收到了流控觸發警示通知,請參見以下表格瞭解各類流控事件觸發的原因、影響、對應的解決方案以及事件的詳細內容。
如果您希望在收到User層級的警示事件後,查看歸屬目前使用者下所有Bucket的流量使用方式,請提前建立OSS監控大盤。具體步驟,請參見建立系統預置大盤。
警示通知事件名稱
下表中的彙報閾值=流控閾值*0.8。
|
事件名稱 |
觸發原因 |
影響 |
解決方案 |
|
BucketIngressBandwidthThresholdExceeded |
|
上傳請求將會被流控且請求延遲會增加。 |
合理降低上傳請求並發數。 |
|
BucketEgressBandwidthThresholdExceeded |
|
下載請求將會被流控且請求延遲會增加。 |
合理降低下載請求並發數。 |
|
BucketQpsThresholdExceeded |
|
OSS會拒絕響應部分請求並返回503。 |
合理降低每秒請求數。 |
|
UserIngressBandwidthThresholdExceeded |
|
上傳請求將會被流控且請求延遲會增加。 |
合理降低上傳請求並發數。 |
|
UserEgressBandwidthThresholdExceeded |
|
下載請求將會被流控且請求延遲會增加。 |
合理降低下載請求並發數。 |
|
UserQpsThresholdExceeded |
|
OSS會拒絕響應部分請求。 |
合理降低每秒請求數。 |
|
BucketImageCpuThresholdExceeded |
當前Bucket用於處理圖片請求的CPU核心數大於Bucket CPU核心數流控閾值 |
圖片處理類型的請求延遲會增加。 |
合理降低圖片處理請求並發數。 |
|
UserImageCpuThresholdExceeded |
目前使用者的所有Bucket用於處理圖片請求的CPU核心數之和大於該使用者的CPU核心數流控閾值 |
圖片處理類型的請求延遲會增加。 |
合理降低圖片處理請求並發數。 |
|
BucketMirrorIngressBandwidthThresholdExceeded |
當前Bucket鏡像回源類型請求頻寬大於Bucket鏡像回源類型請求的頻寬流控閾值 |
鏡像回源請求延遲會增加。 |
合理降低鏡像回源類型請求並發數。 |
|
BucketMirrorQpsThresholdExceeded |
當前Bucket鏡像回源類型的每秒請求數大於Bucket鏡像回源類型請求的流控閾值 |
OSS會拒絕部分鏡像回源類型請求。 |
合理降低鏡像回源類型每秒請求數。 |
|
UserMirrorIngressBandwidthThresholdExceeded |
目前使用者的所有Bucket鏡像回源類型上傳請求頻寬之和大於使用者鏡像回源頻寬流控閾值 |
鏡像回源請求延遲會增加。 |
合理降低鏡像回源類型請求並發數。 |
|
UserMirrorQpsThresholdExceeded |
目前使用者的所有Bucket鏡像回源類型的每秒請求數之和大於使用者鏡像回源類型請求的流控閾值 |
OSS將拒絕響應部分鏡像回源類型的請求。 |
合理降低鏡像回源類型每秒請求數。 |
|
BucketIngressBandwidth |
|
Bucket的上行請求延遲會增加。 |
合理降低上行請求並發數。 |
|
BucketEgressBandwidth |
|
Bucket的下行請求延遲會增加。 |
合理降低下行請求並發數。 |
|
UserIngressBandwidth |
|
使用者的上行請求延遲會增加。 |
合理降低上行請求並發數。 |
|
UserEgressBandwidth |
|
使用者的下行請求延遲會增加。 |
合理降低下行請求並發數。 |
警示通知詳細內容
警示通知樣本:
{
"AvgSeverity": "10",
"QosType": "IngressBandwidth",
"TrafficSource": "net_all",
"TargetRate": "10737418240",
"Requester": "300xxxx",
"BucketGroup": "test-group",
"ResourcePool": "resource-pool-for-ai"
}
涉及的參數說明如下:
|
參數 |
說明 |
樣本值 |
|
AvgSeverity |
流控的程度。數值越高代表流控越強,延時越高。取值範圍為0~100。 |
10 |
|
QosType |
觸發的流控類型。取值如下:
|
IngressBandwidth |
|
TrafficSource |
觸發流控的流量來源。取值如下:
|
net_all |
|
TargetRate |
頻寬和QPS的取值。
|
10737418240 |
|
Requester |
如果Bucket要求者、資源集區要求者頻寬達到流控閾值,則事件詳情中會返回Requester欄位,以UID的形式標識具體的要求者。 |
300xxxx |
|
BucketGroup |
如果資源集區內BucketGroup頻寬達到流控閾值,則事件詳情中會返回BucketGroup欄位,以BucketGroup名稱的形式標識BucketGroup。 |
test-group |
|
ResourcePool |
如果資源集區頻寬達到流控閾值,則事件詳情中會返回ResourcePool欄位,以資源集區名稱的形式標識資源集區。 |
resource-pool-for-ai |
如何查看User層級的流量使用方式?
以下以收到警示事件UserEgressBandwidthThresholdExceeded為例,您可以通過以下步驟查看歸屬目前使用者下各個Bucket的流量使用方式。
在左側導覽列,選擇。
-
在監控大盤頁面,單擊OSS監控大盤右側的查看。
-
根據流控警示類型,在流量監控地區查看具體哪些Bucket佔用了較高的流量。
