按量執行個體數上限表示同一時刻最多能同時使用的執行個體數,QPS表示應用每秒能處理的請求數,兩者是不同的概念。
按量執行個體的實際使用數可以按以下公式估算:
單一實例單並發情境:同一執行個體同時只處理一個請求。
實際使用執行個體數=每秒請求數×請求處理時間(s)
假設預期每秒需處理10000個請求。如果平均每個請求處理時間為1s,那麼所需的最大按量執行個體數為10000×1(s)=10000;如果平均每個請求處理時間為10 ms,那麼所需的最大按量執行個體數為10000×0.01(s)=100。
單一實例多並發情境:同一執行個體同時可處理多個請求。
實際使用執行個體數=每秒請求數×請求處理時間(s)÷單一實例並發度
假設預期每秒需處理10000個請求,設定單一實例並發度為10。如果平均每個請求處理時間為1s,那麼所需的最大按量執行個體數為10000×1(s)÷10=1000;如果平均每個請求處理時間為10 ms,那麼所需的最大按量執行個體數為10000×0.01÷10=10。