各 Cloud-native API Gateway インスタンス仕様の容量しきい値、QPS ベンチマーク、およびクォータ制限について説明します。
容量しきい値
次の表に、ゲートウェイ仕様ごとの容量しきい値を示します。メトリックが警告しきい値を下回っている場合、完全な SLA カバー率が適用されます。重大なワークロードの場合は、メトリックを安全しきい値未満に維持してください。
-
安全しきい値:トラフィックが 2 倍になっても、ゲートウェイは高いスループットと低いレイテンシーを維持します。
-
警告しきい値:このレベルを超えると、トラフィックの急増時にレイテンシーの増加や安定性のリスクが生じる可能性があります。
-
apigw.dev.x1仕様は、SLA 保証のないシングルノードデプロイメントであり、テスト専用です。本番環境では、マルチノード仕様を使用する必要があります。 -
CPU またはメモリが警告しきい値を超えた場合、SLA はリクエストの失敗をカバーしません。ゲートウェイはこれらのしきい値に対するアラームを提供します。ゲートウェイの負荷とトリガーされたアラームを注意深く監視してください。
|
ゲートウェイ仕様 |
クライアント接続数 |
新規 HTTPS 接続数 |
CPU 使用率 |
メモリ使用量 |
||||
|
安全しきい値 |
警告しきい値 |
安全しきい値 |
警告しきい値 |
安全しきい値 |
警告しきい値 |
安全しきい値 |
警告しきい値 |
|
|
|
12,000 |
24,000 |
400 |
800 |
30% |
60% |
75% |
75% |
|
|
24,000 |
48,000 |
800 |
1,600 |
30% |
60% |
75% |
75% |
|
|
48,000 |
96,000 |
1,600 |
3,200 |
30% |
60% |
75% |
75% |
|
|
96,000 |
192,000 |
3,200 |
6,400 |
30% |
60% |
75% |
75% |
|
|
192,000 |
384,000 |
6,400 |
12,800 |
30% |
60% |
75% |
75% |
|
|
384,000 |
768,000 |
12,800 |
25,600 |
30% |
60% |
75% |
75% |
|
|
576,000 |
1,152,000 |
19,200 |
38,400 |
30% |
60% |
75% |
75% |
|
|
768,000 |
1,536,000 |
25,600 |
51,200 |
30% |
60% |
75% |
75% |
|
|
1,536,000 |
3,072,000 |
51,200 |
102,400 |
30% |
60% |
75% |
75% |
|
|
2,304,000 |
4,608,000 |
76,800 |
153,600 |
30% |
60% |
75% |
75% |
|
|
3,072,000 |
6,144,000 |
102,400 |
204,800 |
30% |
60% |
75% |
75% |
QPS パフォーマンス
QPS スループットは、応答サイズ、HTTPS、および gzip 圧縮によって異なります。次の表に、CPU 使用率 30% における各仕様の控えめな (ワーストケースの) QPS 値を示します。
新規 HTTPS 接続は CPU 負荷が高くなります。同時 HTTPS 接続レートが高いワークロードの場合は、短時間接続データを使用して容量を計画してください。
|
仕様 |
apigw.dev.x1 |
apigw.small.x1 |
apigw.small.x2 |
apigw.small.x4 |
apigw.medium.x1 |
apigw.medium.x2 |
apigw.medium.x3 |
apigw.large.x1 |
apigw.large.x2 |
apigw.large.x3 |
apigw.large.x4 |
|||
|
接続タイプ |
応答サイズ (KB) |
HTTPS |
Gzip 圧縮 |
QPS リファレンス |
||||||||||
|
短時間接続 |
1 |
いいえ |
いいえ |
1,700 |
3,400 |
6,800 |
13,600 |
28,000 |
56,000 |
84,000 |
112,000 |
224,000 |
336,000 |
448,000 |
|
はい |
いいえ |
500 |
1,000 |
2,000 |
4,000 |
8,700 |
17,400 |
26,100 |
34,800 |
69,600 |
104,400 |
139,200 |
||
|
長時間接続 |
1 |
いいえ |
いいえ |
2,200 |
4,400 |
8,800 |
17,600 |
35,000 |
70,000 |
105,000 |
140,000 |
280,000 |
420,000 |
560,000 |
|
はい |
いいえ |
2,000 |
4,000 |
8,000 |
16,000 |
32,000 |
64,000 |
96,000 |
128,000 |
256,000 |
384,000 |
512,000 |
||
|
はい |
はい |
1,700 |
3,400 |
6,800 |
13,600 |
28,000 |
56,000 |
84,000 |
112,000 |
224,000 |
336,000 |
448,000 |
||
|
10 |
いいえ |
いいえ |
1,800 |
3,600 |
7,200 |
14,400 |
30,000 |
60,000 |
90,000 |
120,000 |
240,000 |
360,000 |
480,000 |
|
|
はい |
いいえ |
1,700 |
3,400 |
6,800 |
13,600 |
28,000 |
56,000 |
84,000 |
112,000 |
224,000 |
336,000 |
448,000 |
||
|
はい |
はい |
1,000 |
2,000 |
4,000 |
8,000 |
16,000 |
32,000 |
48,000 |
64,000 |
128,000 |
192,000 |
256,000 |
||
クォータ制限
グローバルクォータ
グローバルクォータは、すべてのインスタンス仕様に適用されます。クォータの引き上げをリクエストするには、チケットを送信してください。
|
クォータ項目 |
クォータ |
|
リージョンあたりのインスタンス数 |
100 |
|
API あたりのオペレーション数 |
2,000 |
インスタンス固有のクォータ
クォータはインスタンス仕様に応じてスケールします。スペックアップしてもクォータが不足する場合は、チケットを送信して引き上げをリクエストしてください。
|
Dev |
Small |
Medium |
Large |
|
|
公開されたドメイン名の数 |
100 |
200 |
500 |
1,000 |
|
関連付けられたサービスの数 |
200 |
800 |
2,000 |
4,000 |
|
サービスノードの数 |
400 |
1,600 |
4,000 |
8,000 |
|
合計ルート数 (HTTP API ルート、REST API オペレーション、Ingress ルートを含む) |
2,500 |
5,000 |
7,500 |
10,000 |
|
Kubernetes サービスソースの数 |
3 |
3 |
5 |
5 |
|
インストール済みプラグインの数 |
5 |
10 |
20 |
30 |
|
アップロードされたカスタムプラグインの数 |
10 |
20 |
50 |
80 |
|
コンシューマー権限付与の数 |
500 |
2,000 |
6,000 |
10,000 |