すべてのプロダクト
Search
ドキュメントセンター

API Gateway:容量計画

最終更新日:Dec 12, 2025

このトピックでは、クラウドネイティブ API Gateway のさまざまなインスタンスタイプの容量のしきい値と 1 秒あたりのクエリ数 (QPS) のパフォーマンスリファレンスについて説明します。この情報は、ニーズに合わせて適切なインスタンスタイプを選択するのに役立ちます。

キャパシティのしきい値

次の表に、さまざまなゲートウェイインスタンスタイプの容量のしきい値を示します。ゲートウェイの容量メトリックがアラートレベルを下回っている場合、完全なサービスレベルアグリーメント (SLA) のカバレッジが提供されます。コアサービスの場合、より高い安定性を確保するために、ゲートウェイの容量メトリックを安全レベル未満に維持してください。

  • 安全レベル:バーストトラフィックが 2 倍になっても、ゲートウェイシステムは高いスループットと低いレイテンシを維持できます。

  • アラートレベル:ゲートウェイがこのレベルを超えて動作すると、レイテンシが増加し、トラフィックバースト時に安定性の脅威が生じる可能性があります。

  • apigw.dev.x1 インスタンスタイプはシングルノードデプロイメントであり、SLA は含まれていません。テスト目的でのみ使用してください。本番サービスでは、必ず複数のノードを持つゲートウェイインスタンスタイプを使用してください。

  • CPU またはメモリ使用量がアラートレベルを超えたことによるリクエストの失敗は、SLA の対象外です。CPU とメモリ使用量がアラートレベルに達すると、ゲートウェイはアラートを生成します。ゲートウェイの負荷レベルとアラートを速やかに監視してください。

ゲートウェイインスタンスタイプ

クライアント接続

1 秒あたりの新規 HTTPS 接続数

CPU 使用率

メモリ使用量

安全レベル

アラートレベル

安全レベル

アラートレベル

安全レベル

アラートレベル

安全レベル

アラートレベル

apigw.dev.x1

12,000

24,000

400

800

30%

60%

75%

75%

apigw.small.x1

24,000

48,000

800

1,600

30%

60%

75%

75%

apigw.small.x2

48,000

96,000

1,600

3,200

30%

60%

75%

75%

apigw.small.x4

96,000

192,000

3,200

6,400

30%

60%

75%

75%

apigw.medium.x1

192,000

384,000

6,400

12,800

30%

60%

75%

75%

apigw.medium.x2

384,000

768,000

12,800

25,600

30%

60%

75%

75%

apigw.medium.x3

576,000

1,152,000

19,200

38,400

30%

60%

75%

75%

apigw.large.x1

768,000

1,536,000

25,600

51,200

30%

60%

75%

75%

apigw.large.x2

1,536,000

3,072,000

51,200

102,400

30%

60%

75%

75%

apigw.large.x3

2,304,000

4,608,000

76,800

153,600

30%

60%

75%

75%

apigw.large.x4

3,072,000

6,144,000

102,400

204,800

30%

60%

75%

75%

QPS パフォーマンスリファレンス

ゲートウェイの QPS は、応答サイズ、HTTPS または gzip が有効になっているかどうかなど、複数の要因に影響されます。次の表は、ゲートウェイの CPU 使用率が 30% の場合における QPS 値の控えめなリファレンス (最悪のシナリオ) を示しています。

説明

新しい HTTPS 接続を作成すると、大量の CPU リソースが消費されます。同時実行される短時間 HTTPS 接続数が多いサービスの場合は、以下の表にある HTTPS 短時間接続データに基づいてゲートウェイの容量を評価してください。

ゲートウェイインスタンスタイプ

apigw.dev.x1

apigw.small.x1

apigw.small.x2

apigw.small.x4

apigw.medium.x1

apigw.medium.x2

apigw.medium.x3

apigw.large.x1

apigw.large.x2

apigw.large.x3

apigw.large.x4

接続タイプ

応答サイズ (KB)

HTTPS 有効

gzip を使用するかどうか

安全な CPU レベル (30%) での QPS リファレンス

短命な接続

1

いいえ

いいえ

1,700

3,400

6,800

13,600

28,000

56,000

84,000

112,000

224,000

336,000

448,000

はい

いいえ

500

1,000

2,000

4,000

8,700

17,400

26,100

34,800

69,600

104,400

139,200

永続的な接続

1

いいえ

いいえ

2,200

4,400

8,800

17,600

35,000

70,000

105,000

140,000

280,000

420,000

560,000

はい

いいえ

2,000

4,000

8,000

16,000

32,000

64,000

96,000

128,000

256,000

384,000

512,000

はい

はい

1,700

3,400

6,800

13,600

28,000

56,000

84,000

112,000

224,000

336,000

448,000

10

いいえ

いいえ

1,800

3,600

7,200

14,400

30,000

60,000

90,000

120,000

240,000

360,000

480,000

はい

いいえ

1,700

3,400

6,800

13,600

28,000

56,000

84,000

112,000

224,000

336,000

448,000

はい

はい

1,000

2,000

4,000

8,000

16,000

32,000

48,000

64,000

128,000

192,000

256,000

クォータ制限

グローバルクォータ

グローバルクォータは、ゲートウェイインスタンスタイプに依存しません。クォータの引き上げをリクエストするには、チケットを送信してください。

デフォルトクォータ

クォータ制限

リージョンあたりのインスタンス数

50

100

リージョンあたりの合計 API 操作数

10,000

20,000

API ごとの API 操作数

1,000

2,000

インスタンスタイプごとのクォータ

インスタンスタイプごとのクォータは、ゲートウェイインスタンスタイプに依存します。より高いインスタンスタイプにスペックアップしてもクォータが不十分な場合は、チケットを送信してさらなる引き上げをリクエストできます。

Dev & Small

Medium & Large

デフォルトクォータ

クォータ制限

デフォルトクォータ

クォータ制限

公開されたドメイン名

50

100

200

500

関連付けられたサービス

100

200

300

500

合計ルート数

200

500

1,000

2,000

合計オンライン API 操作数

1,000

2,000

3,000

5,000

K8s サービスソースの数

2

3

3

5

関連付けられた環境

5

10

15

20

Ingress シナリオのリソースクォータ

Ingress シナリオのリソースクォータは、ゲートウェイインスタンスタイプに依存します。安定性の問題を避けるために、インスタンスタイプのクォータを超えないようにしてください。

説明

クォータ制限はインスタンスタイプによって決まります。クォータは、インスタンスタイプのスペックアップまたは新しいゲートウェイクラスターの追加によってのみ増やすことができます。同じタイプのインスタンスをスケールアウトしても、クォータは増加しません。

Dev

Small

Medium

Large

ドメイン名

500

1,000

2,500

7,500

サービス

1,000

2,000

4,000

10,000

ルート

1,000

2,000

4,000

10,000

Ingress

1,500

1,000

2,500

7,500

エンドポイント

2,500

5,000

10,000

25,000