すべてのプロダクト
Search
ドキュメントセンター

API Gateway:ゲートウェイの Auto Scaling の設定

最終更新日:Nov 09, 2025

Auto Scaling 機能は、トラフィックの変動に基づいてインスタンスリソースを自動的に調整します。これにより、ピーク時のサービスパフォーマンスが確保され、オフピーク時のリソースコストが削減されます。インスタンスに対して、スケジュールに基づくスケーリングポリシーまたはメトリックに基づくスケーリングポリシーを設定できます。このトピックでは、クラウドネイティブ API ゲートウェイインスタンスの Auto Scaling ポリシーを設定する方法について説明します。

スケールアウトポリシーの選択

  • スケジュールに基づくポリシー

    ビジネスのトラフィックピークが予測可能な場合は、スケジュールに基づくスケーリングポリシーを作成できます。たとえば、プロモーションのためにこれを行うことができます。

  • メトリックに基づくポリシー

    ビジネスのトラフィック変動が予測不可能な場合は、CPU やメモリ使用量などのメトリックに基づいてスケーリングポリシーを設定できます。詳細については、「容量仕様」をご参照ください。

使用上の注意

  • スケジュールに基づくスケーリングポリシーは、進行中のスケーリングアクティビティ中は変更できません。

  • スケールアウトされたノードは、数量と期間に基づいて従量課金制で課金されます。

Auto Scaling の設定

  1. API Gateway コンソールにログインします。

  2. 左側のナビゲーションウィンドウで、[Cloud-native API Gateway] > [インスタンス] をクリックします。上部のナビゲーションバーで、リージョンを選択します。

  3. 次の 2 つの方法のいずれかを使用して、Auto Scaling パネルに移動します。

    • 方法 1:

      [インスタンス] ページで、管理するインスタンスを見つけ、[操作] 列で image > [Auto Scaling] を選択します。

      image

    • 方法 2:

      [インスタンス] ページで、管理するインスタンスをクリックします。インスタンス詳細ページで、左側のナビゲーションツリーで [概要] をクリックし、[基本情報] タブをクリックし、[実行情報] セクションの Auto Scaling の横にある [有効化] をクリックします。

  4. [Auto Scaling] パネルの [スケーリング設定] タブで、次のパラメーターを設定します:

    image

    説明

    スケーリングポリシーを更新する際、新しい期間の開始時刻が現在時刻より後の場合、ポリシーは次のサイクルから有効になります。

    次の表にパラメーターを示します。

    パラメーター

    説明

    Auto Scaling の有効化

    Auto Scaling をオンにするかどうかを指定します。

    説明

    Auto Scaling が有効になっている場合、手動スケーリングまたは仕様変更は許可されません。

    スケーリング方法

    スケーリングポリシーのタイプを指定します。有効な値: 時間によるスケーリング および 水位による拡張と縮小

    • 時間によるスケーリング: プロモーションなどの主要なイベントが計画されている場合は、このオプションを選択してスケジュールに基づくスケーリングポリシーを設定し、スロットリングと組み合わせて使用できます。

    • 水位による拡張と縮小: スケーリングには数分かかり、瞬時に完了することはできません。

    期間設定

    [スケーリング設定] タブで [期間設定] を変更して、期間とターゲットの合計ノード数を設定します。

    説明

    ノード数は、期間の開始時にターゲット数まで増加し、期間の終了時に元の数に減少します。

    • 期間 (UTC + 08:00): 24 時間制に基づいて 1 日の期間を指定します。1 日に最大 3 つの期間を指定できます。期間は互いに重複することはできません。期間は日をまたぐことができます。

    • ターゲット合計ノード数: ゲートウェイがスケールアウトした後のノード数。各期間の終わりに、ゲートウェイは元のノード数にスケールインします。

    水位による拡張と縮小

    最大ノード数

    インスタンスに含めるノードの最大数を設定します。

    安全しきい値

    バーストトラフィックが現在のトラフィックの 2 倍に増加した場合に、高いスループットと低いレイテンシーのパフォーマンスを確保します。

    警告しきい値

    警告しきい値に達すると、ゲートウェイのレイテンシーが増加する可能性があります。さまざまな仕様の容量しきい値と秒間クエリ数 (QPS) の詳細については、「容量仕様」をご参照ください。

スケーリングイベント

[Automatic Scaling] パネルの [スケーリングイベント] タブをクリックすると、[イベント] ページに移動できます。このページでは、スケーリングイベントとポリシーの実行を統合的に管理および分析できます。詳細については、「イベントの管理」をご参照ください。

image