最小インスタンス数を設定して、エラスティックリソースを事前に割り当て、可用性を保証する - Function Compute

関数の最小インスタンス数を 0 より大きい値に設定して、エラスティックリソースを事前に割り当てます。これにより、ピーク時のコールドスタートによるリクエストの遅延を防ぐことができます。また、スケジュールまたはメトリックのしきい値に基づいて最小インスタンス数を自動的にスケーリングするポリシーを設定することもできます。これにより、高いパフォーマンスを確保し、インスタンスの利用率を向上させることができます。

重要

最小インスタンス数を 0 より大きい値に設定すると、コールドスタートを軽減し、遅延の影響を受けやすいオンラインビジネスのサービス応答を改善できます。これらのインスタンスは、使用状況に関係なく課金されます。これらのインスタンスがリクエストを処理する場合、アクティブなエラスティックインスタンスのレートで課金されます。アイドル状態の場合、アイドル状態のエラスティックインスタンスのレートで課金されます。アクティブなエラスティックインスタンスとアイドル状態のエラスティックインスタンスの課金方法の詳細については、「課金の概要」をご参照ください。
最小インスタンス数のエラスティックポリシーは、関数エイリアスまたは LATEST バージョンに対してのみ設定できます。

最小インスタンス数の設定

Function Compute コンソールにログインします。左側のナビゲーションウィンドウで、[関数管理] > [関数] を選択します。
上部のナビゲーションバーでリージョンを選択します。[関数] ページで、[関数の作成] をクリックします。
[関数の作成] ページの [エラスティック設定] セクションで、[最小インスタンス数] パラメーターを設定します。他の必須パラメーターを設定し、[作成] をクリックします。

エラスティックポリシーの設定

ターゲット関数の詳細ページで、[エラスティック設定] タブをクリックします。[エラスティックポリシー] セクションで、ターゲットポリシーの行にある [編集] をクリックします。
[エラスティックポリシーの編集] パネルで、最小インスタンス数の動的エラスティックポリシーを設定します。
説明
- 複数の自動スケーリングポリシーを設定した場合、システムはポリシーがトリガーされるたびに各ポリシーの [最小インスタンス数] を計算し、現在有効なポリシーの中で最も高い [最小インスタンス数] の値に現在の最小インスタンス数を設定します。詳細については、「現在の最小インスタンス数はどのように計算されますか？」をご参照ください。
- エラスティックポリシーがアクティブな間、初期の [最小インスタンス数] 設定は無視されます。アクティブなエラスティックポリシーがない場合、現在の最小インスタンス数は、[最小インスタンス数] に設定した初期値に戻ります。
- [定時スケーリング] または [しきい値に基づくスケーリング] ポリシーを設定します
  スケジュールに基づくスケーリング
  スケジュールに基づくスケーリングポリシーは、明確な周期的パターンまたは予測可能なトラフィックピークを持つ関数に適しています。同時関数呼び出しの数が最小インスタンス数を超えると、超過したリクエストはオンデマンドのエラスティックインスタンスによって自動的に処理されます。詳細については、「スケジュールに基づくスケーリング」をご参照ください。
  図に示すように、この例では [タイムゾーン] を Asia/Shanghai (UTC+8) に設定しています。このポリシーは長期間有効で、月曜日から金曜日の 10:00 に最小インスタンス数を 50 にスケールアウトし、22:00 に 5 にスケールインします。
  しきい値に基づくスケーリング
  システムは、[インスタンスの同時実行使用率]、[メモリ使用率]、または GPU インスタンスのリソース使用率などのメトリックを定期的に収集します。条件が満たされると、[最小インスタンス数] はそれに応じてスケーリングされます。詳細については、「しきい値に基づくスケーリング」をご参照ください。
  図に示すように、この例では [タイムゾーン] を Asia/Shanghai (UTC+8) に設定しています。このポリシーは 2025 年 7 月 15 日 00:00 から 2025 年 7 月 31 日 00:00 まで有効で、[インスタンスの同時実行使用率] メトリックを追跡します。使用率が追跡値の 60% を超えると、システムは最大 100 インスタンスまでスケールアウトします。使用率が 60% を下回ると、システムは最小 10 インスタンスまでスケールインします。
  CPU 関数の場合、最小インスタンス数のしきい値に基づくスケーリングは、[インスタンスの同時実行使用率] および [メモリ使用率] メトリックをモニターします。GPU 関数の場合、ポリシーは、次の図に示すように、[インスタンスの同時実行使用率] および GPU 関連のリソース使用率メトリックのモニタリングをサポートします。
  CPU 関数
  GPU 関数
- [CRON 式] を使用して定期的なエラスティックスケーリングを設定する
  ビジネスに明確な周期的パターンがある場合は、CRON 式を使用して最小インスタンス数を定期的にスケーリングすることもできます。次の図に示すように、[タイムゾーン] は Asia/Shanghai (UTC+8) に設定されています。最小インスタンス数は、毎週月曜日の 10:00 に 10 にスケールアウトされ、毎週金曜日の 22:00 に 1 にスケールインされます。

最小インスタンス数のエラスティックポリシーの変更または削除

Function Compute コンソールにログインします。左側のナビゲーションウィンドウで、[関数管理] > [エラスティックポリシー] を選択します。[エラスティックポリシー] ページで、ターゲットポリシーを見つけます。[アクション] 列で、[編集] または [削除] をクリックしてポリシーを変更または削除します。

重要

エイリアスの最小インスタンス数のエラスティックポリシーを削除すると、そのエイリアスに事前に割り当てられたすべてのインスタンスがリリースされます。その後、関数は自動的にオンデマンドスケーリングに切り替わりますが、これにはコールドスタートが含まれる場合があります。CPU ベースのサービスの場合、平均コールドスタート時間は通常、アプリケーションの起動速度に応じて数百ミリ秒です。GPU ベースのサービスの場合、平均コールドスタート時間は、モデルのサイズと読み込み速度に応じて数分になることがあります。

参考

特定の関数のインスタンス数を制限するには、関数のクォータを設定できます。関数の実行中のインスタンスの合計数が設定された制限を超えると、Function Compute はスロットリングエラーを返します。

CPU 関数	GPU 関数

最小インスタンス数の設定

エラスティックポリシーの設定

スケジュールに基づくスケーリング

しきい値に基づくスケーリング

最小インスタンス数のエラスティックポリシーの変更または削除

参考