エラスティックリソースを事前に確保し、確実なデリバリーを保証するための最小インスタンス数の設定 - Function Compute

関数が非アクティブ期間後の最初のリクエストを受信すると、Function Compute は新しいインスタンスを初期化する必要があります。このプロセスはコールドスタートと呼ばれ、遅延が発生します。最小インスタンス数を 0 より大きい値に設定することで、事前割り当て済みのインスタンスを常にウォーム状態に保ち、遅延の影響を受けやすいワークロードにおけるコールドスタート遅延を解消できます。トラフィックの変動に自動的に対応するには、スケジュールまたはメトリクスのしきい値に基づいて最小インスタンス数を自動的に増減させるエラスティックポリシーを設定してください。

重要

事前割り当て済みのインスタンスは、リクエストを処理中かどうかにかかわらず課金されます。アクティブなインスタンスはアクティブエラスティックインスタンスレートで、アイドル状態のインスタンスはアイドルエラスティックインスタンスレートで課金されます。詳細については、「課金概要」をご参照ください。

エラスティックポリシーは、関数エイリアスまたはLATEST バージョンに対してのみ設定できます。

最小インスタンス数の設定

Function Compute コンソールにログインします。左側のナビゲーションウィンドウで、Functions をクリックします。
上部のナビゲーションバーでリージョンを選択します。Functions ページで、Create Function をクリックします。
Create Function ページで、Elastic Configuration セクションに移動し、Minimum Number Of Instances パラメーターを設定します。その他の必須パラメーターを設定後、Create をクリックします。

エラスティックポリシーの設定

エラスティックポリシーにより、手動での介入なしに最小インスタンス数を自動的に調整できます。サポートされているポリシーの種類は、Scheduled Scaling および Threshold-based Scaling の 2 種類です。

説明

複数の自動スケーリングポリシーが同時に有効になっている場合、システムはすべての有効なポリシーの中で最も高い Minimum Number Of Instances 値を使用します。詳細については、「現在の最小インスタンス数はどのように計算されますか？」をご参照ください。
いずれかのエラスティックポリシーが有効な間は、初期の Minimum Number Of Instances 値は無視されます。ポリシーがすべて無効になると、最小インスタンス数はその初期値に戻ります。

エラスティックポリシーを設定する手順は以下のとおりです。

関数の詳細ページで、Elastic Configuration タブをクリックします。Elastic Policies セクションで、対象ポリシーの行にある Edit をクリックします。
Edit Elastic Policy パネルで、Scheduled Scaling または Threshold-based Scaling ポリシーを設定します。

スケジュールされたスケーリング

スケジュールされたスケーリングは、トラフィックパターンが予測可能であるか、ピーク時間が既知の関数に適しています。スケジュール時刻になると、システムは最小インスタンス数を調整します。最小値を超える同時呼び出しは、オンデマンドのエラスティックインスタンスによって自動的に処理されます。スケジュールされたスケーリングの仕組みについては、「スケジュールされたスケーリング」をご参照ください。

上記の例では Asia/Shanghai (UTC + 08:00) タイムゾーンを使用しています。このポリシーは無期限で実行され、平日（月曜日から金曜日）の 10:00 にインスタンス数を 50 にスケールアウトし、22:00 に 5 にスケールインします。

しきい値ベースのスケーリング

システムは定期的にメトリクスをサンプリングし、しきい値を超えた場合に最小インスタンス数をスケーリングします。詳細については、「しきい値ベースのスケーリング」をご参照ください。

利用可能なメトリクスは関数のタイプによって異なります。

CPU 関数	GPU 関数

CPU 関数: Instance Concurrency Utilization および Memory Utilization をモニターします。
GPU 関数: Instance Concurrency Utilization および GPU 関連のリソース使用率メトリクスをモニターします。

上記の例では Asia/Shanghai (UTC + 08:00) タイムゾーンを使用しています。このポリシーは 2025 年 7 月 15 日 00:00 から 2025 年 7 月 31 日 00:00 まで有効で、Instance Concurrency Utilization を追跡します。使用率が 60% を超えると、システムは最大 100 インスタンスまでスケールアウトします。使用率が 60% を下回ると、システムは最小 10 インスタンスまでスケールインします。

CRON 式による定期的なスケーリング

定期的かつ繰り返しのパターンを持つ関数には、CRON 式を使用してスケーリングスケジュールを正確に定義できます。

上記の例では Asia/Shanghai (UTC + 08:00) タイムゾーンを使用しています。最小インスタンス数は毎週月曜日 10:00 に 10 にスケールアウトし、毎週金曜日 22:00 に 1 にスケールインします。

エラスティックポリシーの変更または削除

Function Compute コンソールにログインします。左側のナビゲーションウィンドウで、Function Management > Elastic Policies を選択します。対象のポリシーを見つけ、Actions 列の Edit または Delete をクリックします。

重要

エイリアスのエラスティックポリシーを削除すると、そのエイリアス用に事前割り当てされていたすべてのインスタンスがリリースされます。その後、関数はオンデマンドスケーリングにフォールバックするため、コールドスタートが発生する可能性があります。CPU ベースの関数の場合、平均コールドスタート時間は通常数百ミリ秒ですが、アプリケーションの起動速度によって異なります。GPU ベースの関数の場合、モデルサイズやロード速度に応じて数分かかることがあります。

次のステップ

関数の実行中のインスタンス総数に上限を設定するには、「関数クォータの設定」をご参照ください。実行中のインスタンス数が設定された上限を超えると、Function Compute は速度制限エラーを返します。