すべてのプロダクト
Search
ドキュメントセンター

Function Compute:インスタンスタイプと仕様

最終更新日:Dec 19, 2025

Function Compute での Web サービスやデータ処理といった汎用的なコンピューティングシナリオでは、通常、基本的な CPU インスタンスで十分です。しかし、音声・動画処理、人工知能 (AI) による推論、画像編集など、大規模な並列計算やディープラーニングを必要とするシナリオでは、GPU インスタンスを使用することで、計算効率を大幅に向上させることができます。

GPU インスタンス向けに、Function Compute は弹性インスタンスとプロビジョニング済みインスタンスの 2 種類のインスタンスタイプを提供しています。ビジネスニーズに最も適したインスタンスタイプと仕様を選択することで、サービスを確実に実行しながら、リソース使用率とパフォーマンスを最大化できます。

インスタンスタイプの選択

CPU 関数は弹性インスタンスのみをサポートします。GPU 関数については、リソース使用率、遅延、コストの安定性に関する要件に応じて、弹性インスタンスとプロビジョニング済みインスタンスのいずれかを選択できます。詳細な選択ガイドについては、以下のフローチャートをご参照ください。

image
説明

プロビジョニング済みインスタンスは、Ada、Ada.2、Ada.3、Hopper、または Xpu.1 シリーズに属する GPU 関数にのみバインドできます。

Elastic インスタンス

関数の最小インスタンス数を 0 に設定すると、インスタンスはリクエスト量に基づいて自動的にスケーリングされ、リクエストがない場合はリリースされます。つまり、使用量に基づいて課金され、関数が使用されていないときは料金が発生しないため、コストを最大限に節約できます。ビジネスリクエストが頻繁であるほど、リソース使用率が高くなり、弹性のある仮想マシンを使用する場合と比較してコスト削減効果が大きくなります。

コールドスタートの有無

はい、発生します。遅延の影響を受けやすいビジネスの場合、最小インスタンス数を 1 以上に設定することで、コールドスタートを軽減できます。この方法では、弹性リソースが事前に割り当てられます。リクエストが到着すると、インスタンスは迅速にアクティブ化されてリクエストを実行します。

課金 (従量課金)

関数の使用コストは、アクティブな弹性インスタンスとシャローハイバネーション (旧アイドル) 状態の弹性インスタンスの料金の合計です。最小インスタンス数を 1 以上に設定した場合、シャローハイバネーションモードを有効にできます。シャローハイバネーション状態では、vCPU の使用は無料で、GPU の使用は通常料金の 20% のみで課金されます。このコストは、アクティブな弹性インスタンスよりもはるかに低コストです。

アクティブな弹性インスタンスとシャローハイバネーション状態の弹性インスタンスのシナリオに関する詳細については、「弹性インスタンス」をご参照ください。

プロビジョニング済みインスタンス

このインスタンスタイプは GPU 関数にのみ適用されます。事前にプロビジョニング済みリソースプールを購入し、そのリソースプールから特定の数とタイプのプロビジョニング済みインスタンスを関数に割り当てることができます。この方法は、予測可能で固定された使用コストを提供し、高いリソース使用率、厳しい遅延要件、または安定したコストが必要なシナリオに適しています。

コールドスタートの有無

いいえ、発生しません。プロビジョニング済みインスタンスを使用する場合、関数が同時に処理できるリクエストの最大数は、次の数式で決まります:= 割り当てられたプロビジョニング済みインスタンス数 × インスタンスの同時実行数。この上限を超えるリクエストはスロットリングされます。上限内のリクエストはリアルタイムで応答されるため、コールドスタートが完全に排除されます。

課金 (サブスクリプション)

関数コストは、購入したすべてのプロビジョニング済みリソースプールのサブスクリプション料金の合計です。

インスタンスの仕様

  • CPU インスタンス

    vCPU (コア)

    メモリサイズ (MB)

    最大コードパッケージサイズ (GB)

    関数の最大実行時間 (秒)

    最大ディスクサイズ (GB)

    最大帯域幅 (Gbps)

    0.05~16

    注意:値は 0.05 の倍数である必要があります。

    128~32768

    注意:値は 64 の倍数である必要があります。

    10

    86400

    10

    有効値:

    • 512 MB。これはデフォルト値です。

    • 10 GB。

    5

    説明

    vCPU とメモリサイズ (GB 単位) の比率は 1:1 から 1:4 の範囲である必要があります。

  • GPU インスタンス

    説明

    fc.gpu.tesla.1 インスタンスタイプは、NVIDIA T4 GPU に匹敵するパフォーマンスを提供します。

    インスタンスタイプ

    サポートされる

    インスタンスタイプ

    フルカード GPU メモリ (GB)

    フルカード計算能力 (TFLOPS)

    選択可能なチャンク仕様

    FP16 計算能力

    FP32 計算能力

    vGPU メモリ (MB)

    vGPU 計算能力 (カード)

    vCPU (コア)

    メモリサイズ (MB)

    fc.gpu.tesla.1

    弹性インスタンス

    16

    65

    8

    16384 (16 GB)

    注意:フルカードメモリのみがサポートされます。複数のカードを購入した場合、すべてのリソースはカードの数で乗算されます。

    デフォルトでフルカードの計算能力が割り当てられます。

    注意:計算能力は Function Compute によって自動的に割り当てられるため、手動で設定する必要はありません。

    値の範囲は 0.05 から (vGPU メモリ GB / 2) です。

    注意:値は 0.05 の倍数である必要があります。

    値の範囲は 128 から (vGPU メモリ GB × 2048) です。

    注意:値は 64 の倍数である必要があります。

    fc.gpu.ada.1

    • エラスティックインスタンス

    • 常駐インスタンス

    48

    119

    60

    49152 (48 GB)

    注意:フルカードメモリのみがサポートされます。複数のカードを購入した場合、すべてのリソースはカードの数で乗算されます。

    有効値:4、8、または 16。

    有効値:32768、65536、または 98304。

    fc.gpu.ada.2

    • エラスティックインスタンス

    • 常駐インスタンス

    24

    166

    83

    24576 (24 GB)

    注意:フルカードメモリのみがサポートされます。複数のカードを購入した場合、すべてのリソースはカードの数で乗算されます。

    有効値:8 または 16。

    有効値:32768 または 65536。

    fc.gpu.ada.3

    • エラスティック インスタンス

    • 常駐インスタンス

    48

    148

    73.54

    49152 (48 GB)

    注意:フルカードメモリのみがサポートされます。複数のカードを購入した場合、すべてのリソースはカードの数で乗算されます。

    有効値:8 または 16。

    有効値:65536 または 98304。

    fc.gpu.hopper.1

    • Elastic インスタンス

    • 常駐インスタンス

    96

    148

    44

    98304 (96 GB)

    注意:フルカードメモリのみがサポートされます。複数のカードを購入した場合、すべてのリソースはカードの数で乗算されます。

    16

    有効値:98304。

    fc.gpu.xpu.1

    • Elastic インスタンス

    • 常駐インスタンス

    96

    123

    61.5

    98304 (96 GB)

    注意:フルカードメモリのみがサポートされます。複数のカードを購入した場合、すべてのリソースはカードの数で乗算されます。

    16

    有効値:98304。

    GPU インスタンスは、以下のリソース仕様もサポートしています。

    イメージサイズ (GB)

    関数の最大実行時間 (秒)

    最大ディスクサイズ (GB)

    最大帯域幅 (Gbps)

    ACR Enterprise Edition (Standard Edition): 15

    ACR Enterprise Edition (Premium Edition): 15

    ACR Enterprise Edition (Basic Edition): 15

    ACR Personal Edition (無料): 15

    86400

    10

    5

    説明
    • インスタンスタイプを g1 に設定することは、fc.gpu.tesla.1 に設定することと同じです。

    • Tesla シリーズの GPU インスタンスは、中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (深セン)、日本 (東京)、米国 (バージニア)、シンガポールの各リージョンでサポートされています。

    • Ada シリーズの GPU インスタンスは、中国 (北京)、中国 (杭州)、中国 (上海)、中国 (深セン)、シンガポール、米国 (バージニア) の各リージョンでサポートされています。

GPU インスタンスの仕様とインスタンスの同時実行数の関係

Ada.1 GPU のメモリは 48 GB、Tesla シリーズ GPU のメモリは 16 GB です。Function Compute は、GPU カードの全メモリを単一の GPU コンテナーに割り当てます。デフォルトの GPU カードクォータはリージョンごとに最大 30 であるため、そのリージョンでは最大 30 の GPU コンテナーが同時に実行できます。

  • GPU 関数のインスタンス同時実行数が 1 の場合、その関数はリージョン内で最大 30 の推論リクエストを同時に処理できます。

  • GPU 関数のインスタンス同時実行数が 5 の場合、その関数はリージョン内で最大 150 の推論リクエストを同時に処理できます。

単一インスタンスの同時実行

リソース使用率を向上させるために、アプリケーションのリソース要件に基づいて単一インスタンスの同時実行数を設定できます。この構成では、複数のタスクが単一のインスタンス上で実行され、CPU とメモリリソースを共有することで、全体的なリソース使用率が向上します。詳細については、「インスタンスの同時実行数の設定」をご参照ください。

単一インスタンス、単一同時実行の実行時間

インスタンスが単一のリクエストを実行する場合、実行時間はリクエストがインスタンスに到着してからリクエストの実行が完了するまでの時間で計測されます。

image

単一インスタンス、複数同時実行の実行時間

インスタンスが複数のリクエストを同時に実行する場合、実行時間は最初のリクエストがインスタンスに到着してから最後のリクエストが完了するまでの時間で計測されます。このリソースの再利用により、コストを節約できます。

image

関連ドキュメント

  • Function Compute の課金方法と課金項目の詳細については、「課金の概要」をご参照ください。

  • API を使用して関数を作成する場合、instanceType パラメーターを使用してインスタンスタイプを指定できます。詳細については、「CreateFunction」をご参照ください。

  • コンソールでインスタンスタイプと仕様を指定する方法については、「関数の作成」をご参照ください。