すべてのプロダクト
Search
ドキュメントセンター

Function Compute:インスタンスタイプと仕様

最終更新日:May 19, 2026

Web サービスやデータ処理など、Function Compute 上の汎用コンピューティングシナリオでは、通常、基本的な CPU インスタンスで十分です。しかし、オーディオ・ビデオ処理、人工知能 (AI) 推論、画像編集など、大規模な並列コンピューティングやディープラーニングを必要とするシナリオでは、GPU インスタンスを使用することでコンピューティング効率を大幅に向上させることができます。

GPU インスタンス向けに、Function Compute はエラスティックインスタンス、プロビジョニング済みインスタンス、そしてプロビジョニング済み + エラスティックインスタンス (ハイブリッドモード) の 3 種類のインスタンスタイプを提供しています。ビジネス要件に最も適したインスタンスタイプと仕様を選択することで、安定した運用を確保しながら、リソースの利用率とパフォーマンスを最大化できます。

インスタンスタイプの選定

CPU 関数では、エラスティックインスタンスのみがサポートされます。GPU 関数では、ビジネスのリソース使用率、遅延感度、コスト安定性の要件に基づいて最適なインスタンスタイプを選択できます。サービスを中断することなく、いつでも 3 つのインスタンスタイプを切り替えることができます。

説明

プロビジョニング済みインスタンスは、Ada、Ada.2、Ada.3、Hopper、または Xpu.1 シリーズに属する GPU 関数にのみバインドできます。

エラスティックインスタンス

関数の最小インスタンス数を 0 に設定すると、インスタンスはリクエスト量に基づいて自動的にスケーリングされ、リクエストがない場合はリリースされます。これにより、使用した分だけが課金される従量課金モデルが実現し、コストを最大限に節約できます。リクエスト頻度が高いほど、仮想マシンと比較してリソース使用率が向上し、コスト削減効果も大きくなります。

コールドスタートの動作

はい、コールドスタートが発生する可能性があります。遅延の影響を受けやすいワークロードの場合、最小インスタンス数を 1 以上に設定することでコールドスタートを緩和できます。これにより、エラスティックリソースが事前に割り当てられ、インスタンスが迅速にアクティブ化されて受信リクエストを処理できるようになります。

課金 (従量課金)

関数コストには、アクティブなエラスティックインスタンスとシャローハイバネーション状態のエラスティックインスタンスの料金が含まれます。最小インスタンス数を 1 以上に設定する場合は、シャローハイバネーションモードを有効にすることを推奨します。この状態では、vCPU リソースは課金されず、GPU リソースはアクティブなレートのわずか 5 分の 1 で課金されるため、アクティブなエラスティックインスタンスと比較してコストを大幅に削減できます。

アクティブ状態とシャローハイバネーション状態のユースケースの詳細については、「エラスティックインスタンス」をご参照ください。

プロビジョニング済みインスタンス

このインスタンスタイプは GPU 関数にのみ適用されます。事前にプロビジョニング済みリソースプールを購入し、特定の数とタイプのプロビジョニング済みインスタンスを関数に割り当てます。このアプローチは、予測可能で固定のコストを提供し、高いリソース使用率、厳しい遅延要件、または安定した課金要件を持つワークロードに最適です。

月次プロビジョニング済みリソースプールを購入すると、プラットフォームはサブスクリプションベースのプロビジョニング済みインスタンスに加えて、一定クォータのブーストインスタンスを割り当てます。このブーストインスタンスクォータは課金されません。

コールドスタートの動作

いいえ、コールドスタートは発生しません。プロビジョニング済みインスタンスを使用する場合、割り当てられたキャパシティ内のリクエストはリアルタイムで応答を受け取ります。関数が処理できる最大同時リクエスト数は、(割り当てられたプロビジョニング済みインスタンス数) × (インスタンスの同時実行数)+ ブーストインスタンスクォータとして計算されます。この上限を超えたリクエストはスロットリングされます。

課金 (サブスクリプション)

関数コストは、購入したすべてのプロビジョニング済みリソースプールの合計サブスクリプション料金です。ブーストインスタンスクォータは課金されません

プロビジョニング済みインスタンスとエラスティックインスタンス (混合モード)

このモードは GPU 関数にのみ適用されます。プロビジョニング済みインスタンスとエラスティックインスタンスの利点を組み合わせたもので、トラフィックの変動が大きいワークロードに最適です。システムはまず、プロビジョニング済みリソースプールを使用して定常トラフィックを処理します。リクエストがプロビジョニング済みプールのキャパシティを超えると、システムはエラスティックインスタンスを起動して自動的にスケールアウトします。このアプローチにより、安定したベースラインキャパシティを保証しつつ、突発的なトラフィックバーストを効果的に管理します。

コールドスタートの動作

部分的に発生します。プロビジョニング済みリソースプールによって処理されるリクエスト (最小インスタンス数まで) は、コールドスタートなしでリアルタイムに処理されます。ただし、トラフィックがオートスケーリングをトリガーし、新しいエラスティックインスタンスが起動されると、それらの新しいインスタンスではコールドスタートが発生します。

課金

混合モードのコストは、サブスクリプションと従量課金の両方のコンポーネントで構成されます:

  • プロビジョニング部分:購入したプロビジョニング済みリソースプールのクォータに対して課金されます。

  • エラスティック部分:プロビジョニング済みクォータを超えて起動されたインスタンスは、アクティブおよびシャローハイバネーションのエラスティックインスタンスと同じレートで従量課金制で課金されます。

インスタンス仕様

  • CPU インスタンス

    vCPU (コア)

    メモリサイズ (MB)

    最大コードパッケージサイズ (GB)

    最大関数実行時間 (s)

    最大ディスクサイズ (GB)

    最大帯域幅 (Gbps)

    0.05~16

    注意:値は 0.05 の倍数である必要があります。

    128~32768

    注意:値は 64 の倍数である必要があります。

    10

    86400

    10

    有効な値:

    • 512 MB。これはデフォルト値です。

    • 10 GB。

    5

    説明

    vCPU とメモリサイズ (GB) の比率は、1:1 から 1:4 の範囲内である必要があります。

  • GPU インスタンスのハードウェア仕様

    インスタンスタイプ

    GPU メモリ

    FP16 コンピューティング性能

    FP32 コンピューティング性能

    インスタンスあたりの最大カード数

    fc.gpu.tesla.1

    16 GB

    65 TFLOPS

    8 TFLOPS

    4 カード

    fc.gpu.ampere.1

    24 GB

    125 TFLOPS

    31.2 TFLOPS

    8 カード

    fc.gpu.ada.1

    48 GB

    119 TFLOPS

    60 TFLOPS

    fc.gpu.ada.2

    24 GB

    166 TFLOPS

    83 TFLOPS

    fc.gpu.ada.3

    48 GB

    148 TFLOPS

    73.5 TFLOPS

    fc.gpu.hopper.1

    96 GB

    148 TFLOPS

    44 TFLOPS

    fc.gpu.hopper.2

    141 GB

    148 TFLOPS

    44 TFLOPS

    fc.gpu.blackwell.1

    32 GB

    104.8 TFLOPS

    104.8 TFLOPS

    fc.gpu.xpu.1

    96 GB

    123 TFLOPS

    61.5 TFLOPS

    16 カード

  • GPU インスタンスの vCPU とメモリの設定ルール

    説明

    複数カードリソースの計算式:合計 vCPU = カードあたりの vCPU × カード数、合計メモリ = カードあたりのメモリ × カード数。

    インスタンスタイプ

    vCPU (カードあたり)

    カードあたりのメモリ範囲

    メモリ増分

    fc.gpu.tesla.1

    4 コア

    4~16 GB (4,096~16,384 MB)

    4 GB (4,096 MB)

    8 コア

    8~32 GB (8,192~32,768 MB)

    16 コア

    16~64 GB (16,384~65,536 MB)

    fc.gpu.ampere.1

    8 コア

    8~32 GB (8,192~32,768 MB)

    16 コア

    16~32 GB (16,384~32,768 MB)

    fc.gpu.ada.1

    fc.gpu.ada.2

    fc.gpu.ada.3

    4 コア

    16~32 GB (16,384~32,768 MB)

    8 コア

    32~64 GB (32,768~65,536 MB)

    16 コア

    64~120 GB (65,536~122,880 MB)

    fc.gpu.hopper.1

    4 コア

    16~32 GB (16,384~32,768 MB)

    8 コア

    32~64 GB (32,768~65,536 MB)

    16 コア

    64~96 GB (65,536~98,304 MB)

    24 コア

    96~120 GB (98,304~122,880 MB)

    fc.gpu.hopper.2

    4 コア

    16~32 GB (16,384~32,768 MB)

    8 コア

    32~64 GB (32,768~65,536 MB)

    16 コア

    64~128 GB (65,536~131,072 MB)

    24 コア

    96~248 GB (98,304~253,952 MB)

    fc.gpu.blackwell.1

    4 コア

    16~32 GB (16,384~32,768 MB)

    8 コア

    32~64 GB (32,768~65,536 MB)

    16 コア

    64~120 GB (65,536~122,880 MB)

    24 コア

    96~184 GB (98,304~188,416 MB)

    fc.gpu.xpu.1

    4 コア

    16~48 GB (16,384~49,152 MB)

    8 コア

    32~96 GB (32,768~98,304 MB)

    12 コア

    48~120 GB (49,152~122,880 MB)

  • GPU インスタンスは、次のリソース仕様もサポートしています。

    イメージサイズ (GB)

    最大関数実行時間 (s)

    ディスクサイズ

    最大帯域幅 (Gbps)

    ACR Enterprise Edition (Standard Edition) :15

    ACR Enterprise Edition (Premium Edition) :15

    ACR Enterprise Edition (Basic Edition) :15

    ACR Personal Edition (Free) :15

    86400

    • 512 MB

    • 10 GB~200 GB、10 GB 刻み

    5

    説明
    • インスタンスタイプを g1 に設定することは、fc.gpu.tesla.1 に設定することと同じです。

    • Tesla シリーズの GPU インスタンスは、中国 (杭州) 、中国 (上海) 、中国 (北京) 、中国 (張家口) 、中国 (深圳) 、日本 (東京) 、米国 (バージニア) 、およびシンガポールの各リージョンでサポートされています。

    • Ada シリーズの GPU インスタンスは、中国 (北京) 、中国 (杭州) 、中国 (上海) 、中国 (深圳) 、シンガポール、および米国 (バージニア) の各リージョンでサポートされています。

GPU インスタンス仕様とインスタンス同時実行数の関係

Ada.1 GPU のメモリは 48 GB です。Tesla シリーズ GPU のメモリは 16 GB です。Function Compute は、GPU カードの全メモリを単一の GPU コンテナに割り当てます。デフォルトの GPU カードのクォータはリージョンあたり最大 30 であるため、そのリージョンでは最大 30 の GPU コンテナを同時に実行できます。

  • GPU 関数のインスタンス同時実行数が 1 の場合、その関数は 1 つのリージョンで最大 30 の推論リクエストを同時に処理できます。

  • GPU 関数のインスタンス同時実行数が 5 の場合、その関数は 1 つのリージョンで最大 150 の推論リクエストを同時に処理できます。

単一インスタンスの同時実行

リソースの利用率を向上させるために、アプリケーションのリソース要件に基づいて単一インスタンスの同時実行を設定できます。この設定では、複数のタスクが単一のインスタンスで実行され、CPU とメモリリソースを共有するため、全体的なリソース利用率が向上します。詳細については、「インスタンス同時実行数の設定」をご参照ください。

単一インスタンス、単一同時実行の実行時間

インスタンスが単一のリクエストを実行する場合、実行時間はリクエストがインスタンスに到着してからリクエストの実行が完了するまで測定されます。

image

単一インスタンス、複数同時実行の実行時間

インスタンスが複数のリクエストを同時に実行する場合、実行時間は最初のリクエストがインスタンスに到着してから最後のリクエストが完了するまで測定されます。このリソースの再利用はコスト削減に役立ちます。

image

関連ドキュメント

  • Function Compute の課金方法と課金対象の詳細については、「課金の概要」をご参照ください。

  • API を使用して関数を作成する場合、instanceType パラメーターを使用してインスタンスタイプを指定できます。詳細については、「CreateFunction」をご参照ください。

  • コンソールでインスタンスタイプと仕様を指定する方法については、「関数の作成」をご参照ください。