AI Gateway には Dedicated Instance と Serverless の 2 つのエディションがあります。ワークロードに適したエディションを選択できるよう、機能、クォータ、キャパシティ仕様を比較します。
エディションの比較
-
Serverless:リソース管理なしで弾力的に自動スケールします。従量課金により、低コストで迅速に統合できます。
-
Dedicated Instance:独立してデプロイされ、プラグイン拡張性、ハードウェアアクセラレーション、WAF 統合などの高度な機能を提供します。より高い安定性とセキュリティを求めるエンタープライズ向けに、より高い SLA を提供します。
|
カテゴリ |
機能 |
Serverless |
Dedicated Instance |
|
モデルプロキシ |
テキストからテキスト |
サポート対象 |
サポート対象 |
|
マルチモーダル |
サポート対象 |
サポート対象 |
|
|
組み込みポリシー |
サポート対象 |
サポート対象 |
|
|
MCP Server |
MCP プロキシ |
サポート対象 |
サポート対象 |
|
HTTP から MCP |
サポート対象 |
サポート対象 |
|
|
エージェントプロキシ |
Model Studio |
サポート対象 |
サポート対象 |
|
Dify |
サポート対象 |
サポート対象 |
|
|
カスタム |
サポート対象 |
サポート対象 |
|
|
プラグイン |
システムプラグイン |
サポート対象 |
サポート対象 |
|
プラグインマーケットプレイス |
サポート対象外 |
サポート対象 |
|
|
カスタムプラグイン |
サポート対象外 |
サポート対象 |
|
|
仕様 |
キャパシティ仕様 |
自動スケーリング |
1 秒あたりのクエリ数 (QPS) とクライアント接続数に基づいて、さまざまなキャパシティ仕様を利用できます。 |
|
ハードウェアアクセラレーション |
TLS ハードウェアアクセラレーション |
サポート対象外 |
サポート対象 |
|
QAT ハードウェア圧縮および展開 |
サポート対象外 |
サポート対象 |
|
|
セキュリティ |
WAF 統合 |
サポート対象外 |
サポート対象 |
|
可観測性 |
モニタリングとアラート |
ビジネスメトリクスのみ 説明
基盤システムはフルマネージドのため、システムレベルのモニタリングは不要です。 |
|
|
エンドポイント |
固定 EIP |
サポート対象外です。共有エンドポイントを使用します。 |
サポート対象です。専用エンドポイントを使用します。 |
|
インバウンド帯域幅 |
共有帯域幅で、インスタンスあたり最大 400 Mbps です。 |
専用帯域幅です。デフォルトの上限はインスタンスあたり 4 Gbps で、動的に調整できます。 |
|
|
運用保守 |
設定変更 |
自動スケールします。手動の設定管理は不要です。 |
必要に応じて設定を変更できます。Serverless エディションにダウングレードできません。 |
|
安定性の保証 |
SLA |
99.9% |
99.99% |
|
依存ミドルウェア |
共有、論理的に分離 |
専用、物理的分離 |
|
|
バージョン更新 |
自動 |
手動 |
キャパシティ仕様
Dedicated Instance では、1 秒あたりのクエリ数 (QPS) とクライアント接続数のキャパシティが異なる複数のインスタンスタイプを提供します。
|
インスタンスタイプ |
QPS |
クライアント接続数 |
|
aigw.small.x1 |
1500 |
20000 |
|
aigw.small.x2 |
3000 |
40000 |
|
aigw.small.x4 |
6000 |
80000 |
|
aigw.medium.x1 |
12000 |
160000 |
|
aigw.medium.x2 |
24000 |
320000 |
|
aigw.medium.x3 |
36000 |
480000 |
|
aigw.large.x1 |
48000 |
640000 |
|
aigw.large.x2 |
96000 |
1280000 |
|
aigw.large.x3 |
144000 |
1920000 |
|
aigw.large.x4 |
192000 |
2560000 |
クォータ
グローバルクォータ
|
クォータ項目 |
クォータ |
|
リージョンあたりのインスタンス数 |
100 |
インスタンスクォータ
|
クォータのディメンション |
Serverless |
Small |
Medium |
Large |
|
MCP Server 数 |
100 |
500 |
1000 |
2000 |
|
有効なルートの総数 (Model API と Agent API ルートを含む) |
2500 |
5000 |
7500 |
10000 |
|
公開済みドメイン名数 |
100 |
200 |
500 |
1000 |
|
関連付けられたサービス数 |
200 |
800 |
2000 |
4000 |
|
サービスノード数 |
400 |
1600 |
4000 |
8000 |
|
Kubernetes サービスソース数 |
3 |
3 |
5 |
5 |
|
インストール済みプラグイン数 |
0 |
10 |
20 |
30 |
|
アップロード済みカスタムプラグイン数 |
0 |
20 |
50 |
80 |
|
認可済みコンシューマー数 |
500 |
2000 |
6000 |
10000 |