すべてのプロダクト
Search
ドキュメントセンター

API Gateway:AI ゲートウェイインスタンスの作成

最終更新日:Jun 04, 2026

AI ゲートウェイインスタンスを作成し、課金、ネットワーク、ログオプションを構成します。

操作手順

  1. AI ゲートウェイコンソールにログインします。

  2. 左側のナビゲーションウィンドウで [インスタンス] を選択します。上部のメニューバーでリージョンを選択します。

  3. Create Instance をクリックします。購入ページでインスタンスパラメーターを構成し、今すぐ購入 をクリックします。

    パラメーター

    説明

    プロダクトタイプ

    AI Gateway では、Dedicated Instance (pay-as-you-go)Dedicated Instance (subscription)、および Serverless (pay-as-you-go) の 3 種類のインスタンスタイプを提供しています。料金はタイプによって異なります。Billing

    Region

    ゲートウェイインスタンスをデプロイするリージョンを選択します。

    重要

    インスタンス作成後は、リージョンを変更できません。

    GatewayName

    インスタンス名を入力します(例:test や order-prod)。環境またはビジネスドメインを含めてください。最大 64 文字です。

    GatewaySpec

    ワークロードに適した仕様を選択します。容量の詳細については、「Gateway types」をご参照ください。Serverless インスタンスには適用されません。

    resource

    デフォルトリソースグループまたは既存のリソースグループを使用します。新しいリソースグループを作成するには、リソースグループの作成 をクリックします。

    説明

    リソースグループを使用すると、個別ではなくグループ単位で権限、リソース、モニタリングを管理できます。

    Network Type

    AI Gateway は、次の 3 種類のアクセスタイプをサポートしています:Public NetworkPrivate Network、および Public + Private

    • Public:BGP(マルチライン)モードで Cloud Data Transfer (CDT) を通じてデータ転送料金が請求されます。Public network traffic

    • Private:データ転送料金は発生しません。

    • Public + Private:

      パブリックトラフィックには、BGP(マルチライン)モードで CDT を通じたデータ転送料金が発生します。プライベートトラフィックにはデータ転送料金は発生しません。

    VPC

    ゲートウェイインスタンス用の VPC を選択します。新規作成する場合は、[VPC コンソール] に移動します。

    説明
    • ゲートウェイとサービスは同じ VPC 内に配置する必要があります。

    Zone selection

    [Auto-assign] または [Manually Select] を選択します。

    • Auto-assign:vSwitch を 1 つ選択します。システムは 2 つのゾーンにわたってゲートウェイノードをデプロイします。

    • Manually Select:ゲートウェイノードをデプロイするゾーンと vSwitch を選択します。

    vSwitch

    ゲートウェイインスタンス用の vSwitch を選択します。新規作成する場合は、[VPC コンソール] に移動します。

    Simple Log Service

    [Use Simple Log Service (SLS)] を選択すると、Simple Log Service (SLS) が有効化され、分析やダッシュボード用の log delivery が有効になります。Enable gateway log delivery

    Service-linked role

    AI Gateway は、他のクラウドサービスにアクセスするために、自動的にサービスリンクロールを作成します。

  4. [注文の確認] ページで構成を確認し、[今すぐ購入] をクリックします。

    説明

    ゲートウェイインスタンスの作成には 1~5 分かかります。

  5. AI ゲートウェイのインスタンスページに戻ります。新しいゲートウェイインスタンスが表示され、そのStatusRunningになっていることを確認します。これにより、ゲートウェイが正常に作成されたことが確認できます。

高度な機能

インスタンス作成時に高度な機能を構成できます。Gzip ハードウェアアクセラレーションは作成時のみ有効化でき、後から追加することはできません。Simple Log Service はいつでも有効化できます。

Gzip ハードウェアアクセラレーションを有効化する

Gzip ハードウェアアクセラレーションにより、圧縮および展開処理が専用ハードウェアにオフロードされ、CPU 負荷が軽減され、スループットが向上します。

説明

サーバーレスインスタンスは Gzip ハードウェアアクセラレーションをサポートしていません。

操作手順

  1. AI ゲートウェイの購入ページで、次のパラメーターを構成し、今すぐ購入 をクリックします。

    • Region:Gzip ハードウェアアクセラレーションは、中国 (杭州)、中国 (北京)、中国 (上海)、中国 (深セン)、中国 (ウランチャブ)、中国 (香港)、およびシンガポール のリージョンでサポートされています。

      サポート対象リージョン内のすべてのゾーンで利用できるわけではありません。購入ページで可用性をご確認ください。
    • GatewaySpecaigw.medium.x1 またはそれ以上の仕様を選択します。

    • [Gzip ハードウェアアクセラレーション]:チェックボックスをオンにして Gzip ハードウェアアクセラレーションを有効化します。

    • Available ZoneGzip ハードウェアアクセラレーションをサポートするゾーンを選択し、その後 vSwitch を選択します。

  2. 作成後、インスタンス ID または名前をクリックします。左側のナビゲーションウィンドウで Parameters をクリックします。Gateway Engine Parameters セクションで、EnableGzipHardwareAccelerate パラメーターを編集します。

    説明

    このパラメーターは、購入時に [Gzip ハードウェアアクセラレーションを有効化する] を選択した場合にのみ利用可能です。

  3. クライアントは、圧縮された応答を受信するために、リクエストに Accept-Encoding: gzip ヘッダーを追加する必要があります。

パフォーマンスリファレンス

Gzip トラフィック節約効果

圧縮率(圧縮後のサイズと元のサイズの比率)はデータ内容に依存します。比率が低いほど、より良い圧縮が達成されています。

テキストや繰り返しのあるデータはよく圧縮され(比率が低い)、画像、動画、事前に圧縮されたファイルはほとんど効果がありません(比率が高い)。

ワークロードによって結果は異なりますが、主要リージョンの本番データに基づくと、ほとんどのインスタンスで 10 %~50 % の圧縮率が達成され、平均で 50 % 以上のトラフィックが節約されています。

ハードウェアアクセラレーションによるリソース節約効果

ハードウェアアクセラレーションにより、圧縮処理がオフロードされ、CPU が節約されます。以下の負荷テストは、CPU 消費量を比較したものです。同一 QPS において、ハードウェア Gzip を使用したシングルノードインスタンスと、ソフトウェア Gzip を使用した 4 ノードインスタンスを比較しています。

たとえば、ソースデータは約 120 KB の JSON テキストファイルです。

QPS

CPU 消費量 (ハードウェア Gzip、1 ノード)

CPU 消費量 (ソフトウェア Gzip、4 ノード)

2,000

9 %

11 %

5,000

26 %

28 %

10,000

56 %

56 %

13,000

69 %

72 %

表のデータから、Gzip ハードウェアアクセラレーション / シングルノード の CPU 消費量は、ソフトウェア Gzip / 4 ノード とほぼ同等であることがわかります。ハードウェアアクセラレーションを備えた 1 ノードが、ソフトウェア Gzip の 4 ノードに置き換えられ、インスタンスリソースを約 75 % 節約できます。

ゲートウェイログ配信の有効化

インスタンス作成時に Simple Log Service (SLS) を有効化して、ログ収集、分析、ダッシュボードを有効にします。

購入ページで [Simple Log Service (SLS) を使用する] を選択して SLS を有効化し、ログ配信を有効にします。

有効化後、[可観測性と分析] > [ログセンター] に移動してゲートウェイログを表示します。

ログフィールド

フィールド

タイプ

説明

__time__

long

ログが生成された時刻。

cluster_id

string

AI ゲートウェイインスタンスの ID。

ai_log

json

Model API、Agent API、MCP API のログフィールドを含む JSON オブジェクト。他の API タイプではこのフィールドは空になります。

  • api:AI API の名前。

  • cache_status:Model API でコンテンツキャッシュが有効になっている場合に、リクエストがキャッシュにヒットしたかどうかを示します。

  • consumer:コンシューマーの ID。コンシューマー認証が有効になっている場合にこのフィールドが設定されます。

  • fallback_from:リクエストがフォールバックされたルート。Model API でフォールバックポリシーが有効になっている場合にこのフィールドが設定されます。

  • input_token:LLM リクエストの入力トークン数。

  • llm_first_token_duration:LLM リクエストの最初のトークンまでの時間 (TTFT)。

  • llm_service_duration:LLM リクエストのエンドツーエンドの応答時間。

  • model:LLM リクエストで使用されたモデルの名前。

  • output_token:LLM 応答の出力トークン数。

  • response_type:LLM リクエストの応答タイプ(ストリーミングまたは非ストリーミングなど)。

  • safecheck_status:LLM リクエストに対する Content Moderation の結果。

  • token_ratelimit_status:トークンベースのレート制限によってリクエストがブロックされたかどうかを示します。

authority

string

リクエストの Host ヘッダーの値。

bytes_received

long

ヘッダーを除くリクエストボディのサイズ (バイト単位)。

bytes_sent

long

ヘッダーを除くレスポンスボディのサイズ (バイト単位)。

downstream_local_address

string

ゲートウェイ Pod のアドレス。

downstream_remote_address

string

ゲートウェイに接続するクライアントのアドレス。

duration

long

ゲートウェイがクライアントから最初のバイトを受信してから、レスポンスの最後のバイトを送信するまでの合計リクエスト処理時間 (ミリ秒単位)。

method

string

HTTP メソッド。

path

string

HTTP リクエストのパス。

protocol

string

HTTP プロトコルバージョン。

request_duration

long

ゲートウェイがクライアントからリクエストの最初のバイトを受信してから、最後のバイトを受信するまでの時間 (ミリ秒単位)。

request_id

string

ゲートウェイが各リクエストに対して生成する一意の ID。この ID は x-request-id ヘッダーに含まれます。このフィールドを使用して、リクエストのログ記録およびトラブルシューティングが可能です。

requested_server_name

string

SSL 接続に使用されたサーバー名。

response_code_details

string

レスポンスコードに関する追加情報。たとえば、via_upstream はバックエンドサービスがレスポンスコードを返したことを示し、route_not_found はゲートウェイが一致するルートを見つけられなかったことを示します。

response_tx_duration

long

ゲートウェイがアップストリームサービスから最初のバイトを受信してから、クライアントに最後のバイトを送信するまでの時間 (ミリ秒単位)。

route_name

string

ルート名。

start_time

string

リクエストの開始時刻。時刻は協定世界時 (UTC) です。

trace_id

string

トレース ID。

upstream_cluster

string

アップストリームクラスター。

upstream_host

string

アップストリームホストの IP アドレス。

upstream_local_address

string

アップストリームサービスに接続するために使用されたローカルアドレス。

upstream_service_time

long

アップストリームサービスのリクエスト処理時間 (ミリ秒単位)。この期間にはネットワーク遅延とサービス自身の処理時間が含まれます。

upstream_transport_failure_reason

string

アップストリーム接続失敗の理由。

user_agent

string

リクエストの User-Agent ヘッダーの値。

x_forwarded_for

string

x-forwarded-for ヘッダーの値。通常、クライアントの実際の IP アドレスが含まれます。