動的ルーティングのための AI Gateway へのバックエンドサービス接続 - API Gateway

既存のサービスをゲートウェイに登録してルーティングを有効にし、ゲートウェイがサービスのエンドポイントを取得できるようにします。AI Gateway は、コンテナーサービス、固定アドレス、DNS ドメイン名、Function Compute など、さまざまなソースからのサービスの追加をサポートしています。

手順

説明

AI Gateway はリクエストを変更しません。リクエストがドメイン名を使用するバックエンドサービスに転送される場合、ゲートウェイは `Host` ヘッダーを設定済みのドメイン名に書き換えません。

ゲートウェイはサービスを使用して、バックエンドリソースの変更を動的に検出します。これにより、トラフィックルーティング、管理、セキュリティ保護の統合管理が可能になります。AI Gateway は、AI サービス、Agent サービス、DNS ドメイン名、固定アドレス、コンテナーサービス、SAE Kubernetes サービス、Function Compute (FC)、MSE Nacos のソースからサービスを作成することをサポートしています。

AI サービス

AI Gateway コンソールにログインします。ゲートウェイリストページで、インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで [サービス] をクリックし、次に [サービスの作成] をクリックします。
[サービスの作成] パネルで、次のパラメーターを設定します。
- サービスソース: [AI サービス] を選択します。
- サービス名: サービスのカスタム名を入力します。
- 大規模モデルプロバイダー: サポートされているプロバイダーは、Alibaba Cloud Model Studio、PAI-EAS、Deepseek、OpenAI 互換、OpenAI、Azure、Gemini、Bedrock、Claude、Moonshot AI、Baichuan、Yi、Zhipu AI、Hunyuan、StepFun、Spark、Doubao、MiniMax です。
  重要
  AI サービスを通じて提供される大規模モデル機能は、AI Gateway によって直接提供されるものではありません。これらのサービスを使用する前に、その適合性と信頼性を評価する必要があります。サービスの使用が、適用されるすべての法律、規制、およびユーザー契約に準拠していることを確認してください。コンプライアンス違反に起因するいかなる結果についても、当社は責任を負いません。
- サービスアドレス (base_url): 大規模モデルサービスのベース URL を入力します。フォーマットは https://{domain}/v1 です。
  Azure サービスプロバイダーの場合、サービスアドレスは https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version={api-version} です。
- API-KEY: 大規模モデルサービスへのアクセスに必要な API キーを入力します。Alibaba Cloud Model Studio を使用する場合は、Alibaba Cloud Model Studio API-KEY ページから API キーを取得します。他の大規模モデルプロバイダーについては、対応するサービスプロバイダー (SP) にお問い合わせください。
設定が完了したら、[OK] をクリックします。

Agent サービス

AI Gateway コンソールにログインします。ゲートウェイリストページで、インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで [サービス] をクリックし、次に [サービスの作成] をクリックします。
[サービスの作成] パネルで、次のパラメーターを設定します。
- サービスソース: [Agent サービス] を選択します。
- サービス名: サービスのカスタム名を入力します。
- サービスプロバイダー: [Alibaba Cloud Model Studio]、[Dify]、または [カスタム] を選択します。
  重要
  Agent サービスを通じて提供されるエージェント機能は、AI Gateway によって直接提供されるものではありません。これらのサービスを使用する前に、その適合性と信頼性を評価する必要があります。サービスの使用が、適用されるすべての法律、規制、およびユーザー契約に準拠していることを確認してください。コンプライアンス違反に起因するいかなる結果についても、当社は責任を負いません。
  Alibaba Cloud Model Studio
  - API アドレス: Agent サービスのエンドポイントを入力します。デフォルトは https://dashscope.aliyuncs.com/api/v1 です。
  - APP ID と API KEY: Alibaba Cloud Model Studio コンソールからアプリケーション ID と API キーを取得します。
  Dify
  - API アドレス: Agent サービスのエンドポイントアドレスを入力します。デフォルトは https://api.dify.ai/v1 です。
  - アプリケーションタイプ: [Agent] または [Workflow] を選択します。
    Agent: エージェントタイプの場合はこのオプションを選択します。
    Workflow: ワークフロータイプの場合はこのオプションを選択します。
  - API KEY: サービスプロバイダーからキーを取得します。
  カスタム
  - API アドレス: Agent サービスのエンドポイントを入力します。
  - API KEY: サービスプロバイダーからキーを取得します。
設定が完了したら、[OK] をクリックします。

DNS ドメイン名

説明

AI Gateway は、DNS 解析結果をバックエンドサービスのエンドポイントとして使用できます。

AI Gateway コンソールにログインします。ゲートウェイリストページで、インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで [サービス] をクリックし、次に [サービスの作成] をクリックします。
[サービスの作成] パネルで、次のパラメーターを設定します。
- サービスソース: [DNS ドメイン名] を選択します。
- サービス名: サービスのカスタム名を入力します。
- サービスアドレス: サービスのバックエンドノードアドレスを入力します。フォーマットは <DNS ドメイン名>:<サービスポート> です。複数のアドレスをカンマ (,) で区切って入力できます。
  重要
  パブリック IP アドレスを指定する場合は、NAT Gateway を設定する必要があります。
- TLS モード: デフォルトでは無効になっています。
  - 無効: サービスへのアクセスに TLS は必要ありません。
  - 一方向 TLS: HTTPS を使用してサービスにアクセスする必要がある場合は、一方向 TLS を有効にします。
  - 双方向 TLS (mTLS): 相互認証が必要な場合は、mTLS を有効にします。
設定が完了したら、[OK] をクリックします。

固定アドレス

説明

サービスがサービス検出メカニズムを使用しない場合は、バックエンドノードアドレスを手動で追加する必要があります。

AI Gateway コンソールにログインします。ゲートウェイリストページで、インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで [サービス] をクリックし、次に [サービスの作成] をクリックします。
[サービスの作成] パネルで、次のパラメーターを設定します。
- サービスソース: [固定アドレス] を選択します。
- サービス名: サービスのカスタム名を入力します。
- サービスアドレス: サービスのバックエンドノードアドレスを入力します。フォーマットは <IP>:<サービスポート> です。複数のアドレスをカンマ (,) で区切って入力できます。
  重要
  パブリック IP アドレスを指定する場合は、NAT Gateway を設定する必要があります。
- TLS モード: デフォルトでは無効になっています。
  - 無効: サービスへのアクセスに TLS は必要ありません。
  - 一方向 TLS: HTTPS を使用してサービスにアクセスする必要がある場合は、一方向 TLS を有効にします。
  - 双方向 TLS (mTLS): 相互認証が必要な場合は、mTLS を有効にします。
設定が完了したら、[OK] をクリックします。

コンテナーサービス

説明

コンテナーサービスをサービスソースとして追加すると、ゲートウェイは指定された ACK または Serverless Kubernetes クラスターからサービスリストを取得し、サービスとそのバックエンドノードアドレスを追加します。

AI Gateway コンソールにログインします。インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、[サービス] をクリックします。
ソースの作成
1. [ソース] タブをクリックし、[ソースの作成] をクリックします。[ソースの作成] パネルで、次のパラメーターを設定します。
  - ソースタイプ: [コンテナーサービス] を選択して、Kubernetes サーバーを使用してバックエンドサービスを検出します。
  - ACK/ACS/Serverless Kubernetes クラスター: バックエンドサービスが配置されているクラスターを選択します。
    重要
    現在の VPC に ACK、ACS、または Serverless Kubernetes クラスターが存在しない場合は、まずACK マネージドクラスターを作成する必要があります。
    別の VPC からサービスソースを追加するには、クラスターを選択する前にその VPC にゲートウェイインスタンスを作成する必要があります。
    単一のゲートウェイインスタンスは、最大 3 つの ACK コンテナーサービスに関連付けることができます。
    AI Gateway は、同じ VPC 内からのみ Nacos または ACK ソースを追加できます。VPC をまたいだサービスソースの追加はサポートされていません。
2. 設定が完了したら、[OK] をクリックします。
サービスの作成
1. [サービス] タブをクリックし、[サービスの作成] をクリックします。[サービスの作成] パネルで、次のパラメーターを設定します。
  - サービスソース: [コンテナーサービス] を選択します。
    ゲートウェイは、指定された ACK または Serverless Kubernetes クラスターからサービスリストを取得し、サービスとそのバックエンドノードアドレスを追加します。
  - 名前空間: クラスターの名前空間を選択します。デフォルトでは、`arms-prom`、`kube-system`、`mse-pilot` 名前空間のサービスは非表示になっています。
  - サービスリスト: リストからサービスを選択します。デフォルトでは、名前が `consumers` で始まるサービスは非表示になっています。
2. 設定が完了したら、[OK] をクリックします。

SAE Kubernetes サービス

重要

SAE Kubernetes サービスをソースとして追加する前に、SAE アプリケーションで K8s サービスの登録と検出を有効にする必要があります。

AI Gateway コンソールにログインします。ゲートウェイリストページで、インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで [サービス] をクリックし、次に [サービスの作成] をクリックします。
[サービスの作成] パネルで、次のパラメーターを設定します。
- サービスソース: [SAE Kubernetes サービス] を選択します。SAE アプリケーションには、K8s ServiceName に基づいて設定されたアプリケーションサービスアクセスが必要です。
- 名前空間: クラスターの名前空間を選択します。デフォルトでは、`arms-prom`、`kube-system`、`mse-pilot` 名前空間のサービスは非表示になっています。
- サービスリスト: リストからサービスを選択します。デフォルトでは、名前が consumers: で始まるサービスは非表示になっています。
設定が完了したら、[OK] をクリックします。

Function Compute (FC)

重要

Function Compute 3.0 のみがサポートされています。Function Compute 2.0 のサービスソースはサポートされていません。

AI Gateway コンソールにログインします。ゲートウェイリストページで、インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで [サービス] をクリックし、次に [サービスの作成] をクリックします。
[サービスの作成] パネルで、次のパラメーターを設定します。
- サービスソース: [Function Compute (FC)] を選択します。
- 関数リスト: リストから関数を選択します。
- バージョンまたはエイリアス: 関数のバージョンまたはエイリアスを選択します。
設定が完了したら、[OK] をクリックします。

MSE Nacos

AI Gateway コンソールにログインします。インスタンスのリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、[サービス] をクリックします。
ソースの作成
1. [ソース] タブをクリックし、[ソースの作成] をクリックします。[ソースの作成] パネルで、次のパラメーターを設定します。
  - ソースタイプ: [MSE Nacos] を選択して、MSE Nacos サービスレジストリを使用してバックエンドサービスを検出します。
  - Nacos クラスター: Nacos クラスターを選択します。
    重要
    現在の VPC に MSE Nacos クラスターが存在しない場合は、まずMSE Nacos クラスターを作成する必要があります。
    別の VPC からサービスソースを追加するには、Nacos クラスターを選択する前にその VPC にゲートウェイインスタンスを作成する必要があります。
    クラスターリストには、MCPEnabled が `true` に設定されている MSE Nacos インスタンスのみが表示されます。この設定は、MSE Nacos のパラメーター設定で変更できます。
    単一のゲートウェイインスタンスは、1 つの Nacos インスタンスにのみ関連付けることができます。
2. 設定が完了したら、[OK] をクリックします。
サービスの作成
1. [サービス] タブをクリックし、[サービスの作成] をクリックします。[サービスの作成] パネルで、次のパラメーターを設定します。
  - サービスソース: [MSE Nacos] を選択します。
    ゲートウェイは、指定された Nacos クラスターからサービスリストを取得し、サービスとそのバックエンドノードアドレスを追加します。
  - 名前空間: 名前空間を選択します。デフォルトでは、arms-prom、kube-system、または mse-pilot 名前空間のサービスは表示されません。
  - サービスリスト: リストからサービスを選択します。デフォルトでは、名前が consumers: で始まるサービスは非表示になっています。
2. 設定が完了したら、[OK] をクリックします。

手順