既存のサービスを AI ゲートウェイに追加して、ルーティング可能なバックエンドエンドポイントとして登録する必要があります。これにより、ゲートウェイはサービスアドレスを検出できるようになります。AI ゲートウェイは、コンテナサービス、固定アドレス、DNS ドメイン名、Function Compute (FC) などのサービスの追加をサポートしています。
操作手順
AI ゲートウェイはバックエンドリソースの変更を動的に検出し、トラフィックルーティング、ガバナンス、セキュリティの統合管理を可能にします。AI ゲートウェイは、AI サービス、エージェントサービス、DNS ドメイン名、固定アドレス、コンテナサービス、SAE Kubernetes サービス、Function Compute (FC)、MSE Nacos サービスの作成をサポートしています。
AI サービス
-
AI ゲートウェイコンソールにログオンします。ゲートウェイリストページで、インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、Service をクリックし、次に Create Service をクリックします。
-
Create Service パネルで、以下のパラメーターを設定します。
-
Service Source: AI Services を選択します。
-
Service Name: サービスのカスタム名を入力します。
-
Large Model Supplier: プロバイダーを選択します。サポートされているプロバイダーには、Alibaba Cloud Model Studio、PAI-EAS、DeepSeek、Compatibility with OpenAI、OpenAI、Azure、Gemini、Bedrock、Claude、Dark side of the Moon、Baichuan Intelligence、Zero One Everything、Intelligent Spectrum AI、Mixed Element、Step Star、Spark、Doubao、および MiniMax が含まれます。
重要この AI サービスを通じて提供される大規模モデル機能は、AI ゲートウェイが直接提供するものではありません。これらのサービスを使用する前に、その適合性と信頼性を評価する責任はお客様にあります。サービスの利用が、適用されるすべての法律、規制、および製品利用規約に準拠していることを確認してください。コンプライアンス違反から生じるいかなる結果についても、当社は責任を負いません。
-
Model Protocol:サービスと通信するためのプロトコルを選択します。サポートされているプロトコルは OpenAI/v1 とネイティブプロトコルです。プロバイダーを選択すると、システムによってデフォルト値が設定され、必要に応じて変更できます。
-
OpenAI/v1:ほとんどのプロバイダーに適した、OpenAI 互換プロトコルを使用します。
-
ネイティブプロトコル: プロバイダーのネイティブ API プロトコルを使用します。このオプションを選択すると、サービスアドレスは対応するネイティブプロトコルのエンドポイント (たとえば、Alibaba Cloud Model Studio の場合は
https://dashscope.aliyuncs.com) に自動的に更新されます。
説明Bedrock の Endpoint Mode が Mantle に設定されている場合、Anthropic 互換プロトコル (/v1/messages) のみがサポートされます。OpenAI/v1 プロトコルはサポートされず、プロンプトキャッシング機能は有効にできません。
-
-
Service Endpoint: 大規模モデルサービスのベース URL です。プロバイダーを選択すると、システムが対応するサービスアドレスを自動的に入力します。必要に応じて手動で変更することもできます。
Azure プロバイダーのサービスアドレスのフォーマットは次のとおりです:
https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version={api-version}OpenAI 互換サービスのサービスアドレスのフォーマットは次のとおりです:
http://{endpoint}/v1次の表に、各プロバイダーの設定例を示します。
プロバイダー
サービスアドレス
利用可能なモデル
設定
Alibaba Cloud Model Studio
https://dashscope-intl.aliyuncs.com/compatible-mode/v1qwen-max, qwen-plus, qwen-turbo, qwen-long, qwen-vl-max, qwen-vl-plus, qwen-vl-ocr, deepseek-r1, deepseek-v3
Region を選択します。複数のリージョンに切り替えることができます。
Bedrock
https://bedrock-runtime.{awsRegion}.amazonaws.comプリセットなし (モデル名を手動で入力)
awsRegion、Endpoint Mode (Runtime または Mantle)、および認証方式 (API キー または AK/SK) を設定します。Mantle モードは Anthropic 互換プロトコルのみをサポートします。
Vertex AI
ユーザー定義
プリセットなし
Authentication Method (GCP サービスアカウントまたは Vertex AI Express モード) を設定します。GCP モードでは、GCP サービスアカウントキーを JSON フォーマットで入力します。vertexProjectId は自動的に解析されます。
Azure
https://{endpoint}?api-version={api-version}gpt-3, gpt-35-turbo, gpt-4, gpt-4o, gpt-4o-mini
エンドポイントは、Azure OpenAI リソースのアクセスポイントアドレスです。
OpenAI
https://api.openai.com/v1gpt-3, gpt-35-turbo, gpt-4, gpt-4o, gpt-4o-mini
—
OpenAI 互換
http://{endpoint}/v1プリセットなし (モデル名を手動で入力)
OpenAI API 標準に準拠した AI サービスのみをサポートします。
DeepSeek
https://api.deepseek.com/v1deepseek-chat, deepseek-reasoner
—
Doubao
https://ark.cn-beijing.volces.com/api/v3doubao-seed-1-6-250615, doubao-seed-1-6-flash-250715, doubao-seed-1-6-thinking-250715, doubao-1-5-thinking-vision-pro-250428
—
Gemini
https://generativelanguage.googleapis.com/v1beta/openaigemini-1.5-flash, gemini-1.5-pro
—
MiniMax
https://api.minimaxi.com/v1abab6.5s, abab6.5g, abab6.5t, abab5.5s
—
Moonshot AI
https://api.moonshot.cn/v1moonshot-v1-8k, moonshot-v1-32k, moonshot-v1-128k
—
Zhipu AI
https://open.bigmodel.cn/api/paas/v4GLM-4-Plus, GLM-4-0520, GLM-4-Long, GLM-4-AirX, GLM-4-Air, GLM-4-FlashX, GLM-4-Flash, GLM-4-AllTools, GLM-4
—
PAI-EAS
Workspace と EAS Service を選択すると、自動的に取得されます。
プリセットなし (動的にフェッチ)
Workspace、EAS Service、Connection Type (非公開またはパブリックネットワーク) を選択する必要があります。API キーは自動的に取得され、手動での構成は不要です。
Claude
https://api.anthropic.comclaude-3-5-sonnet-latest, claude-3-5-haiku-latest, claude-3-opus-latest
Claude Code クライアントの呼び出しとの互換性のため、任意でUse Claude Code OAuth Tokenを有効にすることができます。
Baichuan
https://api.baichuan-ai.com/v1Baichuan4-Turbo, Baichuan4-Air, Baichuan4, Baichuan3-Turbo, Baichuan3-Turbo-128k, Baichuan2-Turbo
—
Yi
https://api.lingyiwanwu.com/v1yi-lightning, yi-large, yi-medium, yi-medium-200k, yi-spark, yi-large-rag, yi-large-fc, yi-large-turbo
—
Hunyuan
https://hunyuan.tencentcloudapi.comhunyuan-turbo-latest, hunyuan-turbo, hunyuan-large, hunyuan-pro, hunyuan-standard-256K, hunyuan-standard, hunyuan-lite
—
StepFun
https://api.stepfun.comstep-1-8k, step-1-32k, step-1-128k, step-1-256k, step-2-16k, step-1-flash
—
Spark
https://spark-api-open.xf-yun.comlite, generalv3, pro-128k, generalv3.5, max-32k, 4.0Ultra
—
-
API キー:large モデルサービスにアクセスするために必要な API キー認証情報です。Large Model Supplier を選択した後、以下の手順でキーを取得します。
-
Alibaba Cloud Model Studio:Alibaba Cloud Model Studio コンソールAlibaba Cloud Model Studio コンソールに移動して取得します。
-
PAI-EAS: Workspace と EAS Service を選択すると、API キーが自動的に取得されます。手動での構成は不要です。
-
Bedrock:API キーモードを使用する場合、KMS キーを参照するか、キーを手動で入力できます。AK/SK モードを使用する場合は、awsAccessKey と awsSecretKey を提供する必要があります。
-
その他のプロバイダー:各プロバイダーのプラットフォームに移動して API キーを取得するか、サービスプロバイダーに連絡して支援を求めてください。
-
-
-
パラメーターを設定し、OK をクリックします。
エージェントサービス
-
AI ゲートウェイコンソールにログインします。ゲートウェイリストページで、インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、Service をクリックし、次に Create Service をクリックします。
-
Create Service パネルで、次のパラメーターを設定します:
-
Service Source:Service Source を選択します。
-
Service Name:サービスのカスタム名を入力します。
-
Service Provider: Alibaba Cloud Model Studio、[Dify]、または Custom を選択します。
重要このエージェントサービスを通じて提供されるエージェント機能は、AI ゲートウェイが直接提供するものではありません。これらのサービスを使用する前に、その適合性と信頼性を評価する責任はお客様にあります。サービスの利用が、適用されるすべての法律、規制、および製品利用規約に準拠していることを確認してください。コンプライアンス違反から生じるいかなる結果についても、当社は責任を負いません。
Alibaba Cloud Model Studio
-
API Endpoint: エージェントサービスのエンドポイントアドレスを入力します。デフォルトは
https://dashscope.aliyuncs.com/api/v1です。 -
APP ID と API キー:アプリケーション ID と API キーは、Alibaba Cloud Model Studio コンソールから取得できます。
[API キー管理] ページで、[自分] タブをクリックして API キーリストを表示します。新しい API キーを作成するには、右上隅の [自分の API-KEY を作成] をクリックします。既存の API キーの完全なキーを表示するには、[アクション] 列の [表示] をクリックします。
Dify
-
API Endpoint: エージェントサービスのエンドポイントアドレスを入力します。デフォルトは
https://api.dify.ai/v1です。 -
Application Type: Agent または Workflow を選択します。
-
エージェント:エージェントアプリケーションタイプ。
-
ワークフロー:ワークフローアプリケーションタイプ。
-
-
API キー:サービスプロバイダーからキーを取得します。
カスタム
-
API Endpoint: エージェントサービスのエンドポイントアドレスを入力します。
-
API キー:サービスプロバイダーからキーを取得します。
-
-
-
パラメーターを設定した後、OK をクリックします。
DNS ドメイン名
AI ゲートウェイは、DNS 解決の結果をバックエンドサービスアドレスとして使用できます。
-
AI ゲートウェイコンソールにログインします。 ゲートウェイリストページで、インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。 左側のナビゲーションウィンドウで、Serviceをクリックし、次にCreate Serviceをクリックします。
-
Create Service パネルで、次のパラメーターを設定します。
-
Service Source: Domain Name を選択します。
-
Service Name:サービスに任意の名前を入力します。
-
Service URL:サービスのバックエンドノードのアドレスです。バックエンドノードは、サービスのソースによって異なります。フォーマットは
<DNS ドメイン名>:<サービスポート>です。複数のアドレスを入力する場合は、コンマ,で区切ります。重要パブリック IP アドレスを指定する場合は、NAT Gateway を設定する必要があります。
-
TLS Mode:デフォルトで無効です。
-
Close: サービスへのアクセスに TLS は必須ではありません。
-
一方向 TLS:HTTPS 経由でサービスにアクセスするには、このオプションを有効にします。
-
mTLS:相互 TLS 認証を行うには、このオプションを有効にします。
-
-
-
パラメーターを設定した後、OK をクリックします。
固定アドレス
サービスに検出メカニズムがない場合は、バックエンドエンドポイントアドレスを手動で追加する必要があります。
-
AI ゲートウェイ コンソールにログインします。ゲートウェイリストページで、インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、Service をクリックし、次に Create Service をクリックします。
-
Create Service パネルで、次のパラメーターを設定します。
-
Service Source:Fixed Address を選択します。
-
Service Name: サービスに任意の名前を入力します。
-
Service URL: サービスのバックエンドノードアドレスです。バックエンドノードはサービスソースによって異なります。フォーマットは
<IP>:<Service Port>です。複数のアドレスを入力する場合は、コンマ,で区切ります。重要パブリック IP アドレスを指定する場合は、NAT Gateway を設定する必要があります。
-
TLS Mode: デフォルトで無効です。
-
Close: サービスにアクセスするために TLS は必須ではありません。
-
一方向 TLS:HTTPS 経由でサービスにアクセスするには、このオプションを有効にします。
-
mTLS:相互 TLS 認証を行うには、このオプションを有効にします。
-
-
-
パラメーターを設定した後、OK をクリックします。
コンテナサービス
コンテナサービスをサービスソースとして追加すると、ゲートウェイは指定された Container Service for Kubernetes (ACK) または ACK Serverless クラスターからサービスリストとバックエンドエンドポイントを取得します。
-
AI ゲートウェイコンソールにログインします。 インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。 左側のナビゲーションウィンドウで、サービス をクリックします。
-
ソースの作成
-
Source タブをクリックし、次に Create Source をクリックします。Create Source パネルで、次のパラメーターを設定します:
-
Source Type: Kubernetes サーバーを使用してバックエンドサービスを検出するには、ACK を選択します。
-
ACK/ACS/ACK Serverless クラスター:バックエンドサービスが配置されているクラスターを選択します。
重要-
現在の Virtual Private Cloud (VPC) に ACK、ACS、または ACK Serverless クラスターが存在しない場合は、まずACK マネージドクラスターを作成してから、そのクラスターを選択する必要があります。
-
別の VPC からサービスソースを追加するには、クラスターを選択する前に、その VPC にゲートウェイインスタンスを作成する必要があります。
-
1 つのゲートウェイインスタンスは、最大 3 つの ACK コンテナサービスに関連付けることができます。
-
AI ゲートウェイは、同じ VPC 内からのみ Nacos または ACK ソースを追加できます。VPC をまたいだサービスソースの追加はサポートされていません。
-
-
-
パラメーターを設定した後、OK をクリックします。
-
-
サービスの作成
-
Service タブをクリックして Create Source をクリックし、Create Source パネルで次のパラメーターを設定します。
-
Service Source: ACK を選択します。
ゲートウェイは ACK または ACK Serverless クラスターからサービスリストを取得し、サービスとそのバックエンドエンドポイントをゲートウェイに追加します。
-
Namespace: クラスターの名前空間を選択します。デフォルトでは、
arms-prom、kube-system、およびmse-pilot名前空間のサービスは表示されません。 -
Services: リストからサービスを選択します。デフォルトでは、名前が
consumersで始まるサービスは表示されません。
-
-
パラメーターを設定したら、OK をクリックします。
-
SAE Kubernetes サービス
SAE Kubernetes サービスをサービスソースとして追加する場合、SAE アプリケーションでK8s サービス登録と検出を有効にする必要があります。
-
AI ゲートウェイコンソールにログオンします。ゲートウェイリストページで、インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、Serviceをクリックし、Create Serviceをクリックします。
-
Create Service パネルで、以下のパラメーターを設定します。
-
Service Source: SAE Kubernetes サービス。SAE アプリケーションには、K8s ServiceName によるサービスアクセスの設定が必要です。
-
Namespace: クラスターの名前空間を選択します。デフォルトでは、
arms-prom、kube-system、およびmse-pilot名前空間のサービスは表示されません。 -
Services: リストからサービスを選択します。デフォルトでは、
consumers:で始まる名前のサービスは表示されません。
-
-
パラメーターを設定した後、OK をクリックします。
Function Compute (FC)
Function Compute 3.0 のみがサポートされています。Function Compute 2.0 のサービスソースはサポートされていません。
-
AI ゲートウェイコンソールにログオンします。ゲートウェイリストページで、インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、Service をクリックし、Create Service をクリックします。
-
Create Service パネルで、次のパラメーターを設定します:
-
Service Source: Function Compute。
-
関数リスト:リストから関数を選択します。
-
バージョンまたはエイリアス:関数のバージョンまたはエイリアスを選択します。
-
-
パラメーターを設定したら、OK をクリックします。
MSE Nacos
-
AI ゲートウェイコンソールにログインします。インスタンスが配置されているリージョンを選択し、インスタンス ID をクリックします。左側のナビゲーションウィンドウで、Service をクリックします。
-
ソースの作成
-
Source タブをクリックし、 Create Source をクリックします。 Create Source パネルで、次のパラメーターを設定します:
-
Source Type: MSE Nacos サービスレジストリを使用してバックエンドサービスを検出するには、MSE Nacos を選択します。
-
Nacos クラスター:Nacos クラスターを選択します。
重要-
現在の VPC に MSE Nacos クラスターが存在しない場合は、まずMSE Nacos クラスターを作成してから選択する必要があります。
-
別の VPC からサービスソースを追加するには、Nacos クラスターを選択する前に、その VPC にゲートウェイインスタンスを作成する必要があります。
-
クラスターリストには、
MCPEnabled = trueが設定されている MSE Nacos インスタンスのみが表示されます。この設定は MSE Nacos のパラメータ設定で変更できます。 -
1 つのゲートウェイインスタンスは、1 つの Nacos クラスターにのみ関連付けることができます。
-
-
-
パラメーターを設定した後、OK をクリックします。
-
-
サービスの作成
-
Service タブをクリックし、次に Create Service をクリックします。Create Service パネルで、次のパラメーターを設定します。
-
Service Source: MSE Nacos を選択します。
ゲートウェイは Nacos クラスターからサービスリストを取得し、サービスとそのバックエンドエンドポイントをゲートウェイに追加します。
-
Namespace:名前空間を選択します。デフォルトでは、
arms-prom、kube-system、およびmse-pilot名前空間のサービスは表示されません。 -
Services: リストからサービスを選択します。デフォルトでは、
consumers:で始まる名前のサービスは表示されません。
-
-
パラメーターを設定した後、OK をクリックします。
-