Application Load Balancer (ALB) のサービス拡張は、組み込みコンポーネントを介してリクエスト転送パスにカスタムロジックを組み込みます。アプリケーションコードの変更や追加のプロキシレイヤーのデプロイなしで、主要な処理段階で認証、コンテンツ書き換え、AI コンテキスト認識を追加できます。
利用シーン:
API キーまたは JWT を使用して AI サービスエンドポイントへのリクエストを認証する
ユーザーごとまたはアカウントごとのレート制限により、AI ワークロードのトークン消費量を制御する
リクエストとレスポンスのフローにカスタム処理ロジックを追加する
サービス拡張には、現在パブリックプレビュー中の ALB Extensible Edition が必要です。詳細については、「ALB Extensible Edition のパブリックプレビュー」をご参照ください。
サポートされるコンポーネント
サービス拡張には 1 つ以上のコンポーネントが含まれます。各コンポーネントは、リクエスト処理パイプラインに特定の機能を追加します。サービス拡張は最大 5 つのコンポーネントをサポートし、重複するコンポーネントは許可されません。
トラフィック管理
コンポーネント | 説明 |
トークンレート制限 | AI アプリケーションにトークンレベルのレート制限を提供します。OpenAI 互換プロトコルに準拠したリクエストとレスポンスのペイロードを識別して解析し、トークン使用量を自動的に抽出し、スライディングウィンドウアルゴリズムを使用してトークンをカウントします。ユーザーやアカウントなどのディメンションによるレート制限をサポートします。 |
認証
コンポーネント | 説明 |
API キー認証 | API キーに基づいてインバウンドリクエストを認証および認可します。HTTP ヘッダー、URL パラメーター、または Cookie から API キーを解析し、その正当性とアクセス権限を検証します。実装が簡単で、オーバーヘッドが低いです。機密性の低い操作に適しています。セキュリティは JWT 認証よりも低いため、厳格な認証情報管理が必要です。詳細については、をご参照ください。 |
JWT 認証 | JSON Web Token (JWT) に基づいてインバウンドリクエストを認証および認可します。HTTP ヘッダー、URL パラメーター、または Cookie から JWT を解析し、HMAC、RSA、または ECDSA アルゴリズムを使用して署名を検証し、アクセス権限をチェックします。API キー認証よりも強力なセキュリティを提供します。 |
サービス拡張の設定
サービス拡張の設定は 2 つのステップで行います。まずコンポーネントを含むサービス拡張を作成し、次にそれを ALB の転送ルールに関連付けます。
コンソール
サービス拡張の作成
ALB コンソール - サービス拡張ページに移動し、ターゲット ALB インスタンスのリージョンを選択して、[サービス拡張の作成] をクリックします。
[拡張機能名] を入力し、[拡張機能タイプ] と [コンポーネント名] を選択し、コンポーネントパラメーターを設定します。
(オプション) コンポーネントを追加するには、コンポーネントカードの左下隅にある [拡張コンポーネントを追加] をクリックします。
[作成] をクリックします。
転送ルールとの関連付け
ALB コンソールで、ターゲットインスタンスの ID をクリックします。
[リスナー] タブをクリックします。ターゲットリスナーの [アクション] 列で、[転送ルールの表示/変更] をクリックします。
[新しいルールを追加] をクリックするか、既存のルールを編集します。[サービス拡張] セクションで、ターゲットのサービス拡張を選択します。
設定を確認し、[OK] をクリックします。
説明各転送ルールは、1 つのサービス拡張にのみ関連付けることができます。
サービス拡張の管理
[サービス拡張] ページに移動して、サービス拡張を編集または削除します。転送ルールに関連付けられているサービス拡張を削除するには、まず対応する転送ルールを編集または削除して、関連付けを解除する必要があります。
課金
パブリックプレビュー期間中、ALB Extensible Edition インスタンスとサービス拡張機能は無料です。インターネットデータ転送料金は、標準の Alibaba Cloud インターネットデータ転送料金に基づいて請求されます。パブリックプレビューが終了すると、ALB Extensible Edition は公式の料金基準に従って課金されます。
クォータ
クォータの引き上げをリクエストするには、アカウントマネージャーにお問い合わせください。
クォータ名 | 説明 | デフォルト値 |
| リージョンあたりのサービス拡張数 | 50 |
| サービス拡張あたりの関連リソース数 | 200 |
| サービス拡張あたりのコンポーネント数 | 5 |