すべてのプロダクト
Search
ドキュメントセンター

Server Load Balancer:ALB Extensible Edition の概要

最終更新日:Mar 28, 2026

現代アプリケーションおよび AI アプリケーションの統一アクセス要件を満たすため、Alibaba Cloud は Application Load Balancer (ALB) Extensible Edition を提供します。このエディションは柔軟な Service Extensions 機能に基づき、認証やコンテンツベースのルーティングといったコアトラフィック管理機能に加え、マルチモデルプロキシ、GPU 対応スケジューリング、トークン単位のレート制限といった AI ネイティブ機能を備え、アプリケーションおよび AI ワークロード双方に対応する統合型インテリジェントトラフィックゲートウェイを実現します。

主なメリット

  • アプリケーション層の弾力性:ALB Extensible Edition はレイヤー 7 で動作し、ドメイン名および仮想 IP アドレス (VIP) を用いたマルチティア配信により、大規模なリクエストを処理します。アプリケーションのサービス容量をスケールさせるためのトラフィック配信をサポートし、単一障害点を排除して可用性を向上させます。また、ゾーン間の弾力的スケーリングを可能にするカスタムゾーン組み合わせを設定することで、リソースボトルネックを回避できます。

  • 高度なコンテンツベースルーティング:ALB Extensible Edition は、パス、HTTP ヘッダーなどの条件に基づくルーティングをサポートし、特定のトラフィックを識別して異なるバックエンドサーバーに転送します。また、リダイレクト、書き換え、カスタム HTTP ヘッダーの付与も可能です。

  • アプリケーション層のコンテンツ認識機能:ALB Extensible Edition はリクエストボディの内容を深く解析し、その内容に基づいて異なるバックエンドサービスへ動的にトラフィックをルーティングできます。従来のレイヤー 7 プロキシ機能を基盤として、「L7+」プロキシ機能を提供し、AI アプリケーションのユースケースに最適です。

  • 柔軟なサービス拡張機能:ALB はプラグインおよび外部サービス呼び出しを活用した Service Extensions をサポートし、カスタムビジネス要件への対応や、AI 主導のビジネス変化への迅速な対応を実現します。

  • セキュリティと信頼性:ALB Extensible Edition は、認証情報管理、組み込み DDoS 対策、Web Application Firewall (WAF) との統合をネイティブでサポートします。TLS セキュリティポリシーおよび TLS 1.3 を用いたエンドツーエンドの HTTPS 暗号化を提供し、暗号化が重要なワークロードにも対応します。これにより、ゼロトラストセキュリティアーキテクチャの要件を満たします。

  • SSE ストリーミング:ALB Extensible Edition は Server-Sent Events (SSE) ストリーミングをサポートします。大規模言語モデル (LLM) アプリケーションにおいて、SSE は推論結果をリアルタイムでストリーミングし、ユーザー体験を向上させます。

  • 柔軟な課金方式:ALB Extensible Edition は、Elastic IP Address (EIP) および Internet Shared Bandwidth を通じてパブリックネットワーク機能を提供し、柔軟な課金を実現します。さらに、先進的な Load Balancer Capacity Unit (LCU) 課金モデルを採用しており、弾力的なビジネスピークにも適しています。

適用範囲/利用シーン

  • アプリケーショントラフィックゲートウェイ:トラフィック配信、認証、レート制限機能を備えた従来の Web アプリケーションおよび AI アプリケーションに適しています。

  • モダンアプリケーションおよび AI ワークロード:モデル認識型ルーティングを活用し、特定のモデル要件に応じたトラフィック配信、GPU 使用率の最適化、コスト効率の高い低遅延推論を実現する、モダンおよび AI/ML ワークロードの最適化に適しています。

  • マルチモデル統合プロキシ:モデル適応、インテリジェントスケジューリング、動的フェールオーバーといった課題を包括的に解決するワンストップソリューションであり、細かい粒度の身分認証機構を統合することで、安全で弾力的かつ高信頼性の AI インフラストラクチャを構築します。

  • ハイブリッドおよびマルチクラウド環境における高可用性:ハイブリッド接続を簡素化し、マルチクラウドネットワーキングの中核としてセキュリティを確保します。データセンター、支店、マルチクラウドリソースに対して高性能なアプリケーション配信およびセキュリティを提供します。

  • コンテナ Ingress ゲートウェイ:クラスター内のコンテナサービスへ外部からの HTTP(S) リクエストをルーティングし、ブルーグリーンデプロイメント、A/B テスト、TLS 終端、コンテンツベースルーティングをサポートします。

  • 高性能かつ安全なアプリケーション配信:オートスケーリング、WAF、DDoS 対策、Cloud Firewall と統合された高性能ロードバランシングを提供し、安全なアプリケーション配信を保証します。

インスタンスのパフォーマンスメトリクス

ALB インスタンスは、指定された各 vSwitch から 3 つの IP アドレスを割り当てます:外部サービス用の VIP(1 つ)およびバックエンドサーバーとの通信およびヘルスチェック用のローカル IP(2 つ)です。

ALB のすべてのスケーリング機能を利用可能にするためには、ALB インスタンスをデプロイする各 vSwitch に最低 8 つの IP アドレスを確保してください。

単一 VIP のパフォーマンスメトリクス

最大自動スケーリング性能

秒間クエリ数 (QPS)

500,000

秒間接続数 (CPS)

200,000

同時接続数

5,000,000

最大プライベート帯域幅

25 Gbps

デュアルゾーン ALB インスタンスのデフォルトパブリック帯域幅は 400 Mbps です。実際のパブリック帯域幅は、ALB インスタンスに関連付けられたすべての EIP の合計帯域幅によって決定されます。

  • 単一の Alibaba Cloud アカウントが所有する、単一の リージョン 内のトラフィック課金方式の EIP の合計ピーク帯域幅は、5 Gbps を超えることはできません。詳細については、「従量課金」の帯域幅制限セクションをご参照ください。

  • より大きな帯域幅が必要な場合は、Internet Shared Bandwidth インスタンスをご購入ください。

ALB Extensible Edition の構成要素

概念

説明

インスタンス

レイヤー 7 で動作し、トラフィックを異なるバックエンドサーバーに分散することにより、アプリケーションのスループットをスケールさせる強力な負荷分散機能を提供します。単一のインスタンスで最大 100 万 QPS を処理できます。

リスナー

リスナーは ALB の最小サービス単位です。ALB が処理すべきトラフィック(例:ポート 80 上の HTTP)を指定するため、リスナーにはプロトコルおよびポートを設定する必要があります。ALB インスタンスは、トラフィックの処理および分散を開始するために、少なくとも 1 つのリスナーを設定する必要があります。デフォルトでは、各 ALB インスタンスは最大 50 個のリスナーをサポートし、異なるビジネストラフィックを処理できます。

転送ルール

転送ルールは、ALB インスタンスが 1 つ以上のサーバーグループ内のバックエンドサーバーへリクエストをどのようにルーティングするかを決定します。ALB Extensible Edition は、ドメイン、パス、HTTP ヘッダーなどに基づく強力な高度なルーティング機能を提供します。Service Extensions を関連付けることで、リクエストボディの深層解析を実現し、アプリケーション層のコンテンツ認識型スケジューリングを可能にします。

Service Extensions

Service Extensions は、ALB Extensible Edition のデータ転送パスにカスタムロジックを直接挿入できる新機能です。プラグイン機構および外部サービス呼び出しを活用することで、動的ルーティング、認証、コンテンツの再書き込み、AI コンテキスト認識などのビジネスロジックを、リクエスト処理の主要ノードで柔軟に実行できます。また、ALB Extensible Edition は、多くの一般的なユースケースに対応する豊富な組み込みコンポーネントライブラリを提供し、すぐに使える状態で利用できます。これにより、カスタム開発コストを大幅に削減できます。この機能は、ALB Extensible Edition の柔軟性およびプログラマビリティを高め、アプリケーションコードの変更や追加のプロキシレイヤーのデプロイを必要とせずに、AI 主導のビジネス変化に迅速に対応し、複雑かつカスタマイズされた要件を満たすことを可能にします。

サーバーグループ

サーバーグループは、ALB によって分散されたリクエストを処理する複数のバックエンドサーバーを含む論理グループです。ALB では、サーバーグループは ALB インスタンスとは独立して存在します。同じサーバーグループを異なる ALB インスタンスにアタッチできます。ALB 拡張エディションのサーバーグループは、サーバータイプ (ECS、ECI、ENI)、IP タイプ、Function Compute タイプ、DNS ドメイン名タイプ、および AI サービスタイプをサポートしています。

サーバーグループは、ALB が分散するビジネスリクエストを処理する複数のバックエンドサーバーを含む論理グループです。ALB では、サーバーグループは ALB インスタンスとは独立して存在します。そのため、同一のサーバーグループを複数の ALB インスタンスに関連付けることができます。ALB Extensible Edition のサーバーグループは、サーバータイプ(Elastic Compute Service (ECS)、Elastic Container Instance、elastic network interface (ENI))、IP タイプ、Function Compute タイプ、DNS ドメイン名タイプ、AI サービスタイプ、MCP サービスタイプをサポートします。

ヘルスチェック

ALB はヘルスチェックを使用してバックエンドサーバーの可用性を判定します。ALB はサーバーグループ内の不健全なサーバーを検出し、それらへのトラフィック配信を回避します。ALB は、プロトコル、ポート、さまざまなしきい値を含む柔軟なヘルスチェック設定をサポートします。また、異なるサーバーグループに迅速に適用可能なヘルスチェックテンプレートも提供します。

認証情報管理

ALB Extensible Edition の認証情報管理機能は、アウトバウンド認証情報を集中して作成および管理することをサポートします。これらの認証情報は Key Management Service (KMS) を使用して暗号化され、保存されます。バックエンドサービスを追加する際に、作成済みの認証情報を直接参照でき、ALB はリクエストを転送する際に自動的にそれらを含めて認証を完了します。

インスタンスタイプ

Alibaba Cloud は、インターネット向けおよび内部向けの ALB タイプを提供しています。ビジネス要件に応じて、インターネット向けまたは内部向けの ALB インスタンスを選択して設定できます。システムは、選択内容に基づいて Internet Shared Bandwidth および EIP の使用有無を判断します。

概念

説明

VIP

ALB がトラフィックを分散するためのエンティティです。各 VIP は Virtual Private Cloud (VPC) 内のプライベート IP アドレスです。

EIP

インターネット向け ALB を作成する場合にのみ必要であり、内部向け ALB には不要です。これは ALB のパブリック IP アドレスです。インターネット向け ALB インスタンスは、複数の EIP を持つことができます。高可用性を確保するためには、インターネット向け ALB インスタンスは、異なるゾーンに分散された少なくとも 2 つの EIP を持つ必要があります。

Internet Shared Bandwidth

Internet Shared Bandwidth は、リージョンレベルの帯域幅共有および再利用を提供します。同一リージョン内の EIP を Internet Shared Bandwidth インスタンスに追加することで、帯域幅を共有し、パブリックネットワークコストを削減できます。

ドメイン名

ALB インスタンスの EIP(または VIP)に解決される、パブリック(またはプライベート)に解決可能なドメイン名です。ALB ドメインに自身のドメインを指すように CNAME レコードを設定する必要があります。詳細については、「ALB インスタンスに対する CNAME レコードの設定」をご参照ください。

ALB Extensible Edition の有効化

  1. 特典クォータの申請ALB Extensible Edition 特典クォータ の申請を行います。承認後、本サービスをご利用いただけます。

  2. クイックスタートALB コンソール にログインし、ALB Extensible Edition インスタンスを作成および設定します。

ALB Extensible Edition は現在パブリックプレビュー中です。詳細については、「アナウンス」をご参照ください。

注意事項

ALB Extensible Edition インスタンスは、33.0.0.0/8 および 22.0.0.0/16 の IP 範囲から発信されるクライアント接続をサポートしません。

リファレンス