すべてのプロダクト
Search
ドキュメントセンター

Container Service for Kubernetes:Gateway API の概要

最終更新日:Feb 10, 2026

Gateway API は Kubernetes コミュニティが定める公式のトラフィック管理標準です。Ingress ベースの南北のトラフィック管理と、Service Mesh ベースの東西のトラフィック管理の両方をサポートします。本トピックでは、Gateway API の基本概念と、南北のトラフィック管理におけるソリューションについて説明します。

基本概念

Gateway API はロール指向の階層型設計を採用し、インフラストラクチャのプロビジョニング、クラスター運用、アプリケーションルーティングを分離しています。主なコアリソースは以下のとおりです。

  • GatewayClass(インフラストラクチャレイヤー)IngressClass に類似します。ALB や Envoy Gateway などのゲートウェイコントローラーの種類および一般的な構成を定義します。

  • Gateway(運用レイヤー): 特定のゲートウェイインスタンスとそのネットワークリスナーのルール(ポート、プロトコル、TLS 構成など)を定義します。

  • HTTPRoute、GRPCRoute など(アプリケーションレイヤー): パスマッチング、ヘッダー変更、トラフィックの重み付けなどの具体的なトラフィックルーティングルールを定義し、バックエンドサービスを指定します。

  • Policy(ポリシーレイヤー): サーキットブレーカー、レート制限、JWT 認証などの具体的な構成や動作を定義します。ポリシーは特定のゲートウェイ、ルート、またはバックエンドサービスにアタッチできます。

image

ACK における Gateway API ソリューション

ACK クラスターでは、ビジネス要件に応じて適切な Gateway API ソリューションを選択できます。

ソリューション

Gateway with Inference Extension

ALB (Application Load Balancer)

概要

Gateway with Inference Extension は、オープンソースの Envoy Gateway プロジェクト上に構築されたコンポーネントです。クラウドネイティブおよび AI 推論シナリオ向けに最適化されています。Gateway API リソースを監視してゲートウェイを動的に作成・削除し、クラスターの南北のトラフィックを管理します。このコンポーネントはアンマネージドであり、ご利用のクラスターノード上にデプロイされ、セルフメンテナンスが必要です。クラウドプロダクトのサービスレベル契約(SLA)保証は含まれません。

ALB Ingress Controller はバージョン v2.17.0 以降で Gateway API をサポートしています。Gateway や HTTPRoute などのリソースを構成することで、外部のレイヤー 7 トラフィックをクラスター内のサービスによって管理されるワークロード(Pod)にルーティングします。これにより、クラスターの南北のトラフィックを管理します。ALB Ingress Controller は Gateway API リソースの変更を監視し、リアルタイムで基盤となる ALB インスタンスのリスナールール、ルーティングルール、サーバーグループ構成に変換します。

利用シーン

汎用トラフィックおよび AI 推論シナリオ

汎用トラフィックシナリオ

主な特徴

  • オープンソース Envoy 標準アーキテクチャ: Envoy Gateway コミュニティの最新アップストリームバージョンと整合性を保ちます。Envoy プロキシ上に構築されており、成熟したエコシステムと高いパフォーマンスにより、大規模トラフィックへの対応を容易にします。

  • 豊富なトラフィック管理機能: 複数のレート制限およびサーキットブレーカールールをサポートします。ゾーンレベルを含む強力なルーティング機能を備えています。また、障害注入、トラフィックミラーリング、圧縮、キャッシュなどの一般的な機能もサポートします。

  • AI 推論拡張機能: 大規模モデル推論サービス向けにモデル認識型のロードバランシングを提供します。LoRA/KV Cache 認識型スケジューリング、待機リクエスト数、モデル優先度などのモデルベースのスケジューリングポリシーをサポートします。複数のモデルバージョンに対する段階的リリース機能も備えています。

  • 柔軟な拡張性: Envoy Gateway とネイティブ統合し、EnvoyFilter、Lua、Wasm、ExtProc などのさまざまな拡張方法をサポートすることで、特殊なトラフィック管理ニーズに対応します。

  • フルマネージド: ゲートウェイおよびそのコンポーネント全体が統合されたフルマネージド設計となっており、運用保守の複雑さとコストを大幅に削減します。

  • 高性能かつ即時スケールアウト: Alibaba Cloud 自社開発のネットワーク仮想化スタック上に構築されています。優れたクエリ/秒(QPS)スループットおよび同時接続処理性能を実現するとともに、トラフィック負荷に基づく自動スケールアウトをサポートし、トラフィックスパイクにも対応します。

  • 強力なアプリケーション層ルーティング: アプリケーション層のロードシナリオ向けに設計されています。コンテナーサービスと深く統合されており、幅広い高度なルーティングルールをサポートします。

  • ホットアップデートとゼロダウンタイム: 構成のホットアップデートをサポートします。OpenAPI を通じて転送ルールを動的に調整でき、インスタンスを再起動せずにリアルタイムで変更が反映され、サービストラフィックのダウンタイムをゼロに保ちます。

  • 幅広いシナリオ対応: 持続的接続、高同時接続、高 QPS、変動するトラフィック、ホットアップデートおよびホットスペックアップへの依存、アクティブなゾーン冗長性またはアクティブ地理的冗長性によるディザスタリカバリなどのシナリオに適しています。

参考

ALB を使用した汎用トラフィックの管理