すべてのプロダクト
Search
ドキュメントセンター

Container Service for Kubernetes:Gateway API の概要

最終更新日:Mar 07, 2026

Gateway API は、Kubernetes コミュニティの公式なトラフィック管理標準です。Ingress ベースの南北トラフィック管理と Service Mesh ベースの東西トラフィック管理の両方をサポートしています。このトピックでは、Gateway API の基本概念と、南北トラフィックを管理するためのソリューションについて説明します。

基本概念

Gateway API は、ロール指向の階層化設計を採用しています。この設計により、インフラストラクチャのプロビジョニング、クラスターの O&M、およびアプリケーションルーティングが分離されます。Gateway API には、以下のコアドメインが含まれます。

  • GatewayClass (インフラストラクチャレイヤー)IngressClass と同様に、このリソースは ALB や Envoy Gateway などのゲートウェイコントローラーのタイプと、その一般的な構成を定義します。

  • Gateway (O&M レイヤー): 特定のゲートウェイインスタンスを定義し、ポート、プロトコル、TLS 構成などのネットワークリスナールールを記述します。

  • HTTPRoute、GRPCRoute、およびその他のルートタイプ (アプリケーションレイヤー): これらのリソースは、パス一致、ヘッダー変更、トラフィックの重み付けなど、特定のトラフィックルーティングルールを定義します。これらのルールはバックエンドサービスにアタッチされます。

  • Policy (ポリシーレイヤー): このリソースは、サーキットブレーキング、レート制限、JWT 認証など、特定の構成や動作のセットを定義します。特定のゲートウェイ、ルート、またはバックエンドサービスにアタッチできます。

image

ACK における Gateway API ソリューション

ACK クラスターでは、ビジネスニーズに基づいて Gateway API ソリューションを選択できます。

ソリューション

Gateway with Inference Extension

Application Load Balancer (ALB)

概要

Gateway with Inference Extension は、オープンソースの Envoy Gateway プロジェクトをベースに構築されたコンポーネントです。クラウドネイティブおよび AI 推論シナリオ向けに最適化されています。Gateway API リソースをリッスンして、ゲートウェイを動的に作成および削除し、クラスターの南北トラフィックを管理します。このコンポーネントはフルマネージドではありません。クラスターのノードにデプロイされ、お客様による O&M が必要です。クラウドプロダクトのサービスレベルアグリーメント (SLA) は提供されません。

ALB Ingress Controller は、バージョン v2.17.0 以降で Gateway API をサポートしています。Gateway や HTTPRoute などのリソースを構成して、外部のアプリケーション層トラフィックを、クラスター内のサービスによって管理されるワークロード (Pod) にルーティングします。この設定により、クラスターの南北トラフィックが管理されます。ALB Ingress Controller は、Gateway API リソースの変更をリッスンします。その後、これらの変更を、基盤となる ALB インスタンスのリスナールール、ルーティングルール、およびサーバーグループ構成にリアルタイムで変換します。

シナリオ

一般的なトラフィックおよび AI 推論シナリオ

一般的なトラフィックシナリオ

主な利点

  • 標準的なオープンソースの Envoy アーキテクチャ: Envoy Gateway コミュニティの最新のアップストリームバージョンと一貫性を保ちます。基盤となるレイヤーは Envoy プロキシに基づいています。その成熟したエコシステムと高性能により、大規模なトラフィックの課題にも容易に対応できます。

  • 豊富なトラフィック管理機能: レート制限とサーキットブレーキングのための複数のルールをサポートします。ゾーンレベルを含む強力なルーティング機能を提供します。また、フォールトインジェクション、トラフィックミラーリング、圧縮、キャッシュなどの一般的な機能もサポートしています。

  • AI 推論拡張 : 大規模モデル推論 サービスに対して、モデルアウェアな負荷分散を提供します。 LoRA/KV Cache を考慮したスケジューリング、待機リクエスト数、モデル優先度など、複数のモデルベースのスケジューリングポリシーをサポートしています。また、複数のモデルバージョンの段階的リリースもサポートしています。

  • 柔軟な拡張性: Envoy Gateway とネイティブに統合され、EnvoyFilter、Lua、Wasm、ExtProc などの複数の拡張メソッドをサポートします。これにより、特別なトラフィック管理のニーズに対応します。

  • フルマネージド: ゲートウェイとそのコンポーネントの両方に対して、統合されたフルマネージド設計を採用しています。これにより、O&M の複雑さとコストが大幅に削減されます。

  • 高性能と即時の弾力性: Alibaba Cloud が自社開発したネットワーク仮想化スタック上に構築されています。優れたクエリ/秒 (QPS) スループットと同時接続処理性能を提供します。また、トラフィック負荷に応じた自動スケーリングをサポートし、トラフィックスパイクに対応します。

  • 強力なアプリケーション層ルーティング: アプリケーション層の負荷シナリオ向けに設計されています。コンテナサービスと深く統合されており、幅広い高度なルーティングルールをサポートしています。

  • ローリングアップデートとゼロダウンタイム: ローリングアップデートをサポートしています。OpenAPI を使用して転送ルールを動的に調整できます。変更はインスタンスを再起動することなくリアルタイムで有効になり、サービストラフィックのゼロダウンタイムを保証します。

  • 幅広いシナリオのサポート: 持続的接続、多数の同時接続、高 QPS、トラフィックのピークと谷があるシナリオに適しています。また、ローリングアップデートとホットアップグレード、アクティブゾーン冗長、アクティブ地域冗長のディザスタリカバリが必要なシナリオにも最適です。

参考資料

ALB を使用した一般的なトラフィックの管理