Gateway with Inference Extension コンポーネントは、Kubernetes Gateway API とその Inference Extension 仕様に基づいて構築された拡張コンポーネントです。Kubernetes のレイヤー 4 およびレイヤー 7 のルーティングサービスをサポートし、大規模言語モデル (LLM) の推論シナリオ向けにスマートロードバランシングを提供します。このトピックでは、Gateway with Inference Extension コンポーネントの概要、使用方法、および変更履歴について説明します。
コンポーネント情報
Gateway with Inference Extension コンポーネントは、Envoy Gateway プロジェクトに基づいて構築されています。Gateway API の機能と互換性があり、Gateway API の推論拡張機能を統合しています。このコンポーネントは、主に LLM 推論サービスのロードバランシングとルーティングを提供します。
使用方法
Gateway with Inference Extension コンポーネントには、Gateway API コンポーネントが提供する CustomResourceDefinition (CRD) が必要です。Gateway with Inference Extension をインストールする前に、Gateway API コンポーネントがクラスターにインストールされていることを確認してください。詳細については、「コンポーネントのインストール」をご参照ください。
Gateway with Inference Extension コンポーネントの使用方法の詳細については、「Gateway with Inference Extension の概要」をご参照ください。
変更履歴
2025 年 12 月
バージョン番号 | 変更日 | 変更内容 | 影響 |
v1.4.0-apsara.4 | 2025 年 12 月 16 日 |
| 以前のバージョンからアップグレードすると、ゲートウェイ Pod が再起動します。オフピーク時間帯にアップグレードを実行してください。 |
2025年9月
バージョン番号 | 変更日 | 変更内容 | 影響 |
v1.4.0-apsara.3 | 2025年9月4日 |
| 以前のバージョンからアップグレードすると、ゲートウェイ Pod が再起動します。アップグレードはオフピーク時間帯に実行してください。 |
2025 年 5 月
バージョン番号 | 変更日 | 変更内容 | 影響 |
v1.4.0-aliyun.1 | 2025 年 5 月 27 日 |
| 以前のバージョンからアップグレードすると、ゲートウェイ Pod が再起動します。アップグレードはオフピーク時間帯に実行してください。 |
2025 年 4 月
バージョン番号 | 変更日 | 変更 | 影響 |
v1.3.0-aliyun.2 | 2025 年 5 月 7 日 |
| 以前のバージョンからアップグレードすると、ゲートウェイ Pod が再起動します。アップグレードはオフピーク時間帯に実行してください。 |
2025 年 3 月
バージョン番号 | 変更日 | 説明 | 影響 |
v1.3.0-aliyun.1 | 2025 年 3 月 12 日 |
| このアップグレードはサービスに影響しません。 |