All Products
Search
Document Center

Container Service for Kubernetes:Pengenalan Gateway API

Last Updated:Mar 08, 2026

Gateway API adalah standar resmi manajemen traffic dari komunitas Kubernetes yang mendukung manajemen traffic utara-selatan berbasis Ingress dan manajemen traffic timur-barat berbasis Service Mesh. Topik ini menjelaskan konsep inti Gateway API serta solusinya untuk mengelola traffic utara-selatan.

Konsep inti

Gateway API menggunakan desain berlapis berorientasi peran yang memisahkan penyediaan infrastruktur, operasi & pemeliharaan (O&M) kluster, serta routing aplikasi. Gateway API mencakup resource inti berikut:

  • GatewayClass (lapisan infrastruktur): Mirip dengan IngressClass, resource ini mendefinisikan tipe controller gateway—seperti ALB atau Envoy Gateway—beserta konfigurasi umumnya.

  • Gateway (lapisan O&M): Mendefinisikan instans gateway tertentu dan menjabarkan aturan listener jaringannya, seperti port, protokol, dan konfigurasi TLS.

  • HTTPRoute, GRPCRoute, dan jenis rute lainnya (lapisan aplikasi): Resource ini mendefinisikan aturan routing traffic spesifik, seperti pencocokan path, modifikasi header, dan pembobotan traffic, yang kemudian dihubungkan ke layanan backend.

  • Policy (lapisan kebijakan): Resource ini mendefinisikan serangkaian konfigurasi atau perilaku tertentu—seperti circuit breaking, rate limiting, dan autentikasi JWT—yang dapat diterapkan pada gateway, rute, atau layanan backend tertentu.

image

Solusi Gateway API di ACK

Dalam kluster ACK, Anda dapat memilih solusi Gateway API sesuai kebutuhan bisnis:

Solusi

Gateway with Inference Extension

ALB (Application Load Balancer)

Ikhtisar

Gateway with Inference Extension adalah komponen yang dibangun di atas proyek open source Envoy Gateway. Komponen ini dioptimalkan untuk skenario cloud-native dan inferensi AI. Komponen ini mendengarkan resource Gateway API untuk membuat dan menghapus gateway secara dinamis serta mengelola traffic utara-selatan kluster. Komponen ini tidak sepenuhnya dikelola (fully managed). Komponen ini dideploy pada node kluster Anda dan memerlukan Anda untuk melakukan O&M. Komponen ini tidak dilengkapi SLA (Service-Level Agreement) produk cloud.

ALB Ingress Controller mendukung Gateway API mulai versi v2.17.0 dan seterusnya. Konfigurasikan resource seperti Gateway dan HTTPRoute untuk mengarahkan traffic lapisan aplikasi eksternal ke beban kerja (pod) yang dikelola oleh layanan di dalam kluster. Pengaturan ini mengelola traffic utara-selatan kluster. ALB Ingress Controller mendengarkan perubahan pada resource Gateway API, lalu mengonversi perubahan tersebut menjadi aturan listener, aturan routing, dan konfigurasi server group untuk instans ALB yang mendasarinya secara real time.

Skenario

Skema traffic umum dan inferensi AI

Skenario Trafik Umum

Keunggulan utama

  • Arsitektur Envoy open source standar: Konsisten dengan versi upstream terbaru dari komunitas Envoy Gateway. Lapisan dasarnya berbasis proxy Envoy. Ekosistemnya yang matang dan performa tinggi mampu menangani tantangan traffic berskala besar dengan mudah.

  • Fitur manajemen traffic lengkap: Mendukung berbagai aturan untuk rate limiting dan circuit breaking. Menyediakan kemampuan routing kuat, termasuk di tingkat zona. Juga mendukung fitur umum seperti fault injection, traffic mirroring, kompresi, dan caching.

  • Ekstensi inferensi AI : Menyediakan load balancing yang sadar model untuk layanan inferensi model besar . Mendukung berbagai kebijakan penjadwalan berbasis model, seperti penjadwalan LoRA/KV Cache-aware, Waiting Request Num, dan Model Priority. Juga mendukung rilis bertahap untuk beberapa versi model.

  • Ekstensibilitas fleksibel: Terintegrasi secara native dengan Envoy Gateway untuk mendukung berbagai metode ekstensi, seperti EnvoyFilter, Lua, Wasm, dan ExtProc. Hal ini memenuhi kebutuhan manajemen traffic khusus.

  • Fully managed: Menggunakan desain terintegrasi yang sepenuhnya dikelola untuk gateway dan komponennya. Hal ini secara signifikan mengurangi kompleksitas dan biaya O&M.

  • Performa tinggi dan elastisitas instan: Dibangun di atas stack virtualisasi jaringan buatan Alibaba Cloud. Memberikan throughput QPS (queries per second) dan performa pemrosesan koneksi bersamaan yang sangat baik. Juga mendukung skalabilitas otomatis berdasarkan beban traffic untuk menangani lonjakan traffic.

  • Routing lapisan aplikasi yang kuat: Dirancang untuk skenario load balancing lapisan aplikasi. Terintegrasi secara mendalam dengan layanan kontainer dan mendukung berbagai aturan routing lanjutan.

  • Pembaruan rolling dan zero downtime: Mendukung pembaruan rolling. Gunakan OpenAPI untuk menyesuaikan aturan pengalihan secara dinamis. Perubahan berlaku secara real time tanpa perlu me-restart instans, sehingga menjamin zero downtime untuk traffic layanan.

  • Dukungan skenario luas: Cocok untuk skenario dengan koneksi persisten, jumlah koneksi bersamaan tinggi, QPS tinggi, serta puncak dan lembah traffic. Juga ideal untuk skenario yang memerlukan pembaruan rolling dan hot upgrade, redundansi geo-aktif, serta pemulihan bencana dengan zona redundansi aktif.

Referensi

Kelola traffic umum menggunakan ALB