All Products
Search
Document Center

Server Load Balancer:Ikhtisar ALB Extensible Edition

Last Updated:May 27, 2026

Untuk memenuhi kebutuhan ingress terpadu bagi aplikasi tradisional maupun AI, Alibaba Cloud menyediakan ALB Extensible Edition. Dibangun di atas Service Extensions yang fleksibel, edisi ini menyediakan fitur manajemen lalu lintas inti seperti otentikasi identitas dan routing berbasis konten. Edisi ini juga menambahkan fitur AI-native, termasuk proxy multi-model, routing berbasis beban, serta pembatasan laju berbasis token, sehingga menciptakan gerbang lalu lintas cerdas dan terintegrasi untuk aplikasi AI maupun tradisional.

Manfaat

  • Elastisitas lapisan aplikasi: ALB Extensible Edition beroperasi pada lapisan aplikasi, menyediakan nama domain dan VIP dengan distribusi multi-level untuk menangani permintaan berskala besar. Layanan ini mendukung penskalaan kemampuan layanan aplikasi melalui distribusi lalu lintas, menghilangkan titik kegagalan tunggal, serta meningkatkan ketersediaan sistem. Anda juga dapat menyesuaikan kombinasi zona ketersediaan dan melakukan penskalaan elastis lintas zona guna menghindari hambatan sumber daya di satu zona ketersediaan.

  • Routing berbasis konten tingkat lanjut: ALB Extensible Edition mengidentifikasi lalu lintas bisnis tertentu berdasarkan berbagai kondisi seperti path, header HTTP, lalu meneruskan lalu lintas tersebut ke server backend yang berbeda. Layanan ini juga mendukung aksi tingkat lanjut seperti pengalihan (redirect), penulisan ulang (rewrite), dan header HTTP kustom.

  • Kesadaran konten lapisan aplikasi: ALB Extensible Edition mendukung penguraian mendalam dan dapat merutekan lalu lintas secara dinamis ke layanan backend berbeda berdasarkan konten badan permintaan. Layanan ini menyediakan kemampuan proxy "L7+" di atas proxy Layer 7 asli, sehingga sangat cocok untuk skenario aplikasi AI.

  • Ekstensi Layanan yang fleksibel: ALB mendukung Service Extensions, yang memungkinkan Anda menggunakan plugin dan panggilan layanan eksternal untuk memenuhi kebutuhan bisnis kustom dalam skenario seperti aplikasi AI.

  • Keamanan dan keandalan: ALB Extensible Edition secara native mendukung fitur keamanan seperti Credential Management, perlindungan DDoS bawaan, serta integrasi dengan WAF. Layanan ini juga menyediakan enkripsi HTTPS end-to-end, mendukung kebijakan keamanan TLS dan protokol enkripsi seperti TLS 1.3, serta sesuai untuk layanan yang sensitif terhadap enkripsi, memenuhi persyaratan arsitektur keamanan Zero Trust.

  • Aliran SSE: ALB Extensible Edition mendukung aliran SSE. Pada aplikasi AI berbasis model bahasa besar (LLM), Anda dapat menggunakan SSE untuk mengembalikan hasil inferensi yang dihasilkan secara real-time, sehingga meningkatkan pengalaman pengguna.

  • Penagihan fleksibel: ALB Extensible Edition menyediakan kemampuan jaringan publik melalui EIP dan Internet Shared Bandwidth, memungkinkan penagihan fleksibel untuk penggunaan jaringan publik. Layanan ini juga menggunakan model harga berbasis Load Balancer Capacity Units (LCUs), yang ideal untuk beban kerja dengan puncak lalu lintas yang fluktuatif.

Kasus penggunaan

  • Gerbang lalu lintas aplikasi: Cocok untuk aplikasi web tradisional dan AI, menyediakan fitur seperti distribusi lalu lintas, otentikasi, dan pembatasan laju.

  • Beban kerja untuk aplikasi tradisional dan AI: Gunakan routing berbasis model untuk mengarahkan lalu lintas sesuai kebutuhan model spesifik, tingkatkan pemanfaatan GPU, dan kirimkan inferensi berlatensi rendah.

  • Proxy multi-model terpadu: Mendukung adaptasi model, penjadwalan cerdas, dan failover dinamis. Layanan ini mengintegrasikan otentikasi identitas detail halus untuk membangun infrastruktur AI yang aman, elastis, dan sangat andal.

  • Penerapan ketersediaan tinggi untuk aplikasi hybrid dan multi-cloud: Menyederhanakan koneksi hybrid dan menjamin keamanan. Sebagai inti jaringan lintas cloud, layanan ini menyediakan pengiriman aplikasi berkinerja tinggi dan keamanan untuk pusat data, kantor cabang, serta sumber daya multi-cloud.

  • Gerbang Ingress kontainer: Merutekan permintaan HTTP(S) eksternal ke layanan kontainer dalam suatu klaster. Layanan ini mendukung penyebaran biru-hijau, pengujian A/B, terminasi TLS, dan routing berbasis konten.

  • Pengiriman aplikasi aman berkinerja tinggi: Menyediakan auto-scaling, load balancing berkinerja tinggi, serta terintegrasi dengan produk keamanan seperti WAF, perlindungan DDoS, dan Cloud Firewall untuk melindungi pengiriman aplikasi.

Metri kinerja instans

Satu instans ALB mengalokasikan tiga alamat IP dari setiap vSwitch yang ditentukan: satu VIP untuk layanan yang menghadap klien dan dua alamat IP lokal untuk komunikasi backend serta pemeriksaan kesehatan.

Untuk memastikan semua kemampuan elastis ALB tersedia, kami menyarankan Anda menyisakan minimal delapan alamat IP di setiap vSwitch tempat Anda men-deploy instans ALB.

Metrik Kinerja

Kinerja Maksimum Diskalakan Otomatis

Permintaan per detik (QPS) maksimum

500.000

Koneksi baru per detik (CPS) maksimum

200.000

Koneksi bersamaan maksimum

5.000.000

Bandwidth pribadi maksimum

25 Gbps

Bandwidth publik default untuk instans ALB dua zona adalah 400 Mbps. Bandwidth publik aktual ditentukan oleh total bandwidth semua EIP yang dikaitkan dengan instans tersebut.

  • Dalam satu wilayah, total bandwidth puncak semua EIP pay-by-data-transfer di bawah satu Akun Alibaba Cloud tidak boleh melebihi 5 Gbit/s. Batasan bandwidth: Pay-as-you-go.

  • Untuk meningkatkan bandwidth, beli Paket Bandwidth. Buat dan kelola Paket Bandwidth.

Komponen

Konsep

Deskripsi

Instances

Instans menyediakan load balancing Layer 7 dengan mendistribusikan trafik ke server backend berbeda guna meningkatkan throughput layanan sistem aplikasi Anda. Satu instans dapat menangani hingga 1.000.000 QPS.

Listener

Listener adalah unit layanan terkecil dari instans ALB. Anda harus mengonfigurasi protokol dan port untuk listener guna menentukan jenis trafik yang diproses oleh instans ALB, misalnya trafik HTTP pada port 80. Setiap instans ALB harus memiliki minimal satu listener untuk memproses dan meneruskan trafik. Secara default, Anda dapat menambahkan hingga 50 listener pada setiap instans ALB untuk menangani trafik bisnis berbeda.

Forwarding Rules

Aturan pengalihan menentukan cara instans ALB merutekan permintaan ke server backend dalam satu atau beberapa kelompok server. ALB Extensible Edition mendukung berbagai aturan routing berdasarkan kondisi seperti nama domain, path, dan header HTTP. Saat dikaitkan dengan Service Extensions, layanan ini mendukung penguraian mendalam badan permintaan untuk memungkinkan penjadwalan berkesadaran konten pada lapisan aplikasi.

Service Extensions

ALB Service Extensions memungkinkan Anda menyisipkan logika kustom ke jalur penerusan data. Dengan mekanisme plugin dan panggilan layanan eksternal (Callouts), Anda dapat menjalankan logika bisnis seperti routing dinamis, otentikasi dan otorisasi, penulisan ulang konten, serta kesadaran konteks AI pada titik-titik kunci pemrosesan permintaan. ALB Extensible Edition menyediakan pustaka komponen bawaan yang mencakup skenario umum, sehingga Anda tidak perlu memodifikasi kode aplikasi atau men-deploy lapisan proxy tambahan.

Server Groups

Kelompok server adalah grup logis yang berisi beberapa server backend untuk memproses permintaan yang didistribusikan oleh instans ALB. Di ALB, kelompok server bersifat independen dari instans ALB, dan Anda dapat menyambungkan kelompok server yang sama ke instans ALB berbeda. Kelompok server ALB Extensible Edition mendukung tipe backend berupa server (ECS, ECI, dan antarmuka jaringan elastis), IP, Function Compute, nama domain DNS, serta layanan AI.

Health Check

ALB menggunakan pemeriksaan kesehatan untuk menentukan ketersediaan layanan server backend. ALB mendeteksi server yang tidak sehat dalam kelompok server dan menghindari pendistribusian trafik ke server tersebut. ALB mendukung berbagai konfigurasi pemeriksaan kesehatan, seperti protokol, port, dan berbagai ambang batas pemeriksaan kesehatan. ALB juga menyediakan templat pemeriksaan kesehatan yang dapat diterapkan dengan cepat ke kelompok server berbeda.

Credential Management

Fitur Credential Management pada ALB Extensible Edition mendukung pembuatan dan manajemen terpusat kredensial identitas outbound, yang dienkripsi dan disimpan menggunakan KMS. Saat menambahkan layanan backend, Anda dapat langsung mereferensikan kredensial yang telah dibuat. ALB secara otomatis menyertakan kredensial tersebut saat meneruskan permintaan untuk menyelesaikan otentikasi identitas.

Jenis instans

Alibaba Cloud menyediakan instans ALB yang menghadap Internet dan akses internal. Anda dapat mengonfigurasi instans ALB yang menghadap Internet atau akses internal sesuai skenario bisnis Anda. Sistem akan menentukan apakah akan menggunakan Internet Shared Bandwidth dan EIP berdasarkan pilihan Anda.

Konsep

Deskripsi

VIP (virtual IP address)

Alamat IP pribadi dalam Virtual Private Cloud (VPC) yang digunakan ALB untuk mendistribusikan trafik.

EIP

EIP hanya diperlukan saat Anda membuat instans ALB yang menghadap Internet. Anda tidak perlu mengonfigurasi EIP saat membuat instans ALB akses internal. EIP adalah alamat IP yang digunakan instans ALB untuk menyediakan layanan melalui internet. Instans ALB yang menghadap Internet dapat memiliki beberapa EIP. Untuk ketersediaan tinggi, instans ALB yang menghadap Internet harus memiliki minimal dua EIP di zona ketersediaan berbeda.

Internet Shared Bandwidth

Internet Shared Bandwidth menyediakan berbagi dan penggunaan ulang bandwidth tingkat wilayah. Anda dapat menambahkan EIP di wilayah yang sama ke instans Internet Shared Bandwidth untuk menggunakan ulang bandwidth dan mengurangi biaya bandwidth publik.

Zone Name

Nama domain yang dapat di-resolve melalui internet atau jaringan pribadi ke EIP atau VIP instans ALB. Petakan nama domain Anda ke nama domain instans ALB dengan menambahkan Rekaman CNAME. Untuk informasi lebih lanjut, lihat Konfigurasi Rekaman CNAME untuk instans ALB.

Aktifkan ALB Extensible Edition

  1. Ajukan akses: Kirim permintaan hak istimewa ALB Extensible Edition. Layanan akan tersedia setelah permohonan Anda disetujui.

  2. Mulai: Masuk ke Konsol Application Load Balancer untuk membuat dan mengonfigurasi instans ALB Extensible Edition.

ALB Extensible Edition sedang dalam pratinjau publik. Untuk informasi lebih lanjut dan mengajukan akses, lihat pengumuman.

Catatan penggunaan

Instans ALB Extensible Edition tidak mendukung akses klien dari rentang alamat IP 33.0.0.0/8 dan 22.0.0.0/16.

Dokumen terkait