All Products
Search
Document Center

Server Load Balancer:Ikhtisar ALB Edisi Ekstensibel

Last Updated:Mar 28, 2026

Untuk memenuhi kebutuhan akses terpadu aplikasi modern dan aplikasi AI, Alibaba Cloud memperkenalkan Application Load Balancer (ALB) Extensible Edition. Dibangun di atas kemampuan Service Extensions yang fleksibel, edisi ini menyediakan fitur inti manajemen lalu lintas seperti otentikasi dan perutean berbasis konten, serta kemampuan AI-native termasuk proxy multi-model, penjadwalan berbasis GPU, dan pembatasan laju token—menciptakan gerbang lalu lintas cerdas terintegrasi untuk beban kerja aplikasi maupun AI.

Manfaat

  • Elastisitas lapisan aplikasi: ALB Extensible Edition beroperasi pada Lapisan 7, menyediakan nama domain dan alamat IP virtual (VIP) dengan distribusi multi-tier untuk menangani permintaan dalam skala besar. Layanan ini mendukung distribusi lalu lintas guna meningkatkan kapasitas layanan aplikasi Anda, menghilangkan titik kegagalan tunggal untuk meningkatkan ketersediaan, serta memungkinkan kombinasi zona kustom dengan skalabilitas elastis lintas zona guna menghindari hambatan sumber daya.

  • Perutean lanjutan berbasis konten: ALB Extensible Edition mendukung perutean berdasarkan path, header HTTP, serta kondisi lainnya untuk mengidentifikasi lalu lintas tertentu dan meneruskannya ke server backend yang berbeda. Layanan ini juga mendukung pengalihan (redirect), penulisan ulang (rewrite), dan header HTTP kustom.

  • Kesadaran konten lapisan aplikasi: ALB Extensible Edition memungkinkan penguraian mendalam untuk merutekan lalu lintas secara dinamis ke layanan backend berbeda berdasarkan konten badan permintaan. Berlandaskan kemampuan proxy Lapisan 7 yang telah ada, layanan ini menyediakan fungsionalitas proxy "L7+", yang ideal untuk skenario aplikasi AI.

  • Ekstensi layanan yang fleksibel: ALB mendukung Service Extensions yang menggunakan plugin dan panggilan layanan eksternal untuk memenuhi kebutuhan bisnis kustom serta merespons perubahan bisnis berbasis AI secara cepat.

  • Keamanan dan keandalan: ALB Extensible Edition secara native mendukung manajemen kredensial, perlindungan DDoS bawaan, serta integrasi Web Application Firewall (WAF). Layanan ini menyediakan enkripsi HTTPS end-to-end dengan kebijakan keamanan TLS dan dukungan TLS 1.3 untuk beban kerja yang sensitif terhadap enkripsi, memenuhi persyaratan arsitektur keamanan Zero-Trust.

  • Streaming SSE: ALB Extensible Edition mendukung streaming Server-Sent Events (SSE). Pada aplikasi Large Language Model (LLM), SSE memungkinkan streaming hasil inferensi secara real-time untuk meningkatkan pengalaman pengguna.

  • Penagihan fleksibel: ALB Extensible Edition menyediakan kemampuan jaringan publik melalui Alamat IP Elastis (EIP) dan Internet Shared Bandwidth untuk penagihan yang fleksibel. Layanan ini juga menggunakan model harga Load Balancer Capacity Unit (LCU) lanjutan yang lebih sesuai untuk puncak bisnis yang elastis.

Kasus penggunaan

  • Gerbang lalu lintas aplikasi: Cocok untuk aplikasi web tradisional dan aplikasi AI dengan kemampuan distribusi lalu lintas, otentikasi, dan pembatasan laju.

  • Beban kerja aplikasi modern dan AI: Mengoptimalkan beban kerja modern dan AI/ML dengan perutean berbasis model yang mengarahkan lalu lintas sesuai kebutuhan model spesifik, mengoptimalkan pemanfaatan GPU, serta menyediakan inferensi berlatensi rendah yang hemat biaya.

  • Proxy terpadu multi-model: Solusi satu atap yang mengatasi tantangan adaptasi model, penjadwalan cerdas, dan failover dinamis, serta mengintegrasikan mekanisme otentikasi identitas detail halus untuk membangun infrastruktur AI yang aman, elastis, dan sangat andal.

  • Ketersediaan tinggi hybrid dan multi-cloud: Menyederhanakan konektivitas hybrid dan menjamin keamanan sebagai inti jaringan lintas cloud, memberikan pengiriman aplikasi berkinerja tinggi dan keamanan untuk pusat data, kantor cabang, serta sumber daya multi-cloud.

  • Gerbang Ingress kontainer: Merutekan permintaan HTTP(S) eksternal ke layanan kontainer dalam kluster, mendukung penyebaran biru-hijau, pengujian A/B, terminasi TLS, dan perutean berbasis konten.

  • Pengiriman aplikasi aman berkinerja tinggi: Menyediakan auto-scaling dan load balancing berkinerja tinggi yang terintegrasi dengan WAF, perlindungan DDoS, serta Cloud Firewall untuk menjamin pengiriman aplikasi yang aman.

Metriki performa instans

Sebuah instans ALB mengalokasikan 3 alamat IP dari setiap vSwitch yang ditentukan: 1 VIP (untuk layanan eksternal) dan 2 IP Lokal (untuk komunikasi server backend dan pemeriksaan kesehatan).

Untuk memastikan semua kemampuan penskalaan ALB tersedia, sisihkan minimal 8 alamat IP di setiap vSwitch tempat instans ALB ditempatkan.

Metrik VIP tunggal

Performa penskalaan otomatis maksimum

Permintaan per detik (QPS) maksimum

500.000

Koneksi per detik (CPS) maksimum

200.000

Koneksi bersamaan maksimum

5.000.000

Bandwidth privat maksimum

25 Gbps

Bandwidth publik default untuk instans ALB dua zona adalah 400 Mbps. Bandwidth publik aktual ditentukan oleh total bandwidth semua EIP yang dikaitkan dengan instans ALB tersebut.

  • Total bandwidth puncak untuk semua EIP bayar-berdasarkan-transfer-data di bawah satu Akun Alibaba Cloud dalam satu wilayah tidak boleh melebihi 5 Gbps. Untuk informasi lebih lanjut, lihat bagian batas bandwidth dalam Pay-as-you-go.

  • Untuk bandwidth tambahan, beli instans Internet Shared Bandwidth.

Komponen ALB Edisi Ekstensibel

Konsep

Deskripsi

Instance

Beroperasi pada Layer 7 dan menyediakan kemampuan load balancing kuat dengan mendistribusikan traffic ke server backend berbeda untuk meningkatkan throughput aplikasi. Satu instans dapat menangani hingga 1 juta QPS.

Listener

Listener adalah unit layanan terkecil dari ALB. Anda harus mengonfigurasi protokol dan port pada listener untuk menentukan traffic apa yang harus diproses ALB (misalnya, HTTP pada port 80). Setiap instans ALB memerlukan minimal satu listener agar dapat mulai memproses dan mendistribusikan traffic. Secara default, setiap instans ALB mendukung hingga 50 listener untuk menangani traffic bisnis berbeda.

Forwarding rule

Aturan penerusan menentukan cara instans ALB merutekan permintaan ke server backend dalam satu atau beberapa kelompok server. ALB Extensible Edition menyediakan kemampuan perutean lanjutan berbasis domain, path, header HTTP, dan lainnya. Dengan mengaitkan Service Extensions, layanan ini mendukung penguraian mendalam badan permintaan untuk memungkinkan penjadwalan berkesadaran konten lapisan aplikasi.

Service Extensions

Service Extensions adalah kemampuan baru yang memungkinkan Anda menyisipkan logika kustom langsung ke jalur penerusan data ALB Extensible Edition. Melalui mekanisme plugin dan panggilan layanan eksternal, Anda dapat secara fleksibel menjalankan logika bisnis seperti perutean dinamis, otentikasi, penulisan ulang konten, dan kesadaran konteks AI pada titik-titik pemrosesan permintaan utama. ALB Extensible Edition juga menyediakan pustaka kaya komponen bawaan yang mencakup banyak skenario umum untuk penggunaan langsung, sehingga secara signifikan mengurangi biaya pengembangan kustom. Kemampuan ini meningkatkan fleksibilitas dan programmabilitas ALB Extensible Edition, membantu Anda merespons perubahan bisnis berbasis AI secara cepat serta memenuhi kebutuhan kompleks dan kustom tanpa memodifikasi kode aplikasi atau men-deploy lapisan proxy tambahan.

Server group

Kelompok server adalah grup logis yang berisi beberapa server backend untuk memproses permintaan yang didistribusikan oleh ALB. Di ALB, kelompok server berdiri independen dari instans ALB. Anda dapat menyambungkan kelompok server yang sama ke instans ALB berbeda. Kelompok server ALB Extensible Edition mendukung tipe server (ECS, ECI, dan ENI), tipe IP, tipe Function Compute, tipe nama domain DNS, dan tipe layanan AI.

Kelompok server adalah grup logis yang berisi beberapa server backend yang memproses permintaan bisnis yang didistribusikan oleh ALB. Kelompok server berdiri independen dari instans ALB, sehingga kelompok server yang sama dapat dikaitkan dengan instans ALB berbeda. Kelompok server ALB Extensible Edition mendukung tipe berikut: tipe server (Elastic Compute Service (ECS), Elastic Container Instance, dan elastic network interface (ENI)), tipe IP, tipe Function Compute, tipe nama DNS, tipe layanan AI, dan tipe layanan MCP.

Health check

ALB menggunakan pemeriksaan kesehatan untuk menentukan ketersediaan server backend. ALB memeriksa server yang tidak sehat dalam kelompok server dan menghindari pendistribusian traffic ke server tersebut. ALB mendukung konfigurasi pemeriksaan kesehatan fleksibel termasuk protokol, port, dan berbagai ambang batas. ALB juga menyediakan templat pemeriksaan kesehatan yang dapat diterapkan dengan cepat ke kelompok server berbeda.

Credential management

Fitur manajemen kredensial ALB Extensible Edition mendukung pembuatan dan manajemen terpusat kredensial outbound, yang dienkripsi dan disimpan menggunakan Key Management Service (KMS). Saat menambahkan layanan backend, Anda dapat langsung mereferensikan kredensial yang telah dibuat, dan ALB secara otomatis menyertakannya saat meneruskan permintaan untuk menyelesaikan otentikasi.

Jenis instans

Alibaba Cloud menyediakan tipe ALB yang menghadap Internet dan internal. Anda dapat memilih untuk mengonfigurasi instans ALB yang menghadap Internet atau internal sesuai kebutuhan bisnis Anda. Sistem akan menentukan apakah akan menggunakan Internet Shared Bandwidth dan EIP berdasarkan pilihan Anda.

Konsep

Deskripsi

VIP

Entitas yang digunakan ALB untuk mendistribusikan traffic. Setiap VIP adalah alamat IP pribadi dalam Virtual Private Cloud (VPC).

EIP

Hanya diperlukan saat membuat ALB yang menghadap Internet; tidak diperlukan untuk ALB internal. Ini adalah alamat IP publik untuk ALB. Sebuah instans ALB yang menghadap Internet dapat memiliki beberapa EIP. Untuk ketersediaan tinggi, instans ALB yang menghadap Internet sebaiknya memiliki minimal dua EIP yang tersebar di zona berbeda.

Internet Shared Bandwidth

Internet Shared Bandwidth menyediakan berbagi dan penggunaan ulang bandwidth tingkat wilayah. Anda dapat menambahkan EIP dalam wilayah yang sama ke instans Internet Shared Bandwidth untuk berbagi bandwidth dan mengurangi biaya jaringan publik.

Domain name

Nama domain yang dapat diselesaikan secara publik (atau privat) yang mengarah ke EIP (atau VIP) instans ALB. Anda perlu mengonfigurasi rekaman CNAME untuk mengarahkan domain Anda ke domain ALB. Untuk informasi lebih lanjut, lihat Konfigurasi rekaman CNAME untuk instans ALB.

Aktifkan ALB Edisi Ekstensibel

  1. Ajukan hak istimewa: Kirim permohonan hak istimewa ALB Extensible Edition. Anda dapat menggunakan layanan ini setelah disetujui.

  2. Mulai: Masuk ke Konsol ALB untuk membuat dan mengonfigurasi instans ALB Extensible Edition.

ALB Extensible Edition saat ini sedang dalam pratinjau publik. Lihat pengumuman untuk detail lebih lanjut.

Catatan penggunaan

Instans ALB Extensible Edition tidak mendukung koneksi klien yang berasal dari rentang IP 33.0.0.0/8 dan 22.0.0.0/16.

Referensi