Kuota menetapkan penggunaan maksimum sumber daya atau QPS maksimum suatu layanan dalam periode waktu tertentu. Kuota umumnya digunakan untuk mengelola alokasi dan konsumsi sumber daya. Metode untuk menghitung kuota Application Load Balancer (ALB) bervariasi berdasarkan tipe sumber daya dan penggunaan sumber daya. Topik ini menjelaskan metode untuk menghitung kuota ALB yang terkait dengan instans ALB standar, grup server backend, listener, dan aturan pengalihan.
Skenario (lihat gambar sebelumnya)
Instans ALB menggunakan Ingress untuk mengelola dan meneruskan permintaan eksternal. Ingress mendefinisikan aturan yang digunakan untuk meneruskan permintaan ke grup server backend (Service:port pairs). Permintaan kemudian dikirim dan diproses oleh aplikasi backend yang berjalan dalam sekelompok pod. Pemetaan antara instans ALB, Ingress, grup server backend (Service:port pairs), dan pod secara bersama-sama membentuk sistem perutean untuk penerusan permintaan dan penyeimbangan beban.
Tabel berikut menjelaskan metode untuk menghitung kuota ALB terkait dengan instans ALB standar, grup server backend, listener, dan aturan pengalihan.
Kuota ALB terkait dengan instans ALB standar
Deskripsi Kuota | Nama/ID | Metode Perhitungan | Skema (lihat gambar di atas) |
Jumlah maksimum sertifikat tambahan yang dapat ditambahkan ke instans ALB (tidak termasuk sertifikat default). | alb_quota_loadbalancer_certificates_num_standard_edition | Jumlah maksimum sertifikat tambahan yang dapat ditambahkan ke instans ALB sama dengan jumlah total sertifikat tambahan yang dapat ditambahkan ke semua listener dari instans ALB tersebut. Jumlah sertifikat tambahan yang dapat ditambahkan ke ALB Ingress bervariasi berdasarkan cara konfigurasi sertifikat:
|
|
Jumlah maksimum aturan pengalihan yang dapat dikonfigurasikan untuk instans ALB (tidak termasuk aturan pengalihan default). | alb_quota_loadbalancer_rules_num_standard_edition | Jumlah maksimum aturan pengalihan yang dapat dikonfigurasikan untuk instans ALB sama dengan jumlah total aturan pengalihan dari ALB Ingress yang terkait dengan semua listener dari instans ALB. Jumlah aturan pengalihan dari ALB Ingress sama dengan jumlah entri yang terdaftar di bidang |
|
Jumlah maksimum server backend yang dapat ditambahkan ke instans ALB. | alb_quota_loadbalancer_servers_num_standard_edition | Jumlah maksimum server backend yang dapat ditambahkan ke instans ALB sama dengan jumlah total server backend dari ALB Ingress yang terkait dengan semua listener dari instans ALB. Jumlah server backend dari ALB Ingress sama dengan jumlah total pod backend yang ditentukan dalam semua aturan pengalihan dari ALB Ingress. Jika ALB Ingress terkait dengan beberapa listener, pod backend dari ALB Ingress dihitung beberapa kali berdasarkan jumlah listener. |
|
Jumlah maksimum listener yang dapat ditambahkan ke instans ALB. | alb_quota_loadbalancer_listeners_num_standard_edition | Jumlah listener yang ditambahkan ke instans ALB sama dengan jumlah pasangan Jumlah listener yang terkait dengan ALB Ingress bergantung pada nilai anotasi |
|
Kuota terkait dengan grup server
Deskripsi Kuota | Nama/ID | Metode Perhitungan | Skema (lihat gambar di atas) |
Jumlah maksimum grup server ALB di mana server backend (alamat IP) dapat ditentukan. | alb_quota_server_added_num | Jika alamat IP pod ditentukan sebagai server backend dari Service:port pair dan Service:port pair ditentukan dalam beberapa aturan pengalihan, alamat IP pod dihitung beberapa kali berdasarkan jumlah aturan pengalihan. Dalam hal ini, jika setiap aturan pengalihan di atas terkait dengan beberapa listener, alamat IP pod juga dihitung beberapa kali berdasarkan jumlah listener. |
|
Jumlah maksimum kali sebuah grup server ALB dapat dikaitkan dengan listener dan aturan pengalihan. | alb_quota_servergroup_attached_num | Jumlah maksimum kali sebuah grup server ALB (Service:port pair) dapat dikaitkan dengan listener dan aturan pengalihan bergantung pada aturan pengalihan di mana grup server ALB (Service:port pair) ditentukan. Jika aturan pengalihan di mana grup server ALB (Service:port pair) ditentukan terkait dengan beberapa listener, grup server ALB (Service:port pair) dihitung beberapa kali berdasarkan jumlah listener. |
|
Jumlah maksimum server backend (alamat IP dan port) yang dapat ditambahkan ke grup server (Service:port pair). | alb_quota_servergroup_servers_num | Jumlah maksimum server backend (alamat IP dan port) yang dapat ditambahkan ke grup server sama dengan jumlah pasangan pod:port dari grup server (Service:port pair). |
|
Kuota terkait dengan listener
Deskripsi kuota | Nama/ID | Metode perhitungan | Skema (lihat gambar di atas) |
Jumlah maksimum daftar kontrol akses jaringan (ACL) yang dapat dikaitkan dengan listener | - | Jumlah maksimum ACL jaringan yang dapat dikaitkan dengan listener bergantung pada jumlah total entri di bidang aclConfig yang tidak kosong dari semua pasangan |
|
Jumlah maksimum entri ACL jaringan yang dapat dikaitkan dengan listener | - | Jumlah maksimum entri ACL jaringan yang dapat dikaitkan dengan listener bergantung pada jumlah total entri di bidang aclConfig yang tidak kosong dari semua pasangan |
|
Kuota terkait dengan aturan pengalihan
Deskripsi Kuota | Nama/ID | Metode Perhitungan | Skema (lihat gambar di atas) |
Jumlah maksimum tindakan yang dapat ditentukan dalam aturan pengalihan. | -- |
|
|
Jumlah maksimum kondisi pencocokan yang dapat ditentukan dalam aturan pengalihan. | alb_quota_rule_matchevaluations_num | Saat Anda membuat atau memperbarui aturan pengalihan, jumlah maksimum kondisi pencocokan yang dapat ditentukan dalam aturan pengalihan sama dengan jumlah host non-kosong dalam aturan pengalihan, jumlah kondisi pencocokan path, dan jumlah kondisi pencocokan untuk kondisi pengalihan kustom yang ditentukan menggunakan anotasi. Jika Anda mengatur |
|
Jumlah maksimum karakter wildcard yang dapat digunakan dalam aturan pengalihan. | - | Saat Anda membuat atau memperbarui aturan pengalihan, jumlah maksimum karakter wildcard yang dapat digunakan dalam aturan pengalihan sama dengan jumlah total karakter wildcard yang terkandung dalam tindakan dan kondisi pencocokan yang ditentukan dalam aturan pengalihan. | ALB Ingress 2 memiliki satu aturan pengalihan dan kondisi pencocokan host dalam aturan pengalihan hanya memiliki satu karakter wildcard, yaitu asterisk (*). Dalam hal ini, jumlah maksimum karakter wildcard yang dapat digunakan dalam aturan pengalihan adalah satu. |
Buat aturan peringatan untuk item kuota
Anda dapat membuat aturan peringatan untuk beberapa item kuota dengan menentukan ambang batas untuk penggunaan kuota atau kuota tersedia. Jika penggunaan kuota mencapai ambang batas yang ditentukan, sistem akan mengirimkan notifikasi peringatan ke URL callback yang Anda tentukan dalam aturan peringatan melalui permintaan HTTP POST. Kami sarankan Anda mempertimbangkan peringatan tersebut dan mengajukan peningkatan kuota terlebih dahulu untuk menghindari kegagalan rekonsiliasi karena melebihi kuota. Kegagalan semacam itu dapat menyebabkan aturan pengalihan atau node backend gagal dipasang ke ALB. Selain itu, Anda dapat memantau status rekonsiliasi menggunakan perintah kubectl describe dan kubectl get event untuk melihat detail dan acara terkait sumber daya seperti AlbConfig, Ingresses, dan Services di klaster.
Prosedur (Pusat Kuota)
Masuk ke konsol Pusat Kuota.
Gunakan salah satu metode berikut untuk membuat aturan peringatan:
Metode 1: Di halaman Products with General Quotas, klik Application Load Balancer di bagian Networking, lalu klik tab General Quota.
Metode 2: Di panel navigasi sisi kiri, klik Quota Alerts. Di halaman Quota Alerts, klik Create Quota Alert Rule. Di halaman General Quotas, pilih Application Load Balancer dari daftar drop-down Nama Produk.
Di halaman General Quotas, temukan kuota yang ingin Anda kelola dan klik Create Alert Rule di kolom Actions.
Di halaman Create Alarm Rule, konfigurasikan parameter dan klik Confirm.
Tabel 1 Parameter untuk Membuat Aturan Peringatan untuk Item Kuota
Parameter
Deskripsi
Contoh
Alarm Rule Name
Nama aturan peringatan.
Jumlah maksimum vCPU untuk instance preemptible untuk pembelian terbatas
Alarm Metric
Metrik yang digunakan oleh aturan peringatan. Nilai valid:
Quotas
Used Quotas
Percentage of Used Quotas(%)
Percentage of Available Quotas(%)
Persentase Kuota Digunakan(%)
Threshold and Alert Level
Tingkat peringatan dan ambang batas yang sesuai dengan tingkat ini.
Metode notifikasi default berikut diatur untuk tingkat peringatan yang berbeda:
Critical: Email dan Callback
Warning: Email dan Callback
Info: Email dan Callback
Anda juga perlu memilih jumlah kali ambang batas tercapai sebelum peringatan dipicu. Nilai valid: 1 Siklus Berturut-turut, 3 Siklus Berturut-turut, 5 Siklus Berturut-turut, 10 Siklus Berturut-turut, 15 Siklus Berturut-turut, 30 Siklus Berturut-turut, 60 Siklus Berturut-turut, 70 Siklus Berturut-turut, 90 Siklus Berturut-turut, 120 Siklus Berturut-turut, dan 180 Siklus Berturut-turut.
Anda dapat mengonfigurasi pengaturan untuk tingkat peringatan yang berbeda. Dengan cara ini, CloudMonitor menghasilkan peringatan pada tingkat tertentu berdasarkan ambang batas yang sesuai dengan tingkat tersebut dan mengirimkan notifikasi peringatan menggunakan metode yang ditentukan.
Tingkat peringatan: Info. Metode notifikasi default untuk tingkat peringatan ini adalah Email dan Callback.
Ambang batas: ≥ 80%.
Mute For
Interval pengiriman notifikasi peringatan jika peringatan yang dihasilkan tidak dibersihkan. Nilai tersebut juga menunjukkan periode bisu. Nilai valid: 5 menit, 15 menit, 30 menit, 60 menit, 3 jam, 6 jam, 12 jam, dan 24 jam.
Notifikasi peringatan dikirimkan ketika metrik mencapai ambang batas peringatan. Selama periode bisu, jika metrik berulang kali melebihi ambang batas peringatan, tidak ada notifikasi peringatan baru yang dikirimkan. Setelah periode bisu berakhir, jika metrik tidak kembali ke keadaan normal, notifikasi peringatan baru akan dikirimkan.
Sebagai contoh, jika Anda mengatur parameter Mute For ke 24 hours, CloudMonitor mengirimkan notifikasi peringatan untuk peringatan yang dihasilkan, dan peringatan tetap belum terselesaikan, CloudMonitor mengirimkan notifikasi peringatan baru setelah 24 jam.
5 menit
Effective Time
Periode selama aturan peringatan berlaku. Aturan peringatan hanya berlaku dan menghasilkan peringatan pada waktu tertentu pada hari-hari tertentu dalam seminggu.
Siklus: Senin hingga Minggu
Waktu: 00:00 hingga 23:59
Alarm Contact Group
Grup kontak tempat notifikasi peringatan dikirimkan.
Notifikasi peringatan untuk grup aplikasi dikirimkan ke kontak peringatan dalam grup kontak peringatan. Grup kontak peringatan adalah sekelompok kontak peringatan, yang berisi satu atau lebih kontak peringatan.
Untuk informasi lebih lanjut tentang cara membuat kontak peringatan atau grup kontak peringatan, lihat Buat kontak peringatan atau grup kontak peringatan.
Administrator Kuota Tipe Instance ECS
Alarm Callback
URL yang dapat diakses melalui Internet untuk menerima informasi peringatan yang didorong oleh CloudMonitor menggunakan permintaan HTTP POST. Hanya protokol HTTP yang didukung.
Untuk menguji konektivitas URL callback, lakukan operasi berikut:
Klik Test di sebelah URL callback.
Di halaman Test Result, Anda dapat memeriksa konektivitas URL callback berdasarkan kode status dan detail hasil tes yang dikembalikan.
CatatanAnda juga dapat mengatur parameter Language dan kemudian klik Test lagi untuk mendapatkan detail hasil tes dalam bahasa tertentu.
Klik Close.
http://alert.aliyun.com:8080/callback
Labels
Tag dari aturan peringatan. Tag terdiri dari kunci tag dan nilai tag. Anda dapat menentukan hingga enam tag untuk aturan peringatan.
k1,v1Push Channel
Layanan Alibaba Cloud yang digunakan untuk menyampaikan informasi peringatan. Nilai valid:
Simple Log Service
Jika Anda mengaktifkan Simple Log Service, ketika peringatan dihasilkan, informasi peringatan dikirimkan ke Logstore di Layanan Log Sederhana. Dalam hal ini, Anda harus mengonfigurasi parameter Region, ProjectName, dan Logstore.
Untuk informasi tentang cara membuat proyek dan Logstore, lihat Memulai.
Message Service - topic
Jika Anda mengaktifkan Message Service - topic, ketika peringatan dihasilkan, informasi peringatan dikirimkan ke topik di Simple Message Queue (formerly MNS). Dalam hal ini, Anda harus menentukan wilayah dan topik.Simple Message Queue (formerly MNS)
Untuk informasi lebih lanjut tentang cara membuat topik, lihat Buat topik.
Function Compute
Jika Anda mengaktifkan Function Compute, ketika peringatan dihasilkan, informasi peringatan dikirimkan ke Function Compute untuk diformat. Dalam hal ini, Anda harus menentukan wilayah, layanan, dan fungsi.
Untuk informasi tentang cara membuat layanan dan fungsi, lihat Buat fungsi dengan cepat.
Matikan semua sakelar
Recovery Notification
Menentukan apakah akan mengirimkan notifikasi ketika peringatan dibersihkan. Sakelar dihidupkan secara default.
Hidupkan sakelar
Method to handle alarms when no monitoring data is found
Metode yang digunakan untuk menangani peringatan saat tidak ada data pemantauan yang tersedia. Nilai valid:
Do not do anything (default)
Send alarm notifications
Treated as normal
Jangan lakukan apa pun
Di panel navigasi sisi kiri, klik Quota Alerts. Di halaman Peringatan Kuota, lihat detail tentang aturan peringatan.
Di halaman Quota Alerts, Anda dapat mengelola aturan peringatan. Misalnya, Anda dapat melihat, memodifikasi, dan menghapus aturan peringatan.
Opsional. Lihat hasil callback peringatan.
Jika Anda mengonfigurasi parameter Alert Callback, Anda dapat melihat catatan callback peringatan dan aplikasi yang diajukan secara otomatis untuk meningkatkan kuota setelah callback peringatan berhasil.
Prosedur (Konsol SLB)
Masuk ke konsol SLB. Di panel navigasi sisi kiri, klik Pusat Kuota.
Di halaman Quota Center, klik tab ALB.
Di bagian Quota Type, klik tab General Quota, temukan kuota yang ingin Anda kelola, lalu klik Create Alert Rule di kolom Actions.
Di halaman Create Alarm Rule, konfigurasikan parameter dan klik Confirm.
Tabel 1 Parameter untuk Membuat Aturan Peringatan untuk Item Kuota
Parameter
Deskripsi
Contoh
Alarm Rule Name
Nama aturan peringatan.
Jumlah maksimum vCPU untuk instance preemptible untuk pembelian terbatas
Alarm Metric
Metrik yang digunakan oleh aturan peringatan. Nilai valid:
Quotas
Used Quotas
Percentage of Used Quotas(%)
Percentage of Available Quotas(%)
Persentase Kuota Digunakan(%)
Threshold and Alert Level
Tingkat peringatan dan ambang batas yang sesuai dengan tingkat ini.
Metode notifikasi default berikut diatur untuk tingkat peringatan yang berbeda:
Critical: Email dan Callback
Warning: Email dan Callback
Info: Email dan Callback
Anda juga perlu memilih jumlah kali ambang batas tercapai sebelum peringatan dipicu. Nilai valid: 1 Siklus Berturut-turut, 3 Siklus Berturut-turut, 5 Siklus Berturut-turut, 10 Siklus Berturut-turut, 15 Siklus Berturut-turut, 30 Siklus Berturut-turut, 60 Siklus Berturut-turut, 70 Siklus Berturut-turut, 90 Siklus Berturut-turut, 120 Siklus Berturut-turut, dan 180 Siklus Berturut-turut.
Anda dapat mengonfigurasi pengaturan untuk tingkat peringatan yang berbeda. Dengan cara ini, CloudMonitor menghasilkan peringatan pada tingkat tertentu berdasarkan ambang batas yang sesuai dengan tingkat tersebut dan mengirimkan notifikasi peringatan menggunakan metode yang ditentukan.
Tingkat peringatan: Info. Metode notifikasi default untuk tingkat peringatan ini adalah Email dan Callback.
Ambang batas: ≥ 80%.
Mute For
Interval pengiriman notifikasi peringatan jika peringatan yang dihasilkan tidak dibersihkan. Nilai tersebut juga menunjukkan periode bisu. Nilai valid: 5 menit, 15 menit, 30 menit, 60 menit, 3 jam, 6 jam, 12 jam, dan 24 jam.
Notifikasi peringatan dikirimkan ketika metrik mencapai ambang batas peringatan. Selama periode bisu, jika metrik berulang kali melebihi ambang batas peringatan, tidak ada notifikasi peringatan baru yang dikirimkan. Setelah periode bisu berakhir, jika metrik tidak kembali ke keadaan normal, notifikasi peringatan baru akan dikirimkan.
Sebagai contoh, jika Anda mengatur parameter Mute For ke 24 hours, CloudMonitor mengirimkan notifikasi peringatan untuk peringatan yang dihasilkan, dan peringatan tetap belum terselesaikan, CloudMonitor mengirimkan notifikasi peringatan baru setelah 24 jam.
5 menit
Effective Time
Periode selama aturan peringatan berlaku. Aturan peringatan hanya berlaku dan menghasilkan peringatan pada waktu tertentu pada hari-hari tertentu dalam seminggu.
Siklus: Senin hingga Minggu
Waktu: 00:00 hingga 23:59
Alarm Contact Group
Grup kontak tempat notifikasi peringatan dikirimkan.
Notifikasi peringatan untuk grup aplikasi dikirimkan ke kontak peringatan dalam grup kontak peringatan. Grup kontak peringatan adalah sekelompok kontak peringatan, yang berisi satu atau lebih kontak peringatan.
Untuk informasi lebih lanjut tentang cara membuat kontak peringatan atau grup kontak peringatan, lihat Buat kontak peringatan atau grup kontak peringatan.
Administrator Kuota Tipe Instance ECS
Alarm Callback
URL yang dapat diakses melalui Internet untuk menerima informasi peringatan yang didorong oleh CloudMonitor menggunakan permintaan HTTP POST. Hanya protokol HTTP yang didukung.
Untuk menguji konektivitas URL callback, lakukan operasi berikut:
Klik Test di sebelah URL callback.
Di halaman Test Result, Anda dapat memeriksa konektivitas URL callback berdasarkan kode status dan detail hasil tes yang dikembalikan.
CatatanAnda juga dapat mengatur parameter Language dan kemudian klik Test lagi untuk mendapatkan detail hasil tes dalam bahasa tertentu.
Klik Close.
http://alert.aliyun.com:8080/callback
Labels
Tag dari aturan peringatan. Tag terdiri dari kunci tag dan nilai tag. Anda dapat menentukan hingga enam tag untuk aturan peringatan.
k1,v1Push Channel
Layanan Alibaba Cloud yang digunakan untuk menyampaikan informasi peringatan. Nilai valid:
Simple Log Service
Jika Anda mengaktifkan Simple Log Service, ketika peringatan dihasilkan, informasi peringatan dikirimkan ke Logstore di Layanan Log Sederhana. Dalam hal ini, Anda harus mengonfigurasi parameter Region, ProjectName, dan Logstore.
Untuk informasi tentang cara membuat proyek dan Logstore, lihat Memulai.
Message Service - topic
Jika Anda mengaktifkan Message Service - topic, ketika peringatan dihasilkan, informasi peringatan dikirimkan ke topik di Simple Message Queue (formerly MNS). Dalam hal ini, Anda harus menentukan wilayah dan topik.Simple Message Queue (formerly MNS)
Untuk informasi lebih lanjut tentang cara membuat topik, lihat Buat topik.
Function Compute
Jika Anda mengaktifkan Function Compute, ketika peringatan dihasilkan, informasi peringatan dikirimkan ke Function Compute untuk diformat. Dalam hal ini, Anda harus menentukan wilayah, layanan, dan fungsi.
Untuk informasi tentang cara membuat layanan dan fungsi, lihat Buat fungsi dengan cepat.
Matikan semua sakelar
Recovery Notification
Menentukan apakah akan mengirimkan notifikasi ketika peringatan dibersihkan. Sakelar dihidupkan secara default.
Hidupkan sakelar
Method to handle alarms when no monitoring data is found
Metode yang digunakan untuk menangani peringatan saat tidak ada data pemantauan yang tersedia. Nilai valid:
Do not do anything (default)
Send alarm notifications
Treated as normal
Jangan lakukan apa pun
Temukan kuota yang ingin Anda kelola dan pilih di kolom Actions.
Di kotak dialog Alerts, Anda dapat melihat aturan peringatan.