Aturan penskalaan memiliki tujuan yang bervariasi berdasarkan jenisnya. Anda dapat menggunakannya untuk memicu aktivitas penskalaan atau menyesuaikan nilai batas dalam grup penskalaan, seperti jumlah minimum dan maksimum instance. Artikel ini menjelaskan jenis-jenis aturan penskalaan, batasan terkait, serta operasi yang dapat dilakukan pada aturan tersebut.
Jenis aturan penskalaan
Auto Scaling mendukung beberapa jenis aturan penskalaan: aturan penskalaan sederhana, bertahap, pelacakan target, dan prediktif. Aturan penskalaan sederhana, bertahap, dan pelacakan target digunakan untuk memicu aktivitas penskalaan. Sementara itu, aturan penskalaan prediktif secara otomatis menyesuaikan nilai batas dalam grup penskalaan. Berikut adalah penjelasan lebih rinci mengenai setiap jenis aturan berdasarkan tujuannya.
Aturan penskalaan untuk memicu aktivitas penskalaan
Jenis
Deskripsi
Aturan penskalaan sederhana
Anda dapat menentukan jumlah instance yang ingin Anda tambahkan ke atau hapus dari grup penskalaan dalam aturan penskalaan sederhana. Anda juga dapat menentukan jumlah instance yang ingin Anda sertakan dalam grup penskalaan dalam aturan penskalaan sederhana. Dibandingkan dengan aturan penskalaan pelacakan target dan aturan penskalaan prediktif, aturan penskalaan sederhana tidak dapat memicu peningkatan skala dan pengurangan skala secara bersamaan.
CatatanJika Anda menentukan aturan penskalaan sederhana dalam tugas yang dipicu oleh peristiwa dan Anda ingin mengeksekusi tugas untuk memicu aktivitas penskalaan, Anda harus menunggu periode cooldown grup penskalaan berakhir sebelum Anda dapat mengeksekusi tugas.
Aturan penskalaan bertahap
Aturan penskalaan bertahap adalah kebijakan penskalaan multi-langkah berdasarkan tugas yang dipicu oleh peristiwa CloudMonitor. Aturan penskalaan bertahap mencakup serangkaian langkah yang memungkinkan Anda mengelola penskalaan instance secara lebih rinci. Setiap langkah dari aturan penskalaan bertahap dapat dianggap sebagai aturan penskalaan sederhana.
Aturan penskalaan pelacakan target
Saat Anda membuat aturan penskalaan pelacakan target, Anda harus memilih metrik CloudMonitor dan menentukan nilai target. Auto Scaling secara otomatis menghitung jumlah instance yang diperlukan dan menskalakan instance berdasarkan jumlah yang dihitung untuk menjaga nilai metrik tetap mendekati nilai target. Untuk informasi lebih lanjut, lihat Aturan penskalaan pelacakan target.
CatatanSetelah Anda membuat aturan penskalaan pelacakan target, Auto Scaling secara otomatis membuat tugas yang dipicu oleh peristiwa dan kemudian mengaitkan tugas tersebut dengan aturan penskalaan pelacakan target. Saat metrik grup penskalaan mencapai nilai target, tugas yang dipicu oleh peristiwa dipicu untuk mengeksekusi aturan penskalaan pelacakan target yang terkait. Jika Anda tidak lagi memerlukan tugas yang dipicu oleh peristiwa, hapus aturan penskalaan pelacakan target yang terkait terlebih dahulu. Setelah Anda menghapus aturan yang terkait, Auto Scaling secara otomatis menghapus tugas yang dipicu oleh peristiwa.
Aturan penskalaan untuk menyesuaikan nilai batas secara otomatis
Aturan Penskalaan Prediktif
Anda dapat membuat aturan penskalaan prediktif untuk menyesuaikan nilai batas dalam grup penskalaan secara otomatis. Setelah pembuatan aturan, Auto Scaling menganalisis data pemantauan selama 24 jam terakhir atau lebih dari grup penskalaan menggunakan teknologi pembelajaran mesin untuk memprediksi metrik selama 48 jam ke depan. Kemudian, Auto Scaling menghitung jumlah instance yang diperlukan setiap jam dan membuat tugas terjadwal. Tugas ini dipicu pada waktu tertentu untuk menyesuaikan nilai batas berdasarkan prediksi. Proses ini diperbarui setiap hari dengan 48 tugas prediksi baru untuk 48 jam mendatang.
Manfaat
Jika pola bisnis Anda tidak konsisten atau sulit memperkirakan beban kerja, nilai batas awal yang ditetapkan saat pembuatan grup penskalaan mungkin tidak sesuai dengan kebutuhan aktual. Dalam situasi ini, aturan penskalaan prediktif membantu mencegah masalah berikut:
Jika jumlah minimum instance lebih besar dari yang diperlukan, Auto Scaling akan membeli sumber daya berlebih, menyebabkan pemborosan dan meningkatkan biaya.
Jika jumlah maksimum instance kurang dari yang dibutuhkan, sumber daya komputasi tidak mencukupi untuk memenuhi kebutuhan bisnis, yang dapat memengaruhi ketersediaan layanan.
Catatan Penggunaan
Sebelum membuat aturan penskalaan prediktif, perhatikan hal-hal berikut:
Aturan penskalaan prediktif memerlukan minimal 24 jam data metrik historis untuk menghasilkan prediksi.
Jika Anda mengubah parameter Target Value, tugas prediksi saat ini akan dihapus dan tugas baru dihasilkan dalam waktu satu jam.
Aturan penskalaan prediktif hanya menyesuaikan jumlah minimum dan maksimum instance dalam grup penskalaan, tanpa melakukan penskalaan langsung.
Aturan penskalaan prediktif dapat digunakan bersama dengan jenis aturan lainnya. Saat digunakan bersama aturan pelacakan target, disarankan untuk menggunakan metrik dan nilai target yang sama untuk menghindari fluktuasi jumlah instance akibat perbedaan metrik.
Kami menyarankan Anda untuk awalnya mengatur parameter Predictive Mode ke Predict Only. Jika hasil prediksi sesuai dengan harapan, ubah Predictive Mode dari Predict Only menjadi Predict and Scale. Untuk informasi lebih lanjut, lihat Lihat prediksi aturan penskalaan prediktif.
Batasan
Berikut adalah batasan yang berlaku untuk aturan penskalaan:
Anda hanya dapat membuat sejumlah terbatas aturan penskalaan untuk setiap grup penskalaan. Untuk melihat kuota, kunjungi Pusat Kuota.
Jika jumlah instance dalam status In Service melebihi jumlah maksimum atau kurang dari jumlah minimum setelah eksekusi aturan penskalaan, Auto Scaling akan menyesuaikan jumlah instance agar tetap berada dalam rentang yang diizinkan. Contoh:
Grup penskalaan bernama asg-bp19ik2u5w7esjcu**** memiliki kapasitas maksimum tiga instance dan dua instance dalam status In Service. Jika aturan penskalaan add3 dieksekusi (menambahkan tiga instance), hanya satu instance yang akan ditambahkan.
Grup penskalaan bernama asg-bp19ik2u5w7esjcu**** memiliki kapasitas minimum dua instance dan tiga instance dalam status In Service. Jika aturan penskalaan reduce2 dieksekusi (menghapus dua instance), hanya satu instance yang akan dihapus.
Jika ada pembayaran tertunda dalam akun Alibaba Cloud Anda, Anda tidak dapat mengeksekusi aturan penskalaan.
PentingUntuk menggunakan Auto Scaling, pastikan saldo akun Alibaba Cloud Anda mencukupi.
Kelola aturan penskalaan
Tabel berikut menjelaskan operasi yang dapat dilakukan pada aturan penskalaan beserta tautan terkait.
Panduan pengguna | Operasi | Referensi API |
Buat aturan penskalaan | ||
Eksekusi aturan penskalaan | N/A | |
Ubah aturan penskalaan | ||
Hapus aturan penskalaan | ||
Lihat efek aturan penskalaan prediktif | N/A |