Fitur aturan penskalaan pelacakan target merupakan hasil integrasi mendalam antara Auto Scaling dan CloudMonitor. Fitur ini memungkinkan Anda menentukan kebijakan penskalaan secara lebih andal, tepat, dan cepat. Jika terjadi masalah tak terduga seperti lonjakan lalu lintas akses atau kegagalan perangkat keras, Anda dapat membuat aturan penskalaan pelacakan target untuk memicu penskalaan otomatis guna memastikan keandalan dan ketersediaan sistem.
Deskripsi
Aturan penskalaan pelacakan target adalah jenis baru dari aturan penskalaan yang dikembangkan berdasarkan aturan penskalaan sederhana. Saat membuat aturan penskalaan pelacakan target, Anda harus menentukan metrik CloudMonitor beserta nilai targetnya. Kemudian, Auto Scaling menghitung jumlah instans yang diperlukan dan melakukan penskalaan agar nilai metrik CloudMonitor tetap mendekati nilai target.
Auto Scaling mendukung aturan penskalaan bertahap, prediktif, sederhana, dan pelacakan target. Untuk informasi lebih lanjut, lihat Ikhtisar Aturan Penskalaan.
Metrik dan Fitur
Metrik
Tidak semua metrik di CloudMonitor dapat digunakan untuk membuat aturan penskalaan pelacakan target. Metrik yang dapat dikonfigurasikan harus merupakan metrik pemanfaatan yang valid dan mampu menggambarkan beban kerja instans dalam grup penskalaan. Nilai metrik tersebut harus dapat meningkat atau menurun secara proporsional dengan jumlah instans dalam grup penskalaan.
Pastikan metrik yang ingin Anda gunakan memenuhi persyaratan ini. Tabel berikut menjelaskan metrik yang didukung oleh aturan penskalaan pelacakan target untuk grup penskalaan berbagai jenis.
Grup Penskalaan Tipe ECS
Metrik berbasis API
Metrik berbasis Konsol
CpuUtilization
(ECS) Average CPU Utilization
IntranetRx
(ECS) Average Inbound Internal Traffic
IntranetTx
(ECS) Average Outbound Internal Traffic
ClassicInternetRx/VpcInternetRx
(ECS) Average Inbound Public Traffic
CatatanJika Anda menetapkan Network Type ke Classic Network saat Anda membuat grup penskalaan, metrik (ECS) Average Inbound Public Traffic menentukan rata-rata lalu lintas masuk dari Internet ke instans Elastic Compute Service (ECS) dalam grup penskalaan melalui jaringan klasik.
Jika Anda menetapkan Network Type ke VPC saat Anda membuat grup penskalaan, metrik (ECS) Average Inbound Public Traffic menentukan rata-rata lalu lintas masuk dari Internet ke instans ECS dalam grup penskalaan melalui virtual private cloud (VPC).
ClassicInternetTx/VpcInternetTx
(ECS) Average Outbound Public Traffic
CatatanJika Anda menetapkan Network Type ke Classic Network saat Anda membuat grup penskalaan, metrik (ECS) Average Outbound Public Traffic menentukan rata-rata lalu lintas keluar dari instans ECS dalam grup penskalaan ke Internet melalui jaringan klasik.
Jika Anda menetapkan Network Type ke VPC saat Anda membuat grup penskalaan, metrik (ECS) Average Outbound Public Traffic menentukan rata-rata lalu lintas keluar dari instans ECS dalam grup penskalaan ke Internet melalui VPC.
MemoryUtilization
(Agent) Memory
Penggunaan memori yang dikumpulkan oleh klien CloudMonitor.
LoadBalancerRealServerAverageQps
(ALB) QPS per Backend Server
CatatanJika Anda memilih metrik ini untuk Metric Type, Anda juga harus mengonfigurasi ALB Server Group.
Grup Penskalaan Tipe Elastic Container Instance
Metrik berbasis API
Metrik berbasis Konsol
EciPodCpuUtilization
CPU Utilization
EciPodMemoryUtilization
Memory
LoadBalancerRealServerAverageQps
(ALB) QPS per Backend Server
CatatanJika Anda memilih metrik ini untuk Metric Type, Anda juga harus mengonfigurasi ALB Server Group.
Fitur
Disable Scale-in: Jika Anda tidak ingin menghapus instans dari grup penskalaan setelah aturan penskalaan pelacakan target dijalankan, aktifkan opsi Disable Scale-in.
Untuk menonaktifkan scale-in, buka kotak dialog Create Scaling Rule di konsol Auto Scaling dan aktifkan tombol
di sebelah Disable Scale-in. Anda juga dapat menyetel parameter DisableScaleIn ke true saat memanggil operasi CreateScalingRule untuk menonaktifkan penskalaan masuk.Setelah mengaktifkan Disable Scale-in, hanya tugas ekspansi yang dipicu acara yang dibuat. Tidak ada tugas penskalaan masuk yang dibuat atau dihapus. Anda dapat menggunakan metode lain untuk melakukan penskalaan masuk pada instans dalam grup penskalaan, misalnya dengan membuat tugas pemantauan metrik lain dan menjalankan aturan penskalaan sederhana untuk merespons permintaan penskalaan masuk.
Setelah menonaktifkan Disable Scale-in, tugas ekspansi dan penskalaan masuk yang dipicu acara akan dibuat secara bersamaan.
Instance Warmup Time: Periode waktu yang diperlukan untuk instans baru agar siap digunakan. Selama waktu pemanasan, Auto Scaling tidak mengumpulkan statistik metrik dari instans.
Instans yang baru ditambahkan ke grup penskalaan hanya dapat memberikan kontribusi ke metrik tertentu yang dilaporkan ke CloudMonitor setelah Anda menerapkan layanan, melakukan pemeriksaan kesehatan Server Load Balancer (SLB), dan mengumpulkan data pada instans. Selama proses ini, aktivitas penskalaan baru tidak dapat dipicu dalam grup penskalaan. Untuk menghindari aktivitas penskalaan yang terlalu sering, disarankan untuk mengonfigurasi waktu pemanasan sesuai dengan kebutuhan bisnis Anda. Selama periode pemanasan, Auto Scaling akan menolak permintaan untuk menjalankan aturan penskalaan dalam grup penskalaan.
Sebelum mengonfigurasi Waktu Pemanasan Instans, perhatikan hal-hal berikut:
Sebelum waktu pemanasan instans berakhir, instans dapat ditambahkan ke grup penskalaan namun tidak memberikan kontribusi ke metrik CloudMonitor. Data metrik dari instans tidak dihitung dalam data metrik agregat grup penskalaan. CloudMonitor tidak mempertimbangkan instans yang sedang dipanaskan sebagai bagian dari kapasitas grup penskalaan.
Data instans dilaporkan ke CloudMonitor setelah waktu pemanasan berakhir. Setelah itu, CloudMonitor mempertimbangkan instans sebagai bagian dari kapasitas grup penskalaan.
Instans yang sedang dipanaskan dalam grup penskalaan tidak dapat dijadikan dasar untuk ekspansi.
Sebagai contoh, jika Anda memiliki grup penskalaan dengan dua instans dan ekspansi menambahkan lima instans, dengan waktu pemanasan 300 detik untuk lima instans tersebut, hanya dua instans yang dianggap sebagai dasar untuk ekspansi lain hingga waktu pemanasan berakhir.
Selama penskalaan masuk, Auto Scaling menetapkan waktu cooldown default untuk mencegah instans yang sedang dipanaskan dihapus dari grup penskalaan akibat penskalaan masuk berkelanjutan yang disebabkan oleh latensi data.
Perbandingan antara aturan penskalaan pelacakan target dan aturan penskalaan sederhana
Tabel berikut menjelaskan perbedaan antara aturan penskalaan pelacakan target dan aturan penskalaan sederhana.
Item | Aturan sederhana | Aturan penskalaan pelacakan target |
Keterlibatan pengguna | Keterlibatan pengguna tinggi. Anda dapat membuat aturan penskalaan kustom berdasarkan kebutuhan bisnis Anda untuk menskalakan instans sesuai permintaan. Namun, Anda harus selalu memperbarui diri Anda tentang aktivitas penskalaan spesifik dan nilai target. | Keterlibatan pengguna rendah. Kombinasi metode penskalaan dan waktu penskalaan memungkinkan Anda hanya fokus pada nilai metrik target. |
Granularitas penyesuaian | Penyesuaian tetap. Anda dapat membuat aturan penskalaan sederhana untuk memicu penskalaan masuk atau keluar. Anda tidak dapat memperoleh informasi tentang status aktual metrik. Aturan penskalaan sederhana dibuat hanya berdasarkan pengalaman Anda. Anda tidak dapat melakukan penyesuaian dinamis. | Penyesuaian tepat. Saat Anda membuat aturan penskalaan pelacakan target, Anda harus menentukan metrik dan menetapkan nilai target untuk metrik tersebut. Auto Scaling menghitung jumlah instans yang diperlukan untuk aktivitas penskalaan berdasarkan riwayat pemantauan metrik dan nilai target yang Anda tetapkan untuk metrik tersebut. Auto Scaling menjaga nilai metrik tetap pada atau dekat dengan nilai target dalam proses penyesuaian yang disederhanakan. Dengan cara ini, instans dalam grup penskalaan dapat dengan cepat dan dinamis diskalakan dengan cara yang tepat. |
Proses penyesuaian | Kurang kontrol atas proses penyesuaian.
| Kontrol fleksibel atas proses penyesuaian.
|
Buat aturan penskalaan pelacakan target
Perhatian
Sebelum membuat aturan penskalaan pelacakan target, perhatikan hal-hal berikut:
Anda tidak dapat menentukan metrik untuk lebih dari satu aturan penskalaan pelacakan target.
Saat membuat aturan penskalaan pelacakan target, dua tugas yang dipicu acara dibuat secara otomatis.
Anda tidak dapat memodifikasi atau menghapus tugas yang dipicu acara. Anda hanya dapat melihat, menonaktifkan, dan mengaktifkan tugas tersebut. Jika ingin menghapus tugas yang dipicu acara, hapus aturan penskalaan pelacakan target yang sesuai.
Satu tugas yang dipicu acara menggunakan kebijakan penskalaan masuk yang konservatif, sedangkan tugas lainnya menggunakan kebijakan ekspansi progresif.
Sebagai contoh, jika tugas yang menggunakan kebijakan ekspansi progresif mengumpulkan data metrik setiap 60 detik, ekspansi dipicu setelah ambang batas tercapai selama tiga menit berturut-turut. Jika tugas yang menggunakan kebijakan penskalaan masuk yang konservatif mengumpulkan data metrik setiap 60 detik, penskalaan masuk dipicu setelah ambang batas tercapai selama 15 menit berturut-turut.
Jika tugas yang dipicu acara melaporkan peringatan, aktivitas penskalaan dipicu. Auto Scaling menghitung jumlah instans yang diperlukan berdasarkan riwayat pemantauan metrik dalam tugas yang dipicu acara. Untuk ekspansi, jumlah instans dibulatkan ke atas untuk mencegah kekurangan instans. Untuk penskalaan masuk, jumlah instans dibulatkan ke bawah untuk mencegah penghapusan instans yang berlebihan.
Sebagai contoh, jika 1,5 instans diperlukan untuk memenuhi persyaratan ekspansi, 2 instans akan ditambahkan ke grup penskalaan. Jika 1,5 instans diperlukan untuk memenuhi persyaratan penskalaan masuk, 1 instans akan dihapus dari grup penskalaan.
Tidak ada aktivitas penskalaan yang dipicu dalam grup penskalaan jika data metrik tidak mencapai ambang batas.
Jika grup penskalaan berisi sejumlah kecil instans, perubahan jumlah instans dapat berdampak signifikan pada nilai metrik agregat grup penskalaan.
Sebagai contoh, jika jumlah instans yang dihitung oleh Auto Scaling kurang dari satu, peringatan terus dilaporkan namun tidak ada penskalaan masuk yang dipicu.
Prosedur
Anda dapat membuat aturan penskalaan pelacakan target untuk grup penskalaan menggunakan konsol Auto Scaling atau API.
Konsol: Temukan grup penskalaan tempat Anda ingin membuat aturan penskalaan pelacakan target dan buat aturan tersebut. Untuk detail lebih lanjut tentang cara membuat aturan penskalaan pelacakan target, lihat Konfigurasi Aturan Penskalaan.
API: Panggil operasi CreateScalingRule untuk membuat aturan penskalaan pelacakan target. Untuk informasi lebih lanjut, lihat CreateScalingRule.