Grup penskalaan adalah elemen dasar dari Auto Scaling yang mengelola instance layanan dengan tipe serupa dan cocok untuk tujuan bisnis tertentu. Anda dapat menggunakan grup penskalaan untuk mempercepat perluasan horizontal instance dalam kluster serta menyesuaikan jumlah instance secara dinamis berdasarkan kebutuhan bisnis, sehingga menghemat biaya secara signifikan.
Manfaat
Kemampuan perluasan cepat dan jaminan ketersediaan layanan tinggi
Anda dapat menggunakan grup penskalaan untuk memperluas kluster layanan secara efisien dan meningkatkan ketersediaan layanan.
Pengendalian biaya
Perluasan horizontal kluster layanan dapat meningkatkan biaya operasional karena peningkatan manajemen sumber daya. Namun, jika bisnis tidak selalu beroperasi pada kapasitas penuh, Anda dapat memanfaatkan elastisitas komputasi awan untuk mengurangi investasi sumber daya ketika permintaan turun, membantu mengelola biaya.
Solusi penskalaan yang didukung
Solusi 1: Pemeliharaan jumlah tetap instance yang tersedia
Skenario: Memastikan ketersediaan tinggi tanpa penskalaan kluster.
Metode implementasi: Aktifkan fitur Instance Health Check dan Expected Number of Instances.
Setelah mengaktifkan fitur Instance Health Check, Auto Scaling secara otomatis menghapus instance yang tidak sehat dari grup penskalaan. Jika jumlah instance saat ini kurang dari jumlah yang diharapkan, Auto Scaling memicu peristiwa perluasan untuk menjaga jumlah tetap instance yang tersedia.
Contoh:
Sebagai contoh, Anda mengaktifkan fitur Jumlah Instance yang Diharapkan untuk grup penskalaan dan menetapkan 10 sebagai jumlah yang diharapkan. Jika jumlah instance aktual kurang dari 10, Auto Scaling memicu peristiwa perluasan untuk meningkatkan jumlah menjadi 10.
Solusi 2: Penskalaan otomatis terjadwal
Skenario: Pemanfaatan sumber daya yang stabil.
Metode implementasi: Buat tugas terjadwal untuk mengaktifkan penskalaan otomatis terjadwal.
Ketika pemanfaatan sumber daya meningkat, jalankan tugas terjadwal untuk memicu peristiwa perluasan. Ketika pemanfaatan sumber daya menurun, jalankan tugas terjadwal untuk memicu peristiwa penyusutan. Untuk informasi lebih lanjut, lihat Penskalaan instance ECS sesuai jadwal.
Contoh:
Sebagai contoh, kluster Anda mengalami peningkatan lalu lintas setiap malam pukul 19:00 dan penurunan setiap pagi pukul 01:00. Untuk menangani fluktuasi permintaan bisnis, buat tugas terjadwal berikut:
Lalu lintas meningkat: Aktifkan tugas terjadwal untuk menambah jumlah replika layanan setiap malam pukul 19:00, meningkatkan kemampuan kluster menangani peningkatan lalu lintas.
Lalu lintas menurun: Aktifkan tugas terjadwal untuk mengurangi jumlah replika layanan setiap pagi pukul 01:00, meningkatkan pemanfaatan sumber daya dan efisiensi biaya.
Solusi 3: Penskalaan otomatis berdasarkan ambang batas pemanfaatan sumber daya
Skenario: Fluktuasi mendadak dalam beban kerja.
Metode implementasi:
Memicu peristiwa penskalaan ketika pemanfaatan sumber daya melebihi atau turun di bawah ambang batas tertentu
Buat tugas yang dipicu oleh peristiwa untuk memicu peristiwa penskalaan. Ketika pemanfaatan sumber daya melebihi atau turun di bawah ambang batas tertentu, tugas yang dipicu oleh peristiwa akan dieksekusi secara otomatis untuk memicu peristiwa penskalaan.
Menjaga pemanfaatan sumber daya yang diinginkan
Buat aturan penskalaan pelacakan target di grup penskalaan untuk menjaga pemanfaatan sumber daya yang diinginkan.
Contoh:
Anda membuat aturan penskalaan pelacakan target di grup penskalaan tipe Elastic Compute Service (ECS) dan menentukan 80% sebagai rata-rata pemanfaatan CPU yang diinginkan. Dalam hal ini, Auto Scaling secara dinamis menambah atau menghapus instance untuk menjaga rata-rata pemanfaatan CPU pada 80%.
Perbedaan antara metode implementasi:
Metode berbasis aturan penskalaan sederhana atau bertahap memberikan fleksibilitas dan penyesuaian yang lebih besar. Anda dapat mengontrol jumlah instance untuk ditambah atau dihapus setelah tugas dipicu. Metode ini juga mendukung penskalaan berdasarkan perubahan tingkat pemanfaatan sumber daya.
Metode berbasis aturan penskalaan pelacakan target lebih disederhanakan. Anda hanya perlu fokus pada pemanfaatan sumber daya yang diinginkan.
Solusi 4: Penskalaan kustom
Jika solusi yang disebutkan di atas tidak memenuhi kebutuhan bisnis Anda, Anda dapat mengonfigurasi solusi penskalaan kustom.
Secara manual jalankan aturan penskalaan atau modifikasi jumlah instance untuk memicu peristiwa penskalaan. Untuk informasi lebih lanjut, lihat Penskalaan manual instance ECS dengan beberapa klik.
Penskalaan kustom mendukung panggilan API. Anda dapat memanggil operasi API untuk mengonfigurasi solusi penskalaan kustom berdasarkan kebutuhan bisnis Anda.
Solusi 5: Penskalaan prediktif
Auto Scaling juga dapat secara otomatis melakukan penyesuaian untuk memenuhi permintaan sumber daya yang diprediksi.
Solusi ini memungkinkan Anda menguji aturan penskalaan prediktif dengan mengaktifkan prediksi untuk menilai akurasi dan relevansi. Jika hasilnya memuaskan, aktifkan prediksi dan penskalaan untuk secara otomatis menghasilkan tugas prediktif dan menskalakan instance berdasarkan rencana terjadwal. Untuk informasi lebih lanjut, lihat Lihat prediksi dari aturan penskalaan prediktif.
Catatan Penggunaan
Sebelum menggunakan grup penskalaan, pastikan instance tempat Anda menyebarkan bisnis mendukung penskalaan horizontal.
Auto Scaling memperluas instance secara horizontal. Pertimbangkan dampak potensial dari penskalaan horizontal terhadap bisnis Anda.
Konsistensi data:
Jika database ditempatkan pada instance, inkonsistensi data mungkin terjadi setelah menggunakan Auto Scaling untuk memperluas instance secara horizontal. Untuk menyelesaikan masalah ini, rekomendasikan desain arsitektur dengan menerapkan database secara terpisah dan memungkinkan semua instance mengakses database yang sama, mencapai layanan tanpa status.
Keamanan data:
Instance dalam grup penskalaan dibuat dan dilepaskan secara otomatis. Jika Anda menyimpan data pada instance, pastikan Anda melakukan operasi cadangan data untuk mengamankan data Anda.