全部产品
Search
文档中心

Auto Scaling:Ikhtisar

更新时间:Jun 27, 2025

Grup penskalaan adalah elemen dasar dari Auto Scaling yang mengelola instance layanan dengan tipe serupa dan cocok untuk tujuan bisnis tertentu. Anda dapat menggunakan grup penskalaan untuk mempercepat perluasan horizontal instance dalam kluster serta menyesuaikan jumlah instance secara dinamis berdasarkan kebutuhan bisnis, sehingga menghemat biaya secara signifikan.

Manfaat

  • Kemampuan perluasan cepat dan jaminan ketersediaan layanan tinggi

    Anda dapat menggunakan grup penskalaan untuk memperluas kluster layanan secara efisien dan meningkatkan ketersediaan layanan.

  • Pengendalian biaya

    Perluasan horizontal kluster layanan dapat meningkatkan biaya operasional karena peningkatan manajemen sumber daya. Namun, jika bisnis tidak selalu beroperasi pada kapasitas penuh, Anda dapat memanfaatkan elastisitas komputasi awan untuk mengurangi investasi sumber daya ketika permintaan turun, membantu mengelola biaya.

Solusi penskalaan yang didukung

Solusi 1: Pemeliharaan jumlah tetap instance yang tersedia

  • Skenario: Memastikan ketersediaan tinggi tanpa penskalaan kluster.

  • Metode implementasi: Aktifkan fitur Instance Health Check dan Expected Number of Instances.

    Setelah mengaktifkan fitur Instance Health Check, Auto Scaling secara otomatis menghapus instance yang tidak sehat dari grup penskalaan. Jika jumlah instance saat ini kurang dari jumlah yang diharapkan, Auto Scaling memicu peristiwa perluasan untuk menjaga jumlah tetap instance yang tersedia.

  • Contoh:

    Sebagai contoh, Anda mengaktifkan fitur Jumlah Instance yang Diharapkan untuk grup penskalaan dan menetapkan 10 sebagai jumlah yang diharapkan. Jika jumlah instance aktual kurang dari 10, Auto Scaling memicu peristiwa perluasan untuk meningkatkan jumlah menjadi 10.

Solusi 2: Penskalaan otomatis terjadwal

  • Skenario: Pemanfaatan sumber daya yang stabil.

  • Metode implementasi: Buat tugas terjadwal untuk mengaktifkan penskalaan otomatis terjadwal.

    Ketika pemanfaatan sumber daya meningkat, jalankan tugas terjadwal untuk memicu peristiwa perluasan. Ketika pemanfaatan sumber daya menurun, jalankan tugas terjadwal untuk memicu peristiwa penyusutan. Untuk informasi lebih lanjut, lihat Penskalaan instance ECS sesuai jadwal.

  • Contoh:

    Sebagai contoh, kluster Anda mengalami peningkatan lalu lintas setiap malam pukul 19:00 dan penurunan setiap pagi pukul 01:00. Untuk menangani fluktuasi permintaan bisnis, buat tugas terjadwal berikut:

    • Lalu lintas meningkat: Aktifkan tugas terjadwal untuk menambah jumlah replika layanan setiap malam pukul 19:00, meningkatkan kemampuan kluster menangani peningkatan lalu lintas.

    • Lalu lintas menurun: Aktifkan tugas terjadwal untuk mengurangi jumlah replika layanan setiap pagi pukul 01:00, meningkatkan pemanfaatan sumber daya dan efisiensi biaya.

Solusi 3: Penskalaan otomatis berdasarkan ambang batas pemanfaatan sumber daya

  • Skenario: Fluktuasi mendadak dalam beban kerja.

  • Metode implementasi:

    Memicu peristiwa penskalaan ketika pemanfaatan sumber daya melebihi atau turun di bawah ambang batas tertentu

    Buat tugas yang dipicu oleh peristiwa untuk memicu peristiwa penskalaan. Ketika pemanfaatan sumber daya melebihi atau turun di bawah ambang batas tertentu, tugas yang dipicu oleh peristiwa akan dieksekusi secara otomatis untuk memicu peristiwa penskalaan.

    Tambahkan atau hapus instance setelah alarm dipicu

    Saat membuat tugas yang dipicu oleh peristiwa, konfigurasikan aturan penskalaan sederhana dalam tugas tersebut. Aturan penskalaan sederhana menentukan tindakan untuk menambah atau menghapus sejumlah instance tertentu ketika tugas dijalankan.

    Deskripsi efek:

    Jika mengonfigurasi aturan penskalaan sederhana, Anda dapat langsung menambah atau menghapus sejumlah instance tertentu atau memungkinkan Auto Scaling menjaga jumlah instance yang diinginkan. Contoh:

    • Ketika rata-rata pemanfaatan CPU melebihi 80%, jalankan aturan penskalaan sederhana dengan memicu tugas untuk menambah N instance.

    • Ketika rata-rata pemanfaatan CPU turun di bawah 70%, jalankan aturan penskalaan sederhana dengan memicu tugas untuk menghapus N instance.

    Untuk informasi lebih lanjut, lihat Penskalaan instance ECS berdasarkan beban kerja bisnis.

    Tambahkan atau hapus instance berdasarkan tingkat pemanfaatan sumber daya

    Saat membuat tugas yang dipicu oleh peristiwa, Anda dapat mengonfigurasi aturan penskalaan bertahap. Ini memungkinkan penskalaan otomatis berdasarkan tingkat pemanfaatan sumber daya yang telah ditentukan.

    Penting

    Grup penskalaan tipe Elastic Container Instance tidak mendukung aturan penskalaan bertahap.

    Deskripsi efek:

    Jika mengonfigurasi aturan penskalaan bertahap, Anda dapat mengaktifkan penskalaan otomatis berdasarkan langkah-langkah penyesuaian yang telah ditentukan. Contoh:

    • Ketika rata-rata pemanfaatan CPU berada antara 60% dan 70%, jalankan aturan penskalaan bertahap untuk menghapus satu instance.

    • Ketika rata-rata pemanfaatan CPU berada antara 30% dan 60%, jalankan aturan penskalaan bertahap untuk menghapus tiga instance.

    • Ketika rata-rata pemanfaatan CPU turun di bawah 30%, Anda dapat terus menjalankan aturan penskalaan bertahap dengan memicu tugas yang dipicu oleh peristiwa untuk menghapus lima instance.

    Menjaga pemanfaatan sumber daya yang diinginkan

    Buat aturan penskalaan pelacakan target di grup penskalaan untuk menjaga pemanfaatan sumber daya yang diinginkan.

    Contoh:

    Anda membuat aturan penskalaan pelacakan target di grup penskalaan tipe Elastic Compute Service (ECS) dan menentukan 80% sebagai rata-rata pemanfaatan CPU yang diinginkan. Dalam hal ini, Auto Scaling secara dinamis menambah atau menghapus instance untuk menjaga rata-rata pemanfaatan CPU pada 80%.

  • Perbedaan antara metode implementasi:

    • Metode berbasis aturan penskalaan sederhana atau bertahap memberikan fleksibilitas dan penyesuaian yang lebih besar. Anda dapat mengontrol jumlah instance untuk ditambah atau dihapus setelah tugas dipicu. Metode ini juga mendukung penskalaan berdasarkan perubahan tingkat pemanfaatan sumber daya.

    • Metode berbasis aturan penskalaan pelacakan target lebih disederhanakan. Anda hanya perlu fokus pada pemanfaatan sumber daya yang diinginkan.

Solusi 4: Penskalaan kustom

Jika solusi yang disebutkan di atas tidak memenuhi kebutuhan bisnis Anda, Anda dapat mengonfigurasi solusi penskalaan kustom.

Secara manual jalankan aturan penskalaan atau modifikasi jumlah instance untuk memicu peristiwa penskalaan. Untuk informasi lebih lanjut, lihat Penskalaan manual instance ECS dengan beberapa klik.

Catatan

Penskalaan kustom mendukung panggilan API. Anda dapat memanggil operasi API untuk mengonfigurasi solusi penskalaan kustom berdasarkan kebutuhan bisnis Anda.

Solusi 5: Penskalaan prediktif

Auto Scaling juga dapat secara otomatis melakukan penyesuaian untuk memenuhi permintaan sumber daya yang diprediksi.

Solusi ini memungkinkan Anda menguji aturan penskalaan prediktif dengan mengaktifkan prediksi untuk menilai akurasi dan relevansi. Jika hasilnya memuaskan, aktifkan prediksi dan penskalaan untuk secara otomatis menghasilkan tugas prediktif dan menskalakan instance berdasarkan rencana terjadwal. Untuk informasi lebih lanjut, lihat Lihat prediksi dari aturan penskalaan prediktif.

Catatan Penggunaan

Sebelum menggunakan grup penskalaan, pastikan instance tempat Anda menyebarkan bisnis mendukung penskalaan horizontal.

Auto Scaling memperluas instance secara horizontal. Pertimbangkan dampak potensial dari penskalaan horizontal terhadap bisnis Anda.

  • Konsistensi data:

    Jika database ditempatkan pada instance, inkonsistensi data mungkin terjadi setelah menggunakan Auto Scaling untuk memperluas instance secara horizontal. Untuk menyelesaikan masalah ini, rekomendasikan desain arsitektur dengan menerapkan database secara terpisah dan memungkinkan semua instance mengakses database yang sama, mencapai layanan tanpa status.

  • Keamanan data:

    Instance dalam grup penskalaan dibuat dan dilepaskan secara otomatis. Jika Anda menyimpan data pada instance, pastikan Anda melakukan operasi cadangan data untuk mengamankan data Anda.

Bagaimana cara saya menggunakan grup penskalaan?

Memulai

Persyaratan lanjutan

Penyebaran bisnis: Penyebaran otomatis paket perangkat lunak bisnis pada instance baru

  • Aktifkan penyebaran otomatis dengan menggunakan gambar yang dilengkapi dengan paket perangkat lunak

    • Grup penskalaan tipe ECS:

      Buat gambar kustom yang dilengkapi dengan paket perangkat lunak Anda, dan modifikasi sumber konfigurasi instance untuk menggunakan gambar tersebut.

    • Grup penskalaan tipe Elastic Container Instance:

      Buat gambar Docker untuk bisnis Anda, dan modifikasi sumber konfigurasi instance untuk menggunakan gambar tersebut.

  • Jalankan skrip penyebaran secara otomatis saat instance dimulai

    • Data pengguna instans kustom:

      Jika grup penskalaan Anda adalah tipe ECS, aktifkan fitur Data Pengguna Instans. Sertakan skrip dalam data pengguna kustom untuk menyebar paket perangkat lunak layanan. Untuk informasi lebih lanjut, lihat Gunakan fitur Data Pengguna Instans untuk mengonfigurasi instance ECS secara otomatis.

    • Hooks siklus hidup:

      Jika grup penskalaan Anda adalah tipe ECS, aktifkan fitur Hook Siklus Hidup. Hook siklus hidup memungkinkan Anda menyebar paket perangkat lunak layanan pada instance sebelum instance ditambahkan ke grup penskalaan setelah peristiwa perluasan dipicu. Untuk informasi lebih lanjut, lihat Jalankan skrip secara otomatis pada instance ECS.

Pembaruan bergulir: Perbarui gambar instance atau jalankan skrip

Anda dapat memperbarui gambar instance atau menjalankan skrip secara batch pada beberapa instance menggunakan fitur Pembaruan Bergulir. Untuk informasi lebih lanjut, lihat Pembaruan bergulir.

Hubungan dengan database cloud: Izinkan instance baru mengakses database

Konfigurasikan grup keamanan yang identik untuk semua instance dalam grup penskalaan. Anda juga dapat menambahkan alamat IP privat instance baru ke daftar putih alamat IP dari database cloud terkait dengan grup penskalaan, memungkinkan akses dari instance baru ke database cloud.

Referensi:

Hubungan dengan load balancer: Konfigurasikan titik akses untuk instance dalam grup penskalaan

Jika kluster instance Anda menggunakan load balancer sebagai titik akses, hubungkan load balancer dengan grup penskalaan yang mengelola instance tersebut. Setelah dihubungkan, instance baru dalam grup penskalaan secara otomatis ditambahkan ke grup server backend dari load balancer.

Referensi:

Lakukan operasi kustom selama penskalaan

Gunakan hook siklus hidup untuk menempatkan instance dalam keadaan Tertunda dan lakukan operasi kustom pada instance, seperti memasang File Storage NAS file system, mengikat elastic IP addresses (EIPs), dan menjalankan skrip kustom.

Referensi:

Rancang kebijakan penyusutan

Ketika bisnis Anda memiliki beban kerja yang lebih rendah, Auto Scaling secara otomatis menyusutkan sumber daya Anda untuk meminimalkan biaya. Selama proses penyusutan, Anda mungkin memiliki pertanyaan tentang mengontrol frekuensi penyusutan, penyusutan instance secara elegan, dan memilih instance mana yang akan disusutkan.

Referensi:

Optimalkan biaya sumber daya

Jika menggunakan grup penskalaan, Anda dapat membuat instance spot dan mengaktifkan kebijakan optimasi biaya untuk mengoptimalkan biaya sumber daya.

Referensi:

Tingkatkan kemampuan pemulihan bencana dan tingkat keberhasilan perluasan

Kegagalan perluasan dapat terjadi karena sumber daya yang tidak mencukupi di zona tunggal. Untuk menyelesaikan masalah ini, tentukan beberapa zona dan tipe instance untuk mengurangi risiko kegagalan tersebut. Anda juga dapat mengaktifkan kebijakan distribusi seimbang dalam grup penskalaan Anda untuk menerapkan pemulihan bencana multi-zona.

Referensi:

Penskalaan node Kubernetes

Anda dapat menggunakan grup penskalaan untuk mengaktifkan penskalaan otomatis node Kubernetes.

Referensi: