Topik ini menjelaskan istilah umum yang digunakan dalam Auto Scaling.
Hierarki konsep:
Sebuah scaling group berisi instans dan menetapkan batasan jumlah minimum, maksimum, serta jumlah yang diharapkan untuk penskalaan otomatis.
Instance configuration sources (berupa scaling configurations atau launch templates) memberi tahu Auto Scaling jenis instans yang harus dibuat saat scale-out.
Scaling rules menentukan jumlah instans yang ditambahkan atau dihapus. Scaling tasks (terjadwal atau dipicu oleh event) menjalankan aturan tersebut pada waktu yang tepat.
Setiap eksekusi menghasilkan sebuah scaling activity yang mencatat perubahan beserta alasannya.
Lifecycle hooks memungkinkan Anda menjalankan logika kustom saat instans masuk atau keluar dari grup, sedangkan scaling processes memungkinkan penangguhan perilaku penskalaan tertentu secara independen.
Istilah
| Istilah | Deskripsi | Referensi |
|---|---|---|
| Auto Scaling | Layanan yang secara dinamis menyesuaikan jumlah instans berdasarkan kebutuhan bisnis dan kebijakan penskalaan Anda. Auto Scaling menskalakan Instance Elastic Compute Service (ECS) atau elastic container instances — menambahkan instans selama jam sibuk untuk menjaga kapasitas, serta menghapusnya selama jam sepi untuk mengurangi biaya. | Apa itu Auto Scaling? |
| scaling group | Kumpulan instans dengan tipe yang sama yang digunakan untuk skenario bisnis serupa. Scaling group menetapkan jumlah minimum dan maksimum instans yang dapat dikandungnya, serta dapat dikaitkan dengan Instance Server Load Balancer (SLB) dan Instance ApsaraDB RDS. | Ikhtisar |
| ECS instance | Server virtual yang terdiri atas vCPU, memori, sistem operasi, konfigurasi jaringan, dan disk. ECS menghilangkan investasi perangkat keras di muka dan menskalakan sesuai permintaan, sehingga lebih fleksibel dibandingkan server fisik. | Apa itu ECS? |
| elastic container instance | Layanan kontainer yang disediakan oleh Alibaba Cloud yang menggabungkan teknologi kontainer dan arsitektur tanpa server (serverless). | Apa itu Elastic Container Instance? |
| SLB instance | Instance Server Load Balancer (SLB) mendistribusikan network traffic ke server backend untuk meningkatkan throughput aplikasi, mencegah gangguan layanan akibat single point of failure (SPOF), serta meningkatkan ketersediaan aplikasi. | Ikhtisar SLB |
| ApsaraDB RDS instance | Layanan database online yang stabil dan andal, mendukung skalabilitas elastis serta mesin database utama. ApsaraDB RDS menyediakan kemampuan pemulihan bencana, backup, restorasi, pemantauan, dan migrasi. | Apa itu ApsaraDB RDS? |
| scaling mode | Menentukan kapan Auto Scaling menambah atau menghapus instans dan seberapa banyak. Mode yang didukung: scheduled, dynamic, fixed-number, custom, health, dan multiple modes. | Mode penskalaan |
| instance configuration source | Templat yang digunakan Auto Scaling untuk membuat instans selama scale-out. Instance configuration source berupa scaling configuration atau launch template. | Ikhtisar |
| scaling configuration | Jenis instance configuration source yang menyimpan detail konfigurasi instans yang akan dibuat. | Buat scaling configuration (ECS) |
| scaling rule | Menentukan perilaku penskalaan saat scaling activity dipicu. Jenis aturan memiliki tujuan berbeda: step scaling rules, target tracking scaling rules, dan simple scaling rules menambah atau menghapus instans sebagai respons terhadap scaling activity yang dipicu; predictive scaling rules menganalisis data pemantauan historis untuk memprediksi nilai metrik di masa depan dan secara proaktif menyesuaikan jumlah instans maksimum dan minimum untuk scaling group. | Ikhtisar |
| scaling task | Mekanisme yang menjalankan scaling rules. Scaling task terdiri dari dua jenis: scheduled tasks, yang memicu penskalaan pada waktu tertentu, dan event-triggered tasks, yang memicu penskalaan secara dinamis berdasarkan metrik pemantauan. | Buat scheduled task · Ikhtisar |
| scaling activity | Catatan perubahan jumlah instans, batas instans maksimum/minimum, atau jumlah instans yang diharapkan dalam scaling group. Scaling activity dipicu ketika scaling rule dijalankan, ketika jumlah instans maksimum atau minimum diubah, atau ketika jumlah instans yang diharapkan diubah. | Lihat detail scaling activity |
| expected number of instances | Jumlah instans target yang secara aktif dipertahankan oleh Auto Scaling ketika fitur Expected Number of Instances diaktifkan. Tetapkan nilai ini saat membuat scaling group; nilainya dapat diperbarui kapan saja. | Expected number of instances |
| parallel scaling activity | Scaling activity yang dapat berjalan bersamaan dengan parallel scaling activity lainnya. Parallel scaling activity dipicu oleh: menjalankan scaling rule secara manual atau melalui scheduled task, menambah atau menghapus Instance ECS secara manual, atau melakukan pemeriksaan kesehatan atau pemeriksaan jumlah instans yang diharapkan/minimum/maksimum. Perbedaan antara parallel dan non-parallel scaling activity hanya berlaku ketika fitur Expected Number of Instances diaktifkan. Tanpa fitur ini, tidak ada scaling activity baru yang dapat dimulai selama scaling activity lain sedang berlangsung. | Expected number of instances |
| non-parallel scaling activity | Setiap scaling activity yang bukan merupakan parallel scaling activity. Selama non-parallel scaling activity sedang berlangsung, tidak ada scaling activity lain yang dapat dimulai. Perbedaan antara parallel dan non-parallel scaling activity hanya berlaku ketika fitur Expected Number of Instances diaktifkan. Tanpa fitur ini, tidak ada scaling activity baru yang dapat dimulai selama scaling activity lain sedang berlangsung. | Expected number of instances |
| stable instance | Instance ECS dalam status In Service, Protected, atau Standby di dalam scaling group. | Siklus hidup Instance ECS dalam scaling group |
| scaling process | Perilaku Auto Scaling individual yang dapat Anda tangguhkan dan lanjutkan secara independen, seperti scale-out, scale-in, pemeriksaan kesehatan, eksekusi scheduled task, atau eksekusi event-triggered task. Menangguhkan proses tertentu memberi Anda kontrol detail halus terhadap perilaku scaling group. | Tangguhkan scaling process · Tangguhkan dan lanjutkan scaling processes |
| lifecycle of an instance in a scaling group | Rentang penuh Instance ECS atau elastic container instance dari pembuatan hingga rilis. Manajemen siklus hidup bergantung pada cara instans ditambahkan: instans yang dibuat secara otomatis oleh Auto Scaling sepenuhnya dikelola oleh scaling group; instans yang ditambahkan secara manual hanya dikelola oleh scaling group jika Anda secara eksplisit mengaktifkan opsi tersebut, jika tidak, Anda sendiri yang mengelola siklus hidupnya. | Siklus hidup Instance ECS dalam scaling group |
| lifecycle hook | Menangguhkan Instance ECS atau elastic container instance yang masuk atau keluar dari scaling group sehingga Anda dapat menjalankan operasi kustom sebelum Auto Scaling melanjutkan proses. Misalnya, setelah Auto Scaling membuat instans baru selama scale-out, lifecycle hook dapat menahan instans dalam status Pending sementara Anda menjalankan pengujian untuk memverifikasi ketersediaan layanan. Auto Scaling kemudian menambahkan instans tersebut sebagai server backend ke Instance SLB terkait. | Buat lifecycle hook |
| cooldown time | Periode setelah scaling activity selesai, di mana Auto Scaling menolak semua permintaan scaling activity baru dari tugas event-triggered CloudMonitor. Cooldown time mencegah penskalaan beruntun yang cepat akibat fluktuasi metrik jangka pendek. | Cooldown time |