Elastic High Performance Computing (E-HPC) menyediakan fitur penskalaan otomatis yang mengalokasikan node komputasi secara dinamis berdasarkan kebijakan penskalaan otomatis yang telah dikonfigurasi. Sistem dapat menambah atau menghapus node komputasi berdasarkan beban kerja real-time untuk meningkatkan ketersediaan kluster dan menghemat biaya. Topik ini menjelaskan cara mengonfigurasi penskalaan otomatis.
Manfaat
Menambah node komputasi berdasarkan beban kerja real-time kluster untuk meningkatkan ketersediaan kluster.
Mengurangi jumlah node komputasi untuk menghemat biaya tanpa mengorbankan ketersediaan kluster.
Menghentikan node bermasalah dan membuat node baru untuk meningkatkan toleransi kesalahan.
Batasan
Penskalaan otomatis hanya dapat dikonfigurasi untuk kluster di mana semua node menjalankan sistem operasi Linux.
Penskalaan otomatis hanya dapat dikonfigurasi untuk kluster dengan scheduler PBS, Slurm, Deadline, atau SGE.
E-HPC tidak mendukung penskalaan otomatis berdasarkan penggunaan memori.
PentingUntuk menerapkan penskalaan otomatis secara efektif, disarankan agar Anda menentukan jumlah vCPU yang diperlukan saat mengirimkan pekerjaan. Perhatikan bahwa ukuran memori yang ditentukan untuk pekerjaan tersebut tidak boleh melebihi kapasitas memori dari instance Elastic Compute Service (ECS).
Catatan Penggunaan
Sebelum menggunakan layanan penskalaan otomatis, pastikan layanan scheduler dan layanan akun domain berfungsi dengan baik. Setelah mengaktifkan penskalaan otomatis, node manajemen harus tetap dalam keadaan berjalan.
PentingJika perlu mematikan atau me-restart node manajemen, lakukan operasi setelah node idle dilepaskan dan tidak ada pekerjaan yang berjalan pada node komputasi. Disarankan untuk menonaktifkan penskalaan otomatis sebelum mematikan atau me-restart node manajemen, kemudian mengaktifkannya kembali setelah node manajemen di-restart.
Tabel berikut mencantumkan konfigurasi node manajemen yang direkomendasikan dan jumlah antrian. Untuk informasi lebih lanjut, lihat Ikhtisar.
Jumlah node komputasi
Spesifikasi node manajemen
Jumlah pekerjaan
100 atau kurang node komputasi
16 atau lebih vCPU
64 GiB atau lebih memori
Kurang dari 5.000 pekerjaan dalam antrian
Kurang dari 10.000 pekerjaan yang belum selesai
500 atau kurang node komputasi
32 atau lebih vCPU
128 GiB atau lebih memori
Kurang dari 10.000 pekerjaan dalam antrian
Kurang dari 20.000 pekerjaan yang belum selesai
Lebih dari 500 node komputasi
64 atau lebih vCPU
256 GiB atau lebih memori
Kurang dari 10.000 pekerjaan dalam antrian
Kurang dari 20.000 pekerjaan yang belum selesai
Prosedur
Buka halaman Auto Scale.
Masuk ke Konsol E-HPC.
Pada bilah navigasi atas, pilih wilayah.
Di panel navigasi sisi kiri, pilih .
Dari daftar drop-down Kluster pada halaman Auto Scale, pilih kluster yang ingin dikonfigurasi untuk penskalaan otomatis.
Di bagian Global Configurations, konfigurasikan parameter. Tabel berikut menjelaskan parameter yang dapat dikonfigurasi.
Parameter
Deskripsi
Enable Autoscale
Aktifkan Auto Grow dan Auto Shrink untuk semua antrian dalam kluster.
CatatanJika pengaturan di bagian Konfigurasi Antrian berbeda dari pengaturan di bagian Konfigurasi Global, pengaturan di bagian Konfigurasi Antrian akan diutamakan.
Compute Nodes
Rentang jumlah node komputasi dalam kluster setelah penskalaan otomatis. Batas atas adalah jumlah maksimum node komputasi yang dikonfigurasikan untuk setiap antrian dalam kluster. Batas bawah adalah jumlah minimum node komputasi yang dikonfigurasikan untuk setiap antrian dalam kluster.
Scale-in Time (Minute)
Jika durasi idle terus-menerus dari node komputasi melebihi durasi penskalaan masuk, node tersebut dilepaskan.
Durasi idle terus-menerus adalah interval penskalaan masuk dikalikan dengan jumlah waktu idle berturut-turut. Secara default, interval penskalaan masuk adalah 2 menit. Jumlah waktu idle berturut-turut dari node komputasi adalah jumlah kali berturut-turut node komputasi idle selama pemeriksaan penskalaan sumber daya.
Image Type
Tipe gambar dari node komputasi yang ingin Anda tambahkan ke kluster. Hanya gambar yang kompatibel dengan gambar node komputasi yang ada dalam kluster yang didukung.
Exceptional Nodes
Pilih node yang ingin Anda kecualikan dari penskalaan otomatis.
Jika Anda ingin mempertahankan node komputasi, Anda dapat mengonfigurasi node sebagai node pengecualian. Kemudian, node tersebut tidak akan dilepaskan terlepas dari apakah node tersebut idle.
Hyper-threading
Secara default, Hyper-Threading (HT) diaktifkan untuk semua instance ECS. Untuk tipe instance ECS tertentu, Anda dapat menonaktifkan HT untuk performa yang lebih baik. Untuk informasi lebih lanjut, lihat Batasan tipe instance dan Nonaktifkan HT untuk node komputasi.
Di bagian Queue Configuration, pilih antrian dan klik Edit untuk mengonfigurasi parameter.
Parameter
Deskripsi
Auto Grow dan Auto Shrink
Menentukan apakah akan mengaktifkan Auto Grow dan Auto Shrink. Secara default, kedua saklar dimatikan.
CatatanJika pengaturan di bagian Konfigurasi Antrian berbeda dari pengaturan di bagian Konfigurasi Global, pengaturan di bagian Konfigurasi Antrian akan diutamakan.
Queue Compute Nodes
Rentang jumlah node komputasi dalam antrian.
Node Maksimum: Jumlah maksimum node komputasi berkisar antara 0 hingga 5.000. Nilai ini dapat memengaruhi efek penskalaan keluar.
Node Minimum: Jumlah minimum node komputasi berkisar antara 0 hingga 1.000. Nilai ini dapat memengaruhi efek penskalaan masuk.
PentingJika Anda menentukan parameter Minimal Nodes ke nilai bukan nol, antrian akan mempertahankan jumlah node berdasarkan nilai yang Anda tentukan selama penskalaan kluster masuk. Node idle tidak dilepaskan. Disarankan untuk menentukan parameter Minimal Nodes dengan hati-hati untuk menghindari pemborosan sumber daya dan biaya karena node idle dalam antrian.
Prefix of Hostnames
Awalan nama host dari node komputasi. Awalan digunakan untuk membedakan antara node dari antrian yang berbeda.
Maximum Nodes in Each Round of Scale-out
Jumlah maksimum node komputasi yang dapat ditambahkan dalam setiap putaran penskalaan keluar. Nilai default 0 menentukan bahwa jumlah maksimum node komputasi yang dapat ditambahkan dalam setiap putaran penskalaan keluar tidak dibatasi.
Disarankan untuk mengonfigurasi parameter ini guna mengontrol biaya Anda pada node komputasi.
Jika Anda mengatur parameter ini ke A dan ingin menambahkan B node, node ditambahkan berdasarkan aturan berikut:
Jika B kurang dari atau sama dengan A, B node ditambahkan.
Jika B lebih besar dari A, A node ditambahkan.
CatatanSelain parameter ini, jumlah node dalam kluster juga dibatasi oleh jumlah maksimum node yang dapat ditambahkan dalam satu antrian dan jumlah maksimum node yang dapat ditambahkan dalam kluster.
Minimum Scale-out Nodes in Each Round
Jumlah minimum node komputasi yang harus ditambahkan dalam setiap putaran penskalaan keluar. Nilai default 1 menentukan bahwa setidaknya satu node harus ditambahkan.
Dalam skenario tertentu, Anda mungkin perlu menambahkan setidaknya sejumlah node tertentu untuk memastikan bisnis dapat berjalan seperti yang diharapkan. Dalam hal ini, Anda dapat menentukan jumlah minimum node yang harus ditambahkan dalam setiap putaran. Jika jumlah instance ECS yang tersedia kurang dari jumlah minimum node yang ditentukan dan jumlah node yang diperlukan, kluster tidak diskalakan keluar untuk menghindari pemborosan sumber daya.
Jika Anda mengatur parameter ini ke A dan ingin menambahkan B node, node ditambahkan dalam skenario berikut:
Contohnya, B kurang dari atau sama dengan A. Jika jumlah instance ECS yang tersedia lebih besar dari atau sama dengan B, B node ditambahkan. Jika jumlah instance ECS yang tersedia kurang dari B, kluster tidak diskalakan keluar.
Contohnya, B lebih besar dari A. Jika jumlah instance ECS yang tersedia lebih besar dari atau sama dengan B, B node ditambahkan. Jika jumlah instance ECS yang tersedia kurang dari B dan lebih besar dari atau sama dengan A, A node ditambahkan. Jika jumlah instance ECS yang tersedia kurang dari A, kluster tidak diskalakan keluar.
Automatic Configuration of the Minimum Node Number for Each Scale-out
Jika Anda menghidupkan saklar ini, jumlah node minimum untuk setiap penskalaan keluar sama dengan jumlah node yang diperlukan oleh pekerjaan. Jumlah node minimum tidak boleh lebih besar dari 99.
Hostname Suffix
Akhiran nama host. Akhiran digunakan untuk membedakan antara node dari antrian yang berbeda.
Image Type
Tipe gambar dari node yang ingin ditambahkan dalam antrian. Anda dapat menentukan tipe gambar yang berbeda untuk antrian yang berbeda.
Image ID
ID gambar tempat node yang ingin ditambahkan dalam antrian termasuk. Anda dapat menentukan ID gambar yang berbeda untuk antrian yang berbeda.
CatatanParameter ini hanya valid untuk antrian saat ini. Jika Anda tidak menentukan tipe gambar atau ID gambar, tipe gambar dari node yang ingin ditambahkan sama dengan tipe gambar yang ditentukan dalam konfigurasi global. Jika Anda tidak menentukan tipe gambar dalam konfigurasi global, tipe gambar dari node yang ingin ditambahkan sama dengan tipe gambar default kluster.
Whether instance types are unordered
Jika Anda menghidupkan saklar ini, sistem memilih tipe instance berdasarkan urutan menurun jumlah instance dalam stok selama penskalaan otomatis untuk memastikan pengiriman sumber daya.
Configuration List
Konfigurasikan node komputasi yang ingin ditambahkan. Setiap daftar konfigurasi mencakup konfigurasi berikut:
Zone: zona di wilayah tempat kluster berada.
vSwitch ID: vSwitch yang terikat ke VPC kluster di zona yang dipilih.
Instance Type: tipe instance dari node komputasi yang ingin ditambahkan dalam antrian.
CatatanJika beberapa tipe instance dikonfigurasikan dalam antrian, kluster diskalakan keluar berdasarkan tipe instance yang tersedia, jumlah tugas, dan jumlah GPU secara berurutan. Contohnya, setiap node dalam antrian harus memiliki setidaknya 16 core untuk memenuhi persyaratan bisnis Anda. Antrian memiliki node dengan 8 core, 16 core, dan 32 core. Instance ECS dengan 16 core secara otomatis ditambahkan ke antrian. Jika tidak ada instance ECS dengan 16 core yang tersedia, instance dengan 32 core secara otomatis ditambahkan ke antrian.
Bid Strategy: metode penawaran yang dikonfigurasikan untuk node yang ingin ditambahkan.
Maximum Price per Hour: Anda harus menetapkan harga maksimum per jam hanya ketika Bid Strategy diatur ke Preemptible instance with maximum bid price.
System Disk
Disk sistem dari node komputasi yang ingin ditambahkan.
Data disk
Disk data yang dilampirkan ke node komputasi yang ingin ditambahkan. Konfigurasikan jenis, ukuran, dan tingkat performa disk data, serta tentukan apakah akan melepaskan disk data bersama dengan node komputasi dan apakah akan mengenkripsi disk data berdasarkan persyaratan bisnis Anda.
Di sudut kanan atas halaman, baca dan pilih Alibaba Cloud International Website Product Terms of Service, dan klik OK.
Opsional. Lihat diagram penskalaan otomatis kluster.
Diagram penskalaan otomatis menunjukkan perubahan jumlah node dari waktu ke waktu selama proses penskalaan otomatis berdasarkan kebijakan penskalaan otomatis yang Anda konfigurasikan. Diagram ini juga menunjukkan waktu yang dikonsumsi oleh penskalaan node masuk dan keluar pada titik-titik waktu penting.
CatatanAnda dapat menentukan jumlah node konkuren simulasi dalam diagram penskalaan otomatis untuk mensimulasikan perubahan node komputasi selama penskalaan otomatis.