Cluster Elastic High Performance Computing (E-HPC) adalah sekelompok Instance ECS (Elastic Compute Service) yang menyediakan kemampuan komputasi berperforma tinggi. Dibandingkan dengan instance ECS biasa, cluster E-HPC menawarkan performa, skalabilitas, keandalan, dan ketersediaan yang lebih tinggi. Topik ini menjelaskan istilah dan fitur dari sebuah cluster E-HPC.
Node
Setiap node dalam cluster E-HPC merupakan sebuah Instance ECS. Node-node tersebut diklasifikasikan menjadi node logon, node manajemen, dan node komputasi. Tabel berikut menjelaskan setiap jenis node beserta perannya dalam cluster E-HPC.
Node | Deskripsi |
Node logon | Node logon digunakan untuk masuk ke cluster E-HPC. Anda juga dapat men-debug, mengkompilasi, dan menginstal perangkat lunak, serta mengirimkan pekerjaan melalui node logon. |
Node manajemen | Node manajemen digunakan untuk mengelola cluster. Layanan penjadwalan dan layanan akun domain diterapkan.
Penting Node manajemen digunakan untuk menjadwalkan pekerjaan dan menyelesaikan akun domain. Untuk memastikan kelangsungan bisnis, jangan gunakan node manajemen untuk mengkompilasi perangkat lunak, atau mengunggah atau mengunduh data terkompresi. |
Node komputasi | Node komputasi digunakan untuk menjalankan pekerjaan komputasi berperforma tinggi. |
Kami merekomendasikan agar Anda memilih spesifikasi instance untuk node manajemen dan menjadwalkan pekerjaan sesuai jumlah node komputasi. Tabel berikut mencantumkan rekomendasi spesifikasi instance dan jumlah pekerjaan.
Jumlah node komputasi | Spesifikasi node manajemen | Jumlah pekerjaan |
100 atau kurang node komputasi |
|
|
500 atau kurang node komputasi |
|
|
Lebih dari 500 node komputasi |
|
|
Gambar
Gambar mencakup sistem operasi dan data konfigurasi untuk bisnis Anda. Gambar digunakan untuk menyediakan Instance ECS yang membentuk cluster E-HPC. E-HPC mendukung jenis gambar berikut:
Gambar publik: gambar yang disediakan oleh Alibaba Cloud.
Gambar kustom: gambar yang dibuat dari Instance ECS atau snapshot, atau gambar yang diimpor dari komputer Anda.
Gambar bersama: gambar yang dibagikan oleh akun Alibaba Cloud lainnya.
Gambar Marketplace Alibaba Cloud: gambar yang disediakan oleh vendor perangkat lunak independen (ISV) yang dilisensikan oleh Alibaba Cloud Marketplace.
Gambar komunitas: gambar yang dirilis di platform gambar Komunitas Alibaba Cloud.
Jenis gambar yang dapat dipilih bervariasi berdasarkan wilayah yang ditentukan, tipe instance yang ditentukan untuk node, dan apakah akun Alibaba Cloud saat ini memiliki sumber daya gambar yang tersedia. Semua jenis gambar yang tersedia ditampilkan di konsol.
Penjadwal, layanan akun domain, dan penyimpanan bersama serta perangkat lunak yang didukung bervariasi berdasarkan gambar.
Untuk informasi lebih lanjut, lihat Ikhtisar.
Penjadwal
Penjadwal digunakan untuk menjadwalkan pekerjaan pada cluster. Tabel berikut menjelaskan penjadwal yang didukung oleh E-HPC:
Tipe | Penjadwal | Ditampilkan di konsol |
PBS | PBS Pro19 | pbs19 |
PBS Pro18 | pbs Catatan Versi perangkat lunak penjadwal yang akan diinstal bergantung pada gambar yang Anda gunakan. | |
OpenPBS 20 | ||
OpenPBS 22 | ||
Slurm | Slurm 22 | slurm22 |
Slurm 20 | slurm20 | |
Slurm 19 | slurm19 | |
Slurm 17 | slurm | |
GridEngine | Open Grid Scheduler (SGE) | opengridscheduler |
Lainnya | Deadline | deadline |
Penjadwal yang didukung bervariasi berdasarkan gambar. Untuk informasi lebih lanjut, lihat bagian "Penjadwal, layanan akun domain, dan penyimpanan bersama yang didukung oleh gambar" dalam topik ini.
Layanan akun domain
Layanan akun domain digunakan untuk mengelola pengguna cluster. E-HPC mendukung layanan akun domain berikut:
Network Information Service (NIS) menyediakan manajemen identitas terpusat. Anda dapat membuat pengguna di server NIS. Setelah node baru ditambahkan ke NIS, Anda dapat menggunakan pengguna tersebut untuk masuk ke node tanpa perlu membuat pengguna di setiap node.
Lightweight Directory Access Protocol (LDAP) digunakan untuk mengotentikasi pengguna E-HPC. Anda dapat mengotorisasi dan mengelompokkan pengguna menggunakan LDAP untuk menyederhanakan manajemen izin dalam organisasi Anda.
Layanan akun domain yang didukung bervariasi berdasarkan gambar. Untuk informasi lebih lanjut, lihat bagian "Penjadwal, layanan akun domain, dan penyimpanan bersama yang didukung oleh gambar" dalam topik ini.
Penyimpanan bersama
Data pengguna, informasi penjadwal, dan data pekerjaan bersama dari cluster E-HPC disimpan dalam sistem file untuk akses bersama oleh semua node dalam cluster. E-HPC mendukung jenis sistem file berikut:
Aspara File Storage NAS: mencakup NAS tujuan umum dan Extreme NAS.
Sistem file Cloud Parallel File Storage (CPFS): mendukung metode pemasangan CPFS-NFS dan CPFS-POSIX.
Lainnya: penyimpanan file yang tidak di-hosting oleh Alibaba Cloud, seperti sistem file NAS yang Anda kelola sendiri.
Penyimpanan yang didukung bervariasi berdasarkan gambar. Untuk informasi lebih lanjut, lihat bagian "Penjadwal, layanan akun domain, dan penyimpanan bersama yang didukung oleh gambar" dalam topik ini.
Penjadwal, layanan akun domain, dan penyimpanan bersama yang didukung oleh gambar
Tabel berikut menjelaskan penjadwal, layanan akun domain, dan penyimpanan bersama yang didukung oleh gambar.
Jika Anda membuat cluster E-HPC di konsol E-HPC, jenis gambar yang didukung, penjadwal, dan layanan akun domain ditampilkan di konsol.
Untuk gambar yang diberi label dengan penjadwal kustom, layanan akun domain kustom, atau penyimpanan bersama kustom dalam tabel, penjadwal, layanan akun domain, dan penyimpanan bersama tidak disertakan dengan gambar. Anda perlu menginstalnya sendiri.
CentOS 6 dan CentOS 8 telah mencapai EOL, artinya komunitas Linux tidak lagi memelihara versi sistem operasi ini. Untuk alasan keamanan dan keandalan, kami merekomendasikan agar Anda beralih ke sistem operasi lain. Untuk informasi lebih lanjut, lihat Bagaimana cara mengubah alamat repositori CentOS 6? dan Ubah alamat repositori CentOS 8.
Gambar publik | Penjadwal | Layanan akun domain | Penyimpanan bersama |
|
|
|
|
CentOS 8.0 64-bit | Open PBS 20 | NIS |
|
CentOS 6.9 64-bit |
|
|
|
CentOS 6.10 64-bit | Kustom | Kustom |
|
Alibaba Cloud Linux 2.1903 LTS 64-bit | PBS Pro18 |
|
|
Alibaba Cloud Linux 3.2104 LTS 64-bit | Open Grid Scheduler (SGE) | NIS |
|
Alibaba Cloud Linux 3.2104 LTS 64-bit for ARM | Open Grid Scheduler (SGE) | NIS |
|
Ubuntu 20.04 64-bit | Slurm 22 | NIS |
|
Ubuntu 20.04 64-bit for ARM | Slurm 22 | NIS |
|
| Kustom | Kustom | Kustom |
Pengguna cluster E-HPC
Anda harus membuat pengguna untuk mengirimkan, men-debug, dan menjalankan pekerjaan pada cluster E-HPC. Anda dapat memberikan dua jenis izin kepada pengguna saat membuat mereka.
Izin biasa: cocok untuk pengguna biasa yang hanya perlu mengirimkan dan men-debug pekerjaan.
Izin sudo: cocok untuk pengguna administratif yang perlu mengelola cluster E-HPC. Selain izin biasa, izin sudo memungkinkan pengguna menginstal perangkat lunak dan me-restart node dengan menjalankan perintah sudo.
PentingAnda hanya dapat membuat pengguna root saat membuat cluster E-HPC. Kami merekomendasikan agar Anda tidak menggunakan pengguna root untuk operasi sehari-hari. Ini meminimalkan risiko kerusakan pada data cluster akibat operasi yang tidak tepat atau tidak disengaja.
Untuk informasi lebih lanjut, lihat Kelola pengguna.
Perangkat Lunak
E-HPC menyediakan akses ke aplikasi komputasi utama, library runtime, dan library Message Passing Interface (MPI). Anda dapat menginstal perangkat lunak berdasarkan kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Ikhtisar Perangkat Lunak.
Status cluster E-HPC
Creating: Cluster sedang dibuat. Instance ECS yang membentuk cluster dibuat pada tahap ini.
Uninitialized: Gambar sedang diinstal pada instance dalam cluster.
Initializing: Cluster sedang diinisialisasi. Pengguna root diinisialisasi pada tahap ini.
Running: Cluster sudah aktif dan berjalan.
Exception: Cluster memasuki status Exception ketika node manajemen dihapus atau dihentikan, atau penjadwal dimatikan. Anda dapat mencoba memulihkan cluster. Jika cluster gagal dipulihkan, submit a ticket.
Releasing: Klaster sedang dimatikan dan akan segera dilepaskan.