Saat membuat cluster Elastic High Performance Computing (E-HPC), Anda harus mengonfigurasi perangkat keras, perangkat lunak, dan pengaturan dasarnya. Topik ini menjelaskan cara membuat cluster menggunakan wizard di konsol E-HPC.
Prasyarat
Peran terkait layanan untuk E-HPC telah dibuat. Saat pertama kali masuk ke konsol E-HPC, Anda akan diminta untuk membuat peran terkait layanan tersebut.
VPC virtual private cloud (VPC) dan vSwitch telah dibuat. Untuk informasi lebih lanjut, lihat Buat dan Kelola VPC dan Buat dan Kelola vSwitch.
File Storage NAS (NAS) telah diaktifkan. Sistem file NAS dan target mount telah dibuat. Untuk informasi lebih lanjut, lihat Buat Sistem File dan Kelola Target Mount.
Informasi latar belakang
Cluster menyediakan sumber daya komputasi dan penyimpanan. Anda dapat mengirim pekerjaan, men-debug pekerjaan, menyimpan hasil, dan melihat hasil di dalam cluster. Sebelum membuat dan menggunakan cluster E-HPC, perhatikan informasi berikut:
Anda dapat membuat hingga tiga cluster di satu wilayah. Untuk membuat lebih banyak cluster, ajukan tiket.
Anda akan dikenakan biaya layanan E-HPC dan biaya sumber daya lainnya saat membuat cluster. Untuk informasi lebih lanjut, lihat Item yang Dapat Ditagih.
Jangan gunakan konsol Elastic Compute Service (ECS) untuk mengelola node di dalam cluster. Kami sarankan Anda mengelola node di dalam cluster melalui konsol E-HPC, bukan melalui konsol Elastic Compute Service (ECS).
Langkah 1: Konfigurasikan pengaturan perangkat keras
Saat membuat cluster, Anda harus mengonfigurasi pengaturan perangkat keras cluster. Pengaturan perangkat keras menentukan performa cluster, termasuk wilayah, mode penyebaran, jumlah node, jenis jaringan, dan penyimpanan.
Anda dapat mengonfigurasi pengaturan perangkat keras sesuai dengan kebutuhan bisnis Anda.
Masuk ke E-HPC console.
Di bagian kiri bilah navigasi atas, pilih wilayah.
Di panel navigasi sisi kiri, klik Cluster.
Di halaman Cluster, klik Create Cluster.
Di langkah Hardware Configurations, konfigurasikan pengaturan perangkat keras. Tabel berikut menjelaskan parameter yang dapat dikonfigurasi.
Parameter
Deskripsi
Availability Zone
Zona tempat cluster berada.
CatatanUntuk memastikan komunikasi efisien antar node E-HPC, pastikan semua node berada di wilayah dan zona yang sama. Untuk informasi lebih lanjut, lihat Wilayah dan zona.
Pricing Model
Metode penagihan node di dalam cluster. Metode penagihan tidak berlaku untuk alamat IP elastis dan sistem file NAS.
Subscription: Anda dapat membeli atau memperpanjang node per minggu, bulan, atau tahun.
Pay-As-You-Go: Anda akan dikenakan biaya untuk node per jam.
Preemptible Instance: Hanya node komputasi yang mendukung instance preemptible. Baik node manajemen maupun node login hanya mendukung metode penagihan bayar sesuai pemakaian.
Untuk informasi lebih lanjut, lihat Ikhtisar metode penagihan ECS.
Deploy Mode
Mode penyebaran cluster. Nilai valid:
Standard: Node login, node manajemen, dan node komputasi ditempatkan secara terpisah.
Tiny: Node login dan node manajemen ditempatkan pada instance yang sama. Node komputasi ditempatkan secara terpisah.
PentingJika Anda ingin menggunakan Open Grid Scheduler (SGE), Anda harus menempatkan cluster dalam mode Kecil.
Tipe dan jumlah node
Tentukan tipe instance dan jumlah node berdasarkan mode penyebaran.
Tentukan tipe instance berdasarkan kebutuhan bisnis Anda. Jika Anda ingin menggunakan cluster untuk melakukan komputasi dinamika molekul, Anda dapat memilih tipe GPU untuk mempercepat analisis. Untuk informasi lebih lanjut, lihat Spesifikasi dan Praktik terbaik untuk pemilihan tipe instance.
CatatanUntuk membuat cluster yang dilengkapi dengan prosesor YiTian, pilih tipe instance yang dilengkapi dengan prosesor YiTian. Misalnya, Anda dapat memilih ecs.g8m.large. Keluarga instance g8m sedang dalam pratinjau undangan. Anda dapat pergi ke halaman Formulir Permohonan Uji Coba Gratis Instance g8m untuk mengajukan uji coba gratis.
Kami sarankan Anda menentukan spesifikasi instance node manajemen berdasarkan jumlah node komputasi.
Jika jumlah node komputasi di cluster kurang dari atau sama dengan 100, kami sarankan Anda memilih 16 vCPU atau lebih dan 64 GiB atau lebih memori.
Jika jumlah node komputasi di cluster kurang dari atau sama dengan 500, kami sarankan Anda memilih 32 vCPU atau lebih dan 128 GiB atau lebih memori.
Jika jumlah node komputasi di cluster lebih dari 500, kami sarankan Anda memilih 64 vCPU atau lebih dan 256 GiB atau lebih memori.
Node login dikonfigurasi sebagai lingkungan pengembangan. Node login menyediakan sumber daya yang diperlukan dan lingkungan pengujian kepada pengguna cluster untuk pengembangan perangkat lunak dan debugging. Kami sarankan Anda mengonfigurasi node login menggunakan rasio CPU-memori yang lebih tinggi atau sama dengan rasio CPU-memori node komputasi.
System Disk
Tipe disk cloud dan kapasitas semua disk sistem node. Nilai valid: 40 hingga 2000. Unit: GB.
CatatanUntuk mengonfigurasi disk sistem dengan kapasitas lebih dari 500 GB, ajukan tiket.
Perluas bagian Konfigurasi Lanjutan. Di bagian Konfigurasi Lanjutan, konfigurasikan pengaturan jaringan dan penyimpanan.
Parameter
Deskripsi
Authorized Instance Configurations
Aktif
Mengikat peran RAM ke node. Dengan cara ini, Anda dapat mengakses layanan Alibaba Cloud di node tersebut.
PentingSecara default, fitur ini dinonaktifkan. Untuk mengaktifkan fitur ini, ajukan tiket.
Setelah tiket disetujui, lakukan operasi berikut berdasarkan tipe pengguna Anda:
Akun Alibaba Cloud: Klik Switch to RAM for authorization untuk mengotorisasi pengguna saat ini menggunakan peran RAM default.
Pengguna RAM: Masuk ke konsol RAM menggunakan akun Alibaba Cloud dan pilih salah satu metode berikut untuk memberikan izin kepada pengguna RAM.
Tambahkan kebijakan kustom berikut dan lampirkan kebijakan tersebut ke pengguna RAM. Untuk informasi lebih lanjut, lihat Buat kebijakan kustom dan Berikan izin kepada pengguna RAM.
{ "Version": "1", "Statement": [ { "Effect": "Allow", "Action": [ "ram:PassRole", "ram:ListRoles" ], "Resource": "*" }, { "Effect": "Allow", "Action": "ecs:AttachInstanceRamRole", "Resource": "*" } ] }Berikan izin AliyunRAMFullAccess kepada pengguna RAM.
Izin AliyunRAMFullAccess digunakan untuk mengelola pengguna dan izin RAM. Izin ini memberikan lebih banyak hak istimewa dibandingkan kebijakan kustom. Untuk informasi lebih lanjut, lihat Buat pengguna RAM dan otorisasi pengguna RAM untuk mengakses Log Service.
Role Name
Peran RAM yang ingin Anda ikat ke node. Kami sarankan Anda memilih peran default AliyunECSInstanceForEHPCRole.
Node Type
Tipe node yang ingin Anda ikat peran RAM. Nilai valid:
Node Penjadwalan
Node Akun Domain
Node Login
Node Komputasi
CatatanJika Anda memilih Node Komputasi, node komputasi yang ditambahkan selama aktivitas penskalaan otomatis akan secara otomatis diikat ke peran RAM yang ditentukan.
Resource Group
Resource Group
Grup sumber daya tempat node cluster berada. Anda dapat menggunakan grup sumber daya untuk mengelola beberapa node cluster yang termasuk dalam akun Anda secara terpusat.
Networking
EIP
Alamat IP elastis (EIP) adalah alamat IP publik yang dapat Anda beli dan miliki secara terpisah. Jika Anda ingin mengakses cluster dari alamat IP statis, Anda dapat membeli dan mengikat EIP ke node login cluster.
Use: EIP secara otomatis dibuat dan diikat ke node login. Anda dapat mengakses cluster melalui Internet.
Do Not Use: Anda hanya dapat mengakses cluster melalui VPC.
CatatanAnda akan dikenakan biaya untuk menggunakan sumber daya EIP. Untuk informasi lebih lanjut, lihat Ikhtisar penagihan.
VPC dan vSwitch
VPC tempat cluster berada. VPC yang berbeda diisolasi secara logis satu sama lain. Anda dapat membuat dan mengelola cluster E-HPC di VPC.
Secara default, VPC dan vSwitch pertama dalam daftar drop-down VPC dan vSwitch dipilih. Pastikan jumlah alamat IP yang tersedia lebih besar dari jumlah node cluster.
Anda dapat mengklik Create VPC dan Create vSwitch (for subnet) untuk membuat VPC dan vSwitch. Untuk informasi lebih lanjut, lihat Buat dan kelola VPC dan Buat dan kelola vSwitch.
Create Security Group
Anda dapat mengonfigurasi aturan grup keamanan untuk mengelola lalu lintas masuk dan keluar node dalam grup keamanan.
Jika Anda menghidupkan saklar, Anda harus memasukkan nama grup keamanan baru di bidang Security Group Name.
Jika Anda mematikan saklar, Anda perlu memilih grup keamanan yang ada dari daftar drop-down Select Security Group.
Storage
Configure by Directory
Jika Anda mematikan Konfigurasikan berdasarkan Direktori, hanya satu sistem file yang dikonfigurasikan untuk cluster.
Jika Anda menghidupkan Konfigurasikan berdasarkan Direktori, sistem file dipasang ke direktori semua node. Ini meningkatkan kapasitas penyimpanan bersama cluster.
Type
Tipe sistem file. Nilai valid:
General-purpose NAS
Extreme NAS
File System IDdan Mount Point
Secara default, sistem file pertama dan titik mount dalam daftar drop-down ID Sistem File dan Titik Mount dipilih. Pastikan sistem file memiliki cukup titik mount.
Anda dapat mengklik Create a file system dan Create mount point untuk membuat sistem file dan titik mount.
Mount Configurations
Jika Anda memasang sistem file General-purpose NAS, Anda dapat memilih protokol mount. Nilai valid: Mount over NFSv3 dan Mount over NFSv4.
Remote Directory
Direktori jarak jauh tempat sistem file dipasang.
Langkah 2: Konfigurasikan pengaturan perangkat lunak
Pengaturan perangkat lunak mencakup citra dan penjadwal yang diinstal pada node serta layanan akun domain yang mengelola cluster dan pengguna cluster.
Setelah mengonfigurasi pengaturan perangkat keras, klik Next.
Di langkah Konfigurasi Perangkat Lunak, konfigurasikan pengaturan perangkat lunak. Tabel berikut menjelaskan parameter yang dapat dikonfigurasi.
Parameter
Deskripsi
Image Type dan Image
Pilih tipe citra berdasarkan kebutuhan bisnis Anda. Nilai valid:
Citra Publik
Citra Kustom
Citra Bersama
Citra Pasar Alibaba Cloud
Citra Komunitas
Jika Anda menetapkan Tipe Citra ke Citra Kustom, perhatikan batasan berikut:
E-HPC mendukung citra CentOS dan citra kustom yang dibuat berdasarkan citra Alibaba Cloud. Saat Anda mengimpor citra, pastikan Check After Import dipilih. Jika tidak, citra tidak dapat diidentifikasi di konsol E-HPC.
Anda tidak dapat menggunakan citra yang ada yang dihasilkan untuk cluster lain. Jika tidak, node komputasi mungkin tidak berjalan seperti yang diharapkan setelah cluster saat ini dibuat.
Anda tidak dapat memodifikasi konfigurasi repositori yum sistem operasi dalam citra kustom. Jika tidak, cluster tidak dapat dibuat atau diperluas.
Direktori mount citra kustom tidak boleh berupa direktori
/homeatau/opt.
Setelah Anda memilih tipe citra, Anda dapat memilih citra yang ingin digunakan. Citra yang berbeda berlaku untuk sistem operasi yang berbeda. Sistem menyebarkan node cluster berdasarkan citra yang Anda pilih.
PentingSistem secara otomatis menampilkan citra yang tersedia berdasarkan wilayah yang Anda pilih, sumber daya citra yang tersedia, dan citra yang didukung oleh tipe instance node.
Scheduler
Penjadwal membantu Anda mengelola pekerjaan, dan diterapkan pada cluster E-HPC.
E-HPC mendukung beberapa penjadwal. Namun, penjadwal yang berbeda berlaku untuk tipe citra yang berbeda. Konsol E-HPC menampilkan penjadwal yang didukung oleh tipe citra yang ditentukan.
Domain Service
Layanan akun domain berdasarkan mana cluster dan pengguna cluster dikelola. nis dan ldap didukung.
VNC
Jika Anda menghidupkan VNC, sistem secara otomatis mengaktifkan layanan Virtual Network Computing (VNC). Anda dapat mengakses konsol E-HPC di komputer lain menggunakan VNC.
Konfigurasikan pengaturan antrian dan skrip pasca-instalasi.
Parameter
Deskripsi
Queue Config
Create New Queue
E-HPC memungkinkan Anda mengategorikan node komputasi yang menjalankan pekerjaan berbeda atau melakukan tugas berbeda dengan menambahkan node tersebut ke antrian yang berbeda. Pekerjaan dijalankan dalam urutan yang ditentukan oleh antrian dan penjadwal yang ditentukan.
Default Queue: Node komputasi cluster secara otomatis ditambahkan ke antrian default dari penjadwal yang ditentukan. Misalnya, antrian default PBS adalah workq, dan antrian default slurm adalah comp.
New Queue: Anda harus memasukkan nama antrian di bidang Queue Name. Antrian secara otomatis dibuat, dan node komputasi yang ditentukan ditambahkan ke antrian.
Post-Install Script
Script URL
URL yang digunakan untuk mengunduh skrip setelah cluster dibuat.
CatatanAnda dapat mengunduh skrip melalui HTTP atau HTTPS. Kami sarankan Anda menyimpan skrip di bucket Object Storage Service (OSS) publik.
Arguments
Parameter runtime skrip. Untuk informasi lebih lanjut, lihat Konfigurasikan skrip instalasi.
Langkah 3: Konfigurasikan pengaturan dasar
Setelah mengonfigurasi pengaturan perangkat lunak, klik Next.
Di langkah Konfigurasi Dasar, konfigurasikan pengaturan dasar. Tabel berikut menjelaskan parameter yang dapat dikonfigurasi.
Parameter
Deskripsi
Cluster Name
Nama cluster. Nama cluster ditampilkan di halaman Cluster.
Logon Password dan Repeat Password
Kata sandi cluster. Kata sandi diperlukan saat Anda menggunakan SSH untuk mengakses node login cluster secara remote. Nama pengguna adalah root.
Di bagian Configuration List, periksa parameter yang telah dikonfigurasi. Baca dan setujui Alibaba Cloud International Website Product Terms of Service, lalu klik OK.
Periksa hasilnya
Setelah membuat cluster, Anda dapat memeriksa status cluster di halaman Cluster. Jika cluster dan semua node cluster berada dalam keadaan Running, cluster telah berhasil dibuat.