Kelompok node edge di kluster ACK Edge memungkinkan Anda mengelola sumber daya GPU on-premises. Topik ini menjelaskan cara menambahkan node GPU ke kelompok node edge dalam kluster ACK Edge.
Prasyarat
-
Anda harus menginstal driver GPU sebelum menambahkan node. Untuk informasi selengkapnya tentang versi driver yang didukung, lihat Versi driver NVIDIA yang didukung untuk ACK.
Batasan
-
Pastikan kluster Anda memiliki kuota node yang mencukupi. Untuk menambahkan lebih banyak node, ajukan permintaan di Quota Center untuk menambah kuota. Untuk informasi selengkapnya tentang batasan kuota kluster ACK Edge, lihat Kuota dan batasan.
-
Saat menambahkan node GPU, node tersebut harus dapat mengakses Nama domain tertentu. Pastikan security group node mengizinkan akses ke Nama domain tersebut. Untuk informasi selengkapnya, lihat Nama domain dan Blok CIDR IP untuk pendaftaran node.
Prosedur
Kluster versi 1.26 atau lebih baru
Mulai dari versi 1.26, kluster ACK Edge secara otomatis mendeteksi model GPU dan menginstal komponen yang diperlukan selama pendaftaran GPU NVIDIA. Anda tidak perlu mengonfigurasi parameter gpuVersion.
Proses penambahan node GPU sama dengan penambahan node edge lainnya. Untuk informasi selengkapnya, lihat Tambahkan node edge.
Kluster ACK Edge versi 1.26 dan lebih baru mendukung seluruh rangkaian GPU NVIDIA kelas produksi, seperti seri Tesla, Hopper (seri-H), Ada Lovelace (seri-A), dan seri-L.
Kluster versi sebelum 1.26
Saat menambahkan node GPU ke kluster ACK Edge versi sebelum 1.26, Anda harus memilih model GPU dari daftar berikut. Jika Anda memerlukan model GPU yang berbeda, ajukan tiket.
|
System architecture |
GPU model |
Edge Kubernetes cluster version |
|
AMD64/x86_64 |
Nvidia_Tesla_T4 |
≥1.16.9-aliyunedge.1 |
|
AMD64/x86_64 |
Nvidia_Tesla_P4 |
≥1.16.9-aliyunedge.1 |
|
AMD64/x86_64 |
Nvidia_Tesla_P100 |
≥1.16.9-aliyunedge.1 |
|
AMD64/x86_64 |
Nvidia_Tesla_V100 |
≥1.18.8-aliyunedge.1 |
|
AMD64/x86_64 |
Nvidia_Tesla_A10 |
≥1.20.11-aliyunedge.1 |
|
AMD64/x86_64 |
Nvidia_L40 |
≥1.26.3-aliyun.1 |
Masuk ke Container Service Management Console . Di panel navigasi sebelah kiri, klik Clusters.
Pada halaman Clusters, klik nama kluster Anda. Di panel navigasi sebelah kiri, klik .
-
Pada halaman Node Pools, temukan kelompok node yang ingin Anda kelola, lalu pada kolom Actions, pilih
> Add Existing Node. -
Pada halaman Add Node, klik Manual untuk menambahkan instans yang sudah ada.
-
Klik Next. Pada halaman Instance Information, konfigurasikan parameter untuk pendaftaran node. Untuk informasi selengkapnya mengenai parameter tersebut, lihat Daftar parameter.
Catatan-
Saat menghasilkan skrip pendaftaran node, atur parameter
gpuVersion. Untuk informasi selengkapnya tentang versi GPU yang didukung, lihat Batasan. -
Setelah parameter ini dikonfigurasi, tool pendaftaran akan secara otomatis menginstal nvidia-containerd-runtime. Untuk informasi selengkapnya, lihat nvidia-containerd-runtime.
-
-
Setelah konfigurasi selesai, klik Next. Pada halaman Complete, klik Copy, lalu tempel dan jalankan skrip tersebut pada node edge Anda.
Gambar berikut menunjukkan bahwa node berhasil ditambahkan.

Referensi
-
Jika Anda mengalami masalah saat menambahkan node edge, lihat Pemecahan masalah node edge.
-
Untuk menghapus node edge yang tidak digunakan, lihat Hapus node edge.
-
Untuk mengaktifkan operasi otonom pada node edge agar beban kerja tetap berjalan stabil saat terjadi pemutusan jaringan antara cloud dan edge, lihat Konfigurasi otonomi node edge.