Container Service for Kubernetes (ACK) Edge clusters memungkinkan pengelolaan sumber daya GPU lokal di dalam pool node edge. Topik ini menjelaskan cara menambahkan node yang dipercepat GPU ke pool node edge di ACK Edge cluster.
Prasyarat
Driver GPU telah diinstal di cluster sebelum node ditambahkan. Untuk informasi lebih lanjut tentang versi driver, lihat Versi driver NVIDIA yang didukung oleh ACK.
Batasan
Pastikan kluster Anda memiliki kuota node yang cukup. Untuk menambahkan lebih banyak node, ajukan permintaan untuk meningkatkan kuota. Untuk informasi lebih lanjut tentang batasan kuota ACK Edge cluster, lihat Kuota dan batasan.
Saat menambahkan node yang dipercepat GPU, akses ke beberapa titik akhir diperlukan. Anda harus mengonfigurasi grup keamanan di sisi node untuk menghapus batasan apa pun dan mengizinkan akses ini. Untuk informasi lebih lanjut, lihat Konfigurasi nama domain dan segmen jaringan routing IP untuk akses node edge.
Prosedur
Kubernetes 1.26 atau yang lebih baru
Saat menambahkan node yang dipercepat GPU dengan GPU NVIDIA ke ACK Edge cluster yang menjalankan Kubernetes 1.26 atau yang lebih baru, Anda tidak perlu mengonfigurasi parameter gpuVersion. Sistem secara otomatis memeriksa model GPU dan menginstal komponen terkait.
Langkah-langkah untuk menambahkan node yang dipercepat GPU mirip dengan langkah-langkah untuk menambahkan node edge. Untuk informasi lebih lanjut, lihat Tambahkan node edge.
ACK Edge cluster yang menjalankan Kubernetes 1.26 atau yang lebih baru mendukung semua seri GPU produksi kelas atas dari NVIDIA, termasuk Tesla, Hopper, Ada Lovelace, dan L.
Versi Kubernetes lebih awal dari 1.26
Saat menambahkan node yang dipercepat GPU ke ACK Edge cluster yang menjalankan versi Kubernetes lebih lama dari 1.26, model GPU harus memenuhi persyaratan dalam tabel berikut. Jika ingin menggunakan model GPU yang tidak memenuhi persyaratan berikut, submit a ticket.
Arsitektur OS | Model GPU | Versi Kubernetes |
AMD64/x86_64 | Nvidia_Tesla_T4 | ≥1.16.9-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_P4 | ≥1.16.9-aliyunedge.1 |
Nvidia_Tesla_P100 | ≥1.16.9-aliyunedge.1 | |
AMD64/x86_64 | Nvidia_Tesla_V100 | ≥1.18.8-aliyunedge.1 |
AMD64/x86_64 | Nvidia_Tesla_A10 | ≥1.20.11-aliyunedge.1 |
AMD64/x86_64 | Nvidia_L40 | ≥1.26.3-aliyun.1 |
Masuk ke ACK console. Di panel navigasi di sebelah kiri, klik Clusters.
Di halaman Clusters, temukan kluster yang ingin dikelola dan klik namanya. Di panel navigasi di sebelah kiri, pilih .
Di halaman Node Pools, temukan pool node yang ingin dikelola dan pilih
> Add Existing Node di kolom Actions.Di halaman Add Existing ECS Instance, pilih Manual sebagai Method dan kemudian pilih instance yang ada.
Klik Next Step untuk masuk ke langkah Specify Instance Information. Anda dapat mengatur parameter yang digunakan untuk menambahkan node. Untuk informasi lebih lanjut tentang parameter, lihat Parameters.
CatatanAnda harus mengonfigurasi parameter
gpuVersiondalam skrip untuk menghubungkan node ke cloud. Untuk informasi lebih lanjut tentang model GPU yang didukung, lihat Batasan.Setelah mengonfigurasi parameter, alat koneksi secara otomatis menginstal nvidia-containerd-runtime. Untuk informasi lebih lanjut, lihat nvidia-containerd-runtime.
Setelah mengatur parameter, klik Next Step. Di langkah Complete, klik Copy untuk menyalin skrip ke node edge yang ingin ditambahkan. Kemudian, jalankan skrip pada node tersebut.
Jika hasil berikut dikembalikan, node telah berhasil ditambahkan ke kluster.

Referensi
Jika Anda mengalami masalah saat menambahkan node edge, lihat Diagnosis masalah node edge.
Untuk informasi lebih lanjut tentang cara menghapus node edge, lihat Hapus node edge.
ACK Edge clusters mendukung otonomi node edge. Otonomi node edge memastikan bahwa aplikasi pada node edge tetap dapat berjalan seperti yang diharapkan ketika node edge terputus dari cloud. Untuk informasi lebih lanjut, lihat Konfigurasi otonomi node edge.