Container Service for Kubernetes menyediakan fitur berbagi GPU yang memungkinkan beberapa model prediksi untuk berbagi satu GPU dan mendukung isolasi memori GPU berdasarkan driver mode kernel NVIDIA. Dokumen ini menjelaskan cara menginstal komponen ack-cgpu, yang digunakan untuk berbagi GPU, mengisolasi memori GPU, serta menanyakan informasi alokasi GPU.
Prasyarat
Klaster khusus ACK yang berisi node dengan akselerasi GPU telah dibuat. Untuk informasi lebih lanjut, lihat Buat klaster ACK dengan node akselerasi GPU.
Klien kubectl terhubung ke klaster. Untuk informasi lebih lanjut, lihat Dapatkan file kubeconfig dari klaster dan gunakan kubectl untuk terhubung ke klaster.
Batasan
Jangan atur kebijakan CPU ke static untuk node yang mengaktifkan berbagi GPU.
Tabel berikut menjelaskan batasan lainnya.
Item | Persyaratan |
Kubernetes | Kubernetes 1.12.6 atau lebih baru |
Sistem operasi | Sistem operasi yang didukung oleh ACK kecuali Windows |
Model GPU | Untuk informasi lebih lanjut tentang model GPU yang didukung oleh ACK, lihat Tipe instance ECS dengan akselerasi GPU yang didukung oleh ACK |
Langkah 1: Tambahkan label ke node dengan akselerasi GPU
Masuk ke Konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.
Di halaman Clusters, klik nama klaster yang ingin Anda ubah. Di panel navigasi sebelah kiri, pilih .
Di pojok kanan atas halaman Nodes, klik Manage Labels and Taints.
Pada tab Label halaman Manage Labels and Taints, pilih node yang ingin Anda kelola dan klik Add Label.
Di kotak dialog Add, konfigurasikan parameter Name dan Value, lalu klik OK.
Untuk mengaktifkan cGPU, atur parameter Name menjadi cgpu dan parameter Value menjadi true.
Untuk menonaktifkan cGPU, atur parameter Name menjadi cgpu dan parameter Value menjadi false. Anda tidak dapat menonaktifkan cGPU dengan menghapus label cgpu.
Langkah 2: Instal komponen ack-cgpu pada node yang diberi label
Di halaman Clusters, temukan klaster yang Anda inginkan dan klik namanya. Di panel navigasi sebelah kiri, pilih .
Di pojok kiri atas halaman Helm, klik Deploy. Di panel Deploy, pilih ack-cgpu untuk parameter Chart dan konfigurasikan parameter lainnya sesuai instruksi di layar untuk menginstal komponen ack-cgpu.
Di halaman Helm, jika status dari ack-cgpu berubah menjadi Deployed, maka ack-cgpu telah diterapkan.