全部产品
Search
文档中心

:Instal komponen ack-cgpu

更新时间:Jul 06, 2025

Container Service for Kubernetes menyediakan fitur berbagi GPU yang memungkinkan beberapa model prediksi untuk berbagi satu GPU dan mendukung isolasi memori GPU berdasarkan driver mode kernel NVIDIA. Dokumen ini menjelaskan cara menginstal komponen ack-cgpu, yang digunakan untuk berbagi GPU, mengisolasi memori GPU, serta menanyakan informasi alokasi GPU.

Prasyarat

Batasan

Jangan atur kebijakan CPU ke static untuk node yang mengaktifkan berbagi GPU.

Tabel berikut menjelaskan batasan lainnya.

Item

Persyaratan

Kubernetes

Kubernetes 1.12.6 atau lebih baru

Sistem operasi

Sistem operasi yang didukung oleh ACK kecuali Windows

Model GPU

Untuk informasi lebih lanjut tentang model GPU yang didukung oleh ACK, lihat Tipe instance ECS dengan akselerasi GPU yang didukung oleh ACK

Langkah 1: Tambahkan label ke node dengan akselerasi GPU

  1. Masuk ke Konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.

  2. Di halaman Clusters, klik nama klaster yang ingin Anda ubah. Di panel navigasi sebelah kiri, pilih Nodes > Nodes.

  3. Di pojok kanan atas halaman Nodes, klik Manage Labels and Taints.

  4. Pada tab Label halaman Manage Labels and Taints, pilih node yang ingin Anda kelola dan klik Add Label.

  5. Di kotak dialog Add, konfigurasikan parameter Name dan Value, lalu klik OK.

    Untuk mengaktifkan cGPU, atur parameter Name menjadi cgpu dan parameter Value menjadi true.

Penting

Untuk menonaktifkan cGPU, atur parameter Name menjadi cgpu dan parameter Value menjadi false. Anda tidak dapat menonaktifkan cGPU dengan menghapus label cgpu.

Langkah 2: Instal komponen ack-cgpu pada node yang diberi label

  1. Di halaman Clusters, temukan klaster yang Anda inginkan dan klik namanya. Di panel navigasi sebelah kiri, pilih Applications > Helm.

  2. Di pojok kiri atas halaman Helm, klik Deploy. Di panel Deploy, pilih ack-cgpu untuk parameter Chart dan konfigurasikan parameter lainnya sesuai instruksi di layar untuk menginstal komponen ack-cgpu.

    Di halaman Helm, jika status dari ack-cgpu berubah menjadi Deployed, maka ack-cgpu telah diterapkan.