Saat menginstal driver NVIDIA pada sebuah node, Anda harus menggunakan versi driver yang didukung oleh ACK. Topik ini mencantumkan versi driver NVIDIA yang didukung oleh ACK.
Pengenalan CUDA
CUDA adalah platform komputasi paralel dan model pemrograman yang diperkenalkan oleh NVIDIA pada tahun 2007. CUDA memanfaatkan graphics processing unit (GPU) untuk meningkatkan performa komputasi secara signifikan.
Gambar berikut menunjukkan arsitektur CUDA. Tumpukan perangkat lunak CUDA mencakup API lapisan driver dan API lapisan waktu proses, yang berbeda dalam hal-hal berikut:
Driver API: API ini kaya fitur tetapi kompleks penggunaannya.
CUDA Runtime API: API ini mengenkapsulasi beberapa API driver, menyembunyikan sejumlah operasi inisialisasi driver, dan lebih mudah digunakan.
CUDA Driver API disediakan oleh paket NVIDIA Driver. CUDA Library dan CUDA Runtime disediakan oleh paket CUDA Toolkit.

Kompatibilitas versi driver dan kluster
Tabel berikut mencantumkan versi driver GPU NVIDIA yang didukung oleh berbagai versi kluster ACK.
Untuk kluster ACK Lingjun dan Node Lingjun di kluster ACK Pro, driver GPU telah dibangun ke dalam citra sistem operasi (OS). Anda tidak dapat menggunakan label node untuk menginstal versi driver GPU tertentu. Demikian pula, untuk kelompok node edge di kluster ACK Edge, Anda tidak dapat menggunakan label node untuk menginstal versi driver GPU tertentu.
Versi driver 510 dan yang lebih baru kadang-kadang dapat menyebabkan error XID 119 atau XID 120. Jika Anda mengalami error tersebut, lihat Apa yang harus saya lakukan jika terjadi error XID 119 atau XID 120 sehingga kartu GPU menjadi tidak tersedia saat saya menggunakan GPU? untuk informasi pemecahan masalah.
Versi driver 550 memperbaiki masalah pada beberapa aplikasi, seperti error XID 119, 120, atau 31 yang sering terjadi serta kernel panics. Tingkatkan node GPU yang ada ke versi driver 550.
ACK secara berkala memperbarui versi driver default untuk berbagai versi kluster. Hal ini dapat menyebabkan versi driver pada node GPU yang baru ditambahkan ke kluster Anda berubah. Untuk mencegah hal ini, Anda dapat menentukan versi driver untuk kelompok node di kluster Anda. Untuk informasi selengkapnya, lihat Menyesuaikan versi driver GPU untuk sebuah node dengan menentukan nomor versi.
Saat membuat kelompok node, jika versi driver yang Anda tentukan tidak tercantum dalam Kompatibilitas versi driver dan kernel sistem operasi, ACK akan secara otomatis menginstal versi driver default. Jika Anda menentukan versi driver yang tidak kompatibel dengan sistem operasi terbaru, node mungkin gagal bergabung ke kluster. Dalam kasus ini, Anda harus memilih versi driver terbaru yang didukung.
Setelah Anda meningkatkan versi kernel OS, driver GPU yang terinstal pada node mungkin menjadi tidak tersedia. Untuk mengatasi masalah ini, Anda dapat menghapus node dari kelompok node lalu menambahkannya kembali, atau meningkatkan driver GPU node secara manual.
Saat menggunakan komponen pemantauan dengan versi driver 570 atau yang lebih baru, versi komponen harus ack-arms-prometheus 1.1.33 atau yang lebih baru dan ack-gpu-exporter 2.3.0 atau yang lebih baru.
Jika Anda menyesuaikan versi driver GPU untuk node dalam kelompok node dengan menentukan nomor versi atau menggunakan URL OSS, sistem operasi dan versi driver mungkin menjadi tidak kompatibel setelah Anda meningkatkan citra OS. Lihat Versi driver NVIDIA yang didukung oleh ACK dan pilih driver kompatibel terbaru.
Versi kluster | Versi driver default | Mendukung versi driver kustom | Versi driver NVIDIA yang didukung |
1.28 dan yang lebih baru | 535.161.07 570.169 (untuk tipe instans ecs.gn9t dan ecs.ebmgn9t) | Ya |
Versi driver berikut tidak kompatibel dengan sistem operasi terbaru.
|
1.26 | Ya | ||
1.24 | Ya | ||
1.22 | Ya | ||
1.20 | Ya |
| |
1.18.8 | 418.181.07 | Ya | |
1.16.9 | 418.181.07 | Ya | |
1.16.6 | 418.87.01 | Tidak | |
1.14.8 | 418.181.07 | Ya |
Kompatibilitas driver, kartu GPU, dan tipe instans
Kompatibilitas versi driver dan versi kernel sistem operasi
Untuk informasi selengkapnya tentang pemetaan antara versi kernel dan ID citra, lihat Pemetaan antara versi kernel dan ID citra.
Versi driver | Alibaba Cloud Linux 2 | Alibaba Cloud Linux 3 | CentOS | Ubuntu |
570.169 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang tidak didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
570.133.20 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang tidak didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
550.163.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
550.144.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
550.90.07 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
550.54.15 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
550.54.14 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
535.247.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
535.230.02 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
535.161.07 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
535.129.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
535.98 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
535.54.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
525.147.05 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
525.105.17 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
515.105.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
515.86.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
510.108.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
510.54 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
510.47.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
470.256.02 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, ∞) |
470.161.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-17.3.al8.x86_64] Rentang yang tidak didukung: [5.10.134-18.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
470.103.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
470.82.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
470.57.02 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
460.106.00 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang didukung: [5.15.0-40-generic, 5.15.0-101-generic] Rentang yang tidak didukung: [5.15.0-106-generic, ∞) |
460.91.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
460.73.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
460.32.03 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
450.119.04 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
450.102.04 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang didukung: [5.10.23-5.al8.x86_64, 5.10.134-14.al8.x86_64] Rentang yang tidak didukung: [5.10.134-15.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
450.80.02 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
440.33.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
418.181.07 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
418.113 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
418.87.01 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
410.93 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, 4.19.91-18.al7.x86_64] Rentang yang tidak didukung: [4.19.91-19.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, 3.10.0-957.21.3.el7.x86_64] Rentang yang tidak didukung: [3.10.0-1062.9.1.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
410.79 | Rentang yang didukung: [4.19.81-17.1.al7.x86_64, 4.19.91-18.al7.x86_64] Rentang yang tidak didukung: [4.19.91-19.1.al7.x86_64, ∞) | Rentang yang tidak didukung: [5.10.23-5.al8.x86_64, ∞) | Rentang yang didukung: [3.10.0-862.14.4.el7.x86_64, 3.10.0-957.21.3.el7.x86_64] Rentang yang tidak didukung: [3.10.0-1062.9.1.el7.x86_64, ∞) | Rentang yang tidak didukung: [5.15.0-40-generic, ∞) |
Kompatibilitas driver dan CUDA Toolkit
Anda dapat memilih versi driver NVIDIA yang sesuai berdasarkan versi CUDA Toolkit yang digunakan aplikasi Anda dan daftar kompatibilitas antara versi CUDA Toolkit dan versi driver NVIDIA. Untuk informasi selengkapnya, lihat cuda-toolkit-release-notes.
Mendapatkan versi API lapisan driver
Jika paket driver NVIDIA terinstal pada sebuah node, Anda dapat menjalankan perintah nvidia-smi untuk melihat versi driver dan versi API driver CUDA. Pada contoh berikut, versi driver yang terinstal adalah 550.144.03 dan versi API driver adalah 12.6, yang menunjukkan bahwa driver tersebut mendukung versi API waktu proses CUDA hingga 12.6.
Mon Mar 24 08:51:55 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.144.03 Driver Version: 550.144.03 CUDA Version: 12.6 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 Tesla P4 On | 00000000:00:07.0 Off | 0 |
| N/A 33C P8 7W / 75W | 0MiB / 7680MiB | 0% Default |
| | | N/A |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+Mendapatkan versi API waktu proses
Saat menginstal CUDA Toolkit dalam gambar kontainer, Anda dapat menggunakan citra dasar CUDA yang disediakan oleh NVIDIA. CUDA Toolkit telah dipra-instal dalam citra dasar ini. Anda dapat membuat gambar kontainer aplikasi Anda berdasarkan citra dasar tersebut, serta memilih citra dasar CUDA yang sesuai dengan versi CUDA Toolkit yang dibutuhkan.
Saat menggunakan GPU dalam kontainer, versi API waktu proses CUDA yang digunakan oleh aplikasi Anda ditentukan oleh citra dasar CUDA dari gambar Docker aplikasi tersebut. Misalnya, jika gambar Docker aplikasi Anda dibuat berdasarkan citra dasar CUDA NVIDIA/CUDA:12.2.0-base-Ubuntu20.04, maka versi API waktu proses CUDA yang digunakan aplikasi adalah 12.2.0.