Topik ini menjelaskan cara menyelesaikan masalah Mode Persistensi (Persistence-M) yang diaktifkan melalui perintah nvidia-smi -pm 1 namun tidak berfungsi, serta status elastic compute container (ECC) atau fitur multi-instance GPU (MIG) yang gagal dikonfigurasi setelah me-restart instance GPU-accelerated compute-optimized dengan driver Tesla versi 535 atau lebih baru.
Deskripsi Masalah
Setelah menginstal driver Tesla versi 535 atau lebih baru pada instance Linux GPU-accelerated compute-optimized dan menjalankan perintah nvidia-smi -pm 1 untuk mengaktifkan Mode Persistensi, muncul beberapa masalah berikut:
Mode Persistensi kembali ke keadaan
Offsetelah instance GPU-accelerated compute-optimized di-restart, menunjukkan bahwa Mode Persistensi dinonaktifkan.Status ECC gagal dikonfigurasi.
Fitur MIG gagal dikonfigurasi.
Penyebab
Ketidaksesuaian antara versi driver Tesla dan instance menyebabkan masalah ini. Ketika perintah nvidia-smi -pm 1 dijalankan untuk mengaktifkan Mode Persistensi dan instance GPU-accelerated compute-optimized di-restart, Mode Persistensi, status ECC, dan fitur MIG dapat menjadi tidak efektif.
Solusi
Jika log dmesg mencakup informasi terkait, aktifkan Mode Persistensi menggunakan NVIDIA Persistence Daemon. Untuk detail lebih lanjut, lihat langkah Aktifkan Mode Persistensi menggunakan NVIDIA Persistence Daemon dalam bagian "Langkah 2: Instal driver Tesla" dari topik "Instal secara manual driver Tesla pada instance Linux GPU-accelerated compute-optimized".
NVRM: Mode persistensi sudah tidak digunakan lagi dan akan dihapus di rilis mendatang. Harap gunakan nvidia-persistenced sebagai gantinya.