全部产品
Search
文档中心

Elastic GPU Service:Apa yang harus saya lakukan jika Mode Persistensi yang saya aktifkan tidak berfungsi dan status ECC atau fitur MIG gagal dikonfigurasi setelah instance GPU-accelerated di-restart?

更新时间:Jul 06, 2025

Topik ini menjelaskan cara menyelesaikan masalah Mode Persistensi (Persistence-M) yang diaktifkan melalui perintah nvidia-smi -pm 1 namun tidak berfungsi, serta status elastic compute container (ECC) atau fitur multi-instance GPU (MIG) yang gagal dikonfigurasi setelah me-restart instance GPU-accelerated compute-optimized dengan driver Tesla versi 535 atau lebih baru.

Deskripsi Masalah

Setelah menginstal driver Tesla versi 535 atau lebih baru pada instance Linux GPU-accelerated compute-optimized dan menjalankan perintah nvidia-smi -pm 1 untuk mengaktifkan Mode Persistensi, muncul beberapa masalah berikut:

  • Mode Persistensi kembali ke keadaan Off setelah instance GPU-accelerated compute-optimized di-restart, menunjukkan bahwa Mode Persistensi dinonaktifkan.

  • Status ECC gagal dikonfigurasi.

  • Fitur MIG gagal dikonfigurasi.

Penyebab

Ketidaksesuaian antara versi driver Tesla dan instance menyebabkan masalah ini. Ketika perintah nvidia-smi -pm 1 dijalankan untuk mengaktifkan Mode Persistensi dan instance GPU-accelerated compute-optimized di-restart, Mode Persistensi, status ECC, dan fitur MIG dapat menjadi tidak efektif.

Solusi

Jika log dmesg mencakup informasi terkait, aktifkan Mode Persistensi menggunakan NVIDIA Persistence Daemon. Untuk detail lebih lanjut, lihat langkah Aktifkan Mode Persistensi menggunakan NVIDIA Persistence Daemon dalam bagian "Langkah 2: Instal driver Tesla" dari topik "Instal secara manual driver Tesla pada instance Linux GPU-accelerated compute-optimized".

NVRM: Mode persistensi sudah tidak digunakan lagi dan akan dihapus di rilis mendatang. Harap gunakan nvidia-persistenced sebagai gantinya.