Jika Driver NVIDIA Tesla tidak diinstal secara otomatis pada instans Alibaba Cloud Linux 3 yang dioptimalkan untuk komputasi dengan akselerasi GPU saat pembuatan instans, Anda dapat menginstalnya secara manual. Proses ini melibatkan pengunduhan paket perangkat lunak, kompilasi dan instalasi driver, serta konfigurasi komponen terkait seperti Compute Unified Device Architecture (CUDA). Untuk mempercepat instalasi Driver NVIDIA Tesla dan komponen terkait seperti CUDA, PyTorch, dan TensorFlow, gunakan metode Yellowdog Updater Modified (YUM). Metode ini membantu memaksimalkan kemampuan komputasi tinggi GPU, meningkatkan efisiensi, dan memberikan efek tampilan grafis yang lebih halus.
Komunitas OpenAnolis menyediakan komponen terkait AI dalam sistem operasi Anolis. Alibaba Cloud Linux 3 dikembangkan berdasarkan Anolis 8 dan kompatibel dengan Anolis 8. Anda dapat menginstal paket perangkat lunak Anolis 8, seperti Driver NVIDIA Tesla, CUDA, PyTorch, dan TensorFlow, pada Alibaba Cloud Linux 3. Untuk informasi lebih lanjut, lihat Komunitas OpenAnolis. Dalam topik ini, versi berikut digunakan: Driver NVIDIA Tesla versi 525.105.17, CUDA versi 11.4, PyTorch versi 1.10.1, dan TensorFlow versi 2.5.0.
Persiapan
Topik ini hanya berlaku untuk instans Alibaba Cloud Linux 3 yang dioptimalkan untuk komputasi dengan akselerasi GPU di mana Driver NVIDIA Tesla belum diinstal. Untuk informasi lebih lanjut, lihat Keluarga Instans yang Dioptimalkan untuk Komputasi dengan Akselerasi GPU (seri gn, ebm, dan scc).
Sebelum menginstal Driver NVIDIA Tesla, buat instans yang dioptimalkan untuk komputasi dengan akselerasi GPU. Kemudian, konfigurasikan repositori epao untuk mendapatkan lebih banyak paket perangkat lunak dan instal paket kernel-devel untuk kernel sistem operasi saat ini. Ikuti langkah-langkah berikut:
Buat instans yang dioptimalkan untuk komputasi dengan akselerasi GPU.
Dalam contoh ini, digunakan instans dari keluarga instans gn6i yang dioptimalkan untuk komputasi dengan akselerasi GPU. Sistem operasi instans adalah Alibaba Cloud Linux 3, dan Driver NVIDIA Tesla belum diinstal. Untuk informasi lebih lanjut, lihat Buat Instans yang Dioptimalkan untuk Komputasi dengan Akselerasi GPU.
Sambungkan ke instans yang dioptimalkan untuk komputasi dengan akselerasi GPU.
Untuk informasi lebih lanjut, lihat Gunakan Workbench untuk Menyambungkan ke Instans Linux melalui SSH.
Jalankan perintah berikut untuk mengonfigurasi repositori epao guna mendapatkan lebih banyak paket perangkat lunak:
sudo yum install -y anolis-epao-releaseJalankan perintah berikut untuk memeriksa apakah paket kernel-devel untuk kernel sistem operasi saat ini telah diinstal:
sudo rpm -qa | grep kernel-develJika keluaran perintah seperti pada gambar berikut ditampilkan, paket kernel-devel untuk kernel sistem operasi telah diinstal.

Jika keluaran perintah sebelumnya tidak ditampilkan, instal paket kernel-devel.
Prosedur
Dalam kebanyakan kasus, ketika menginstal Driver NVIDIA Tesla, komponen CUDA, PyTorch, dan TensorFlow juga diinstal pada saat yang sama. Komponen-komponen tersebut adalah alat yang digunakan untuk mempercepat tugas pembelajaran mendalam dan pembelajaran mesin.
Jalankan perintah berikut untuk menginstal Driver NVIDIA Tesla:
sudo yum install -y nvidia-driver nvidia-driver-cuda
Instal Toolkit CUDA.
Jalankan perintah berikut untuk menginstal Toolkit CUDA:
sudo yum install -y cudaJalankan perintah
ll /usr/localuntuk melihat versi Toolkit CUDA.
Jalankan perintah berikut untuk menginstal PyTorch:
sudo yum install -y pytorch
Jalankan perintah berikut untuk menginstal TensorFlow:
sudo yum install -y tensorflow
Verifikasi hasil instalasi
Periksa Versi Driver NVIDIA Tesla yang Diinstal
Jalankan perintah
nvidia-smi. Jika driver dan komponen telah diinstal, Anda dapat melihat versi Driver NVIDIA Tesla yang diinstal.
Uji CUDA
Jalankan perintah
cduntuk masuk ke direktori tempat file sampel tes disimpan.Direktori
/usr/local/cuda-11.4/extras/demo_suite/berisi program sampel tes tertentu, seperti program sampel CUDA bernamadeviceQuery.
Jalankan perintah
sudo ./deviceQueryuntuk menanyakan informasi CUDA.Sebagai contoh, jalankan perintah untuk menanyakan informasi tentang memori tekstur, memori konstan, dan memori dibagi.

