Topik ini menjawab pertanyaan umum mengenai Elastic GPU Service dan dapat digunakan untuk memecahkan serta menyelesaikan masalah pada instans yang dipercepat GPU Anda.
Kategori | Pertanyaan terkait |
Instans GPU-accelerated | |
Kartu GPU | |
Driver GPU | |
Pemantauan GPU | |
Lainnya |
Apakah instans yang dipercepat GPU mendukung emulator Android?
Tidak, hanya beberapa instans GPU-accelerated yang mendukung emulator Android.
Emulator Android hanya didukung pada keluarga Instans ECS Bare Metal berikut yang dioptimalkan untuk komputasi dengan akselerasi GPU: ebmgn7e, ebmgn7i, ebmgn7, ebmgn6ia, ebmgn6e, ebmgn6v, ebmgn6i.
Dapatkah konfigurasi instans GPU-accelerated diubah?
Anda hanya dapat mengubah konfigurasi beberapa instans yang dipercepat GPU.
Untuk informasi lebih lanjut mengenai tipe instans yang mendukung perubahan konfigurasi, lihat Batasan dan pemeriksaan perubahan tipe instans.
Dapatkah keluarga instans ECS standar ditingkatkan atau diubah menjadi keluarga instans GPU-accelerated?
Tidak, Anda tidak dapat langsung meningkatkan atau mengubah keluarga instans ECS standar menjadi keluarga instans GPU-accelerated.
Untuk informasi lebih lanjut mengenai tipe instans yang mendukung perubahan konfigurasi, lihat Batasan dan pemeriksaan perubahan tipe instans.
Bagaimana cara mentransfer data antara instans GPU-accelerated dan instans ECS standar?
Tidak diperlukan pengaturan khusus untuk mentransfer data.
Instans GPU-accelerated memberikan pengalaman pengguna yang sama seperti instans ECS standar, tetapi dengan tambahan akselerasi GPU. Secara default, instans GPU-accelerated dan instans ECS dalam grup keamanan yang sama dapat berkomunikasi melalui jaringan internal tanpa memerlukan konfigurasi khusus.
Apa perbedaan antara GPU dan CPU?
Tabel berikut membandingkan GPU dan CPU.
Perbandingan | GPU | CPU |
Arithmetic Logic Unit (ALU) | Memiliki banyak ALU yang unggul dalam menangani komputasi konkuren berskala besar. | Memiliki beberapa ALU yang kuat. |
Unit kontrol | Memiliki unit kontrol yang relatif sederhana. | Memiliki unit kontrol yang kompleks. |
Cache | Memiliki cache kecil yang melayani thread alih-alih menyimpan data yang diakses. | Memiliki struktur cache besar yang dapat menyimpan data untuk meningkatkan kecepatan akses dan mengurangi latensi. |
Metode respons | Mengintegrasikan semua tugas sebelum pemrosesan batch. | Merespons tugas individual secara real-time. |
Skenario | Cocok untuk skenario komputasi throughput tinggi paralel multi-threaded yang komputasi-intensif, sangat mirip, dan berulang. | Cocok untuk skenario komputasi serial yang logikanya kompleks dan memerlukan waktu respons cepat. |
Setelah saya membeli instans GPU-accelerated, mengapa perintah nvidia-smi tidak dapat menemukan kartu GPU?
Penyebab: Jika perintah nvidia-smi tidak dapat menemukan kartu GPU, hal ini karena driver Tesla atau GRID belum diinstal atau instalasinya gagal pada instans GPU-accelerated Anda.
Solusi: Untuk menggunakan fitur berkinerja tinggi dari instans GPU-accelerated Anda, Anda harus menginstal driver yang sesuai dengan tipe instans Anda. Petunjuk berikut menjelaskan cara menginstal driver:
Untuk instans vGPU-accelerated, Anda harus menginstal driver GRID. Untuk informasi lebih lanjut, lihat:
Untuk instans komputasi yang dioptimalkan dengan percepatan GPU, Anda dapat menginstal driver Tesla atau GRID. Untuk informasi lebih lanjut, lihat:
Bagaimana cara melihat detail kartu GPU?
Langkah-langkah untuk melihat detail kartu GPU bervariasi tergantung sistem operasinya. Petunjuk berikut menjelaskan cara melihat detail tersebut:
Pada Linux, Anda dapat menjalankan perintah
nvidia-smiuntuk melihat detail kartu GPU.Pada Windows, Anda dapat melihat detail kartu GPU di .
Untuk melihat informasi seperti laju idle GPU, penggunaan, suhu, dan daya, buka Konsol CloudMonitor. Untuk informasi selengkapnya, lihat Pemantauan GPU.
Driver apa yang perlu saya instal untuk instans vGPU-accelerated?
Instans vGPU-accelerated memerlukan driver GRID.
Untuk skenario komputasi umum atau akselerasi grafis, Anda dapat memuat driver GRID saat membuat instans GPU-accelerated, atau menginstalnya menggunakan Asisten Cloud setelah pembuatan. Petunjuk berikut menjelaskan cara menginstal driver:
Muat driver GRID saat membuat instans baru. Untuk informasi selengkapnya, lihat Muat driver GRID dari citra dengan driver pra-instal.
Instal driver GRID menggunakan Asisten Cloud setelah membuat instans. Untuk informasi selengkapnya, lihat:
Dapatkah saya meningkatkan CUDA ke versi 12.4 atau driver NVIDIA ke versi 550 atau lebih baru pada instans vGPU-accelerated?
Hal ini tidak didukung.
Instans vGPU-accelerated bergantung pada driver GRID yang disediakan platform. Versi drivernya dibatasi, dan Anda tidak dapat menginstal driver dari situs web resmi NVIDIA. Untuk melakukan peningkatan, Anda harus menggunakan instans GPU-accelerated seri gn atau ebm.
Driver apa yang perlu saya instal untuk menggunakan alat seperti OpenGL dan Direct3D guna akselerasi grafis pada instans komputasi yang dioptimalkan dengan percepatan GPU?
Instal driver berdasarkan sistem operasi instans GPU-accelerated Anda. Petunjuk berikut menjelaskan cara menginstal driver:
Untuk instans komputasi yang dioptimalkan dengan percepatan GPU berbasis Linux, instal driver Tesla. Untuk informasi lebih lanjut, lihat:
Untuk instans komputasi yang dioptimalkan dengan percepatan GPU berbasis Windows, instal driver GRID. Untuk informasi lebih lanjut, lihat:
Mengapa versi CUDA yang saya lihat setelah instalasi berbeda dari versi yang saya pilih saat membuat instans GPU-accelerated?
Versi CUDA yang dikembalikan oleh perintah nvidia-smi menunjukkan versi CUDA tertinggi yang didukung oleh instans GPU-accelerated Anda. Ini tidak merepresentasikan versi CUDA yang Anda pilih saat membuat instans.
Setelah saya menginstal driver GRID pada instans GPU-accelerated Windows, apa yang harus saya lakukan jika muncul layar hitam saat menggunakan koneksi VNC dari konsol?
Penyebab: Setelah Anda menginstal driver GRID pada instans GPU-accelerated Windows, driver GRID mengambil alih output tampilan mesin virtual (VM). VNC tidak lagi dapat memperoleh gambar dari grafis terintegrasi. Hal ini menyebabkan layar hitam, yang merupakan perilaku yang diharapkan.
Solusi: Sambungkan ke instans GPU-accelerated menggunakan Workbench. Untuk informasi lebih lanjut, lihat Masuk ke instans Windows menggunakan Workbench.
Bagaimana cara mendapatkan Lisensi GRID?
Metode untuk mendapatkan lisensi tergantung pada sistem operasi Anda. Petunjuk berikut menjelaskan cara mendapatkan lisensi:
Untuk menginstal driver GRID pada instans GPU-accelerated Windows, Anda dapat memperoleh lisensi dari citra driver pra-instal atau melalui instalasi manual.
Untuk menginstal driver GRID pada instans yang dipercepat GPU berbasis Linux, Anda dapat memperoleh lisensi dari citra driver pra-instal atau menggunakan Asisten Cloud.
Bagaimana cara meningkatkan driver GPU (Tesla atau GRID)?
Anda tidak dapat langsung meningkatkan driver GPU (Tesla atau GRID). Anda harus terlebih dahulu menguninstall versi lama, me-restart sistem, lalu menginstal versi baru. Untuk informasi lebih lanjut, lihat Tingkatkan driver Tesla atau GRID.
Lakukan peningkatan driver di luar jam sibuk. Sebelum meningkatkan, buat snapshot untuk mencadangkan data disk guna mencegah kehilangan data. Untuk informasi lebih lanjut, lihat Buat snapshot.
Apa yang harus saya lakukan jika sistem crash dengan error kernel NULL pointer dereference setelah saya menginstal driver NVIDIA versi 570.124.xx (Linux) atau 572.61 (Windows)?
Gejala: Pada beberapa tipe instans, sistem melaporkan error
kernel NULL pointer dereferencesaat Anda menginstal driver NVIDIA versi 570.124.xx (Linux) atau 572.61 (Windows), atau saat menjalankan perintahnvidia-smisetelah instalasi. Log berikut menunjukkan error tersebut:Solusi: Hindari menggunakan driver versi 570.124.xx (Linux) atau 572.61 (Windows). Kami menyarankan Anda menggunakan versi 570.133.20 (Linux) atau 572.83 (Windows) atau yang lebih baru.
Bagaimana cara melihat penggunaan sumber daya (vCPU, lalu lintas jaringan, bandwidth, dan disk) dari instans GPU-accelerated?
Anda dapat menggunakan salah satu metode berikut untuk melihat data pemantauan seperti penggunaan vCPU, memori, beban sistem rata-rata, bandwidth internal, bandwidth publik, koneksi jaringan, penggunaan disk dan pembacaan, penggunaan GPU, penggunaan memori GPU, serta daya GPU.
Konsol produk
Konsol ECS: Konsol ini menyediakan metrik seperti penggunaan vCPU, lalu lintas jaringan, I/O disk, dan pemantauan GPU. Untuk informasi lebih lanjut, lihat Lihat informasi pemantauan di Konsol ECS.
Konsol CloudMonitor: Konsol ini menyediakan pemantauan yang lebih rinci, seperti pemantauan infrastruktur, pemantauan sistem operasi, pemantauan GPU, pemantauan jaringan, pemantauan proses, dan pemantauan disk. Untuk informasi lebih lanjut, lihat Pemantauan host.
Pusat Biaya dan Pengeluaran
Pada halaman View Usage Details, Anda dapat memfilter berdasarkan bidang berikut untuk melihat penggunaan lalu lintas instans ECS: Period, Product Name, Billing Item Name, Metering Specification, dan Metering Granularity. Klik Export CSV untuk mengekspor informasi penggunaan sumber daya untuk instans tersebut. Untuk informasi lebih lanjut, lihat Detail penagihan.
CatatanData dalam detail penggunaan adalah penggunaan sumber daya mentah. Data ini berbeda dari data penggunaan yang dapat ditagih dalam detail penagihan. Hasil kueri hanya untuk referensi dan tidak dapat digunakan untuk rekonsiliasi.
Bagaimana cara menginstal layanan cGPU?
Anda dapat menginstal dan menggunakan layanan cGPU melalui lingkungan runtime Docker ACK. Ini adalah metode yang direkomendasikan baik untuk pengguna perusahaan maupun pengguna individu yang telah menyelesaikan verifikasi identitas. Untuk informasi lebih lanjut, lihat Kelola komponen penjadwalan GPU bersama.
Saat saya memilih NVIDIA Proprietary untuk tipe modul kernel selama instalasi driver, perintah nvidia-smi mengembalikan error "No devices were found"
Gejala: Pada beberapa tipe instans, jika Anda memilih NVIDIA Proprietary untuk tipe modul kernel selama instalasi driver, perintah nvidia-smi mengembalikan error
No devices were foundsetelah instalasi.

Penyebab: Tidak semua model GPU kompatibel dengan driver NVIDIA Proprietary.
Konfigurasi tipe modul kernel yang direkomendasikan:
Untuk GPU arsitektur Blackwell: Anda harus menggunakan driver open-source (pilih
MIT/GPL).Untuk GPU arsitektur Turing, Ampere, Ada Lovelace, dan Hopper: Kami merekomendasikan Anda menggunakan driver open-source (pilih
MIT/GPL).Untuk GPU arsitektur Maxwell, Pascal, dan Volta: Anda hanya dapat memilih
NVIDIA Proprietary.
Apa yang harus saya lakukan jika terjadi kegagalan inisialisasi GPU (seperti RmInitAdapter failed!) saat menggunakan GPU di Linux?
Gejala: Perangkat GPU offline, dan sistem tidak dapat mendeteksi kartu GPU. Misalnya, saat Anda menggunakan GPU di Linux, muncul error kegagalan inisialisasi GPU. Setelah menjalankan perintah
sh nvidia-bug-report.sh, Anda dapat melihat pesan errorRmInitAdapter faileddalam log yang dihasilkan, seperti yang ditunjukkan pada gambar berikut:
Penyebab: Komponen GPU System Processor (GSP) mungkin berada dalam kondisi abnormal. Hal ini menyebabkan perangkat offline dan sistem tidak dapat mendeteksi kartu GPU.
Solusi: Restart instans dari konsol. Tindakan ini melakukan reset GPU lengkap dan biasanya menyelesaikan masalah tersebut. Jika masalah tetap berlanjut, lihat Kehilangan perangkat GPU akibat error XID 119/XID 120 saat menggunakan GPU untuk pemecahan masalah lebih lanjut. Kami menyarankan Anda menonaktifkan fitur GSP.