Instans dari Keluarga Instans Dipercepat vGPU menyediakan kemampuan pemrosesan grafis berperforma tinggi serta komputasi GPU yang dipercepat. Cocok untuk skenario akselerasi grafis, rendering, dan komputasi serbaguna. Topik ini menjelaskan fitur Keluarga Instans Dipercepat vGPU dari Elastic Compute Service (ECS) serta mencantumkan tipe instans dari setiap keluarga.
sgn8ia, keluarga instans dipercepat vGPU
Pengenalan:
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Percepatan jalur cepat pada chip meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi secara signifikan, mempercepat penyimpanan data dan pemuatan model.
Dilengkapi dengan lisensi NVIDIA GRID vWS, keluarga instans ini mendukung akselerasi grafis bersertifikat untuk perangkat lunak CAD, memenuhi kebutuhan desain grafis profesional. Instans ini juga cocok sebagai solusi komputasi dioptimalkan ringan dengan akselerasi GPU untuk mengurangi biaya inferensi AI skala kecil.
Skema yang Didukung:
Tugas inferensi AI yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, suara, dan identifikasi perilaku.
Pemrosesan grafis intensif komputasi yang memerlukan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming.
Pemodelan 3D di bidang animasi, produksi film, cloud gaming, dan desain mekanis menggunakan prosesor AMD Genoa dengan kecepatan clock tinggi.
Komputasi:
Menggunakan GPU NVIDIA Lovelace dengan fitur berikut:
Memori GPU besar dan solusi pemotongan GPU ganda.
Dukungan untuk fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk berbagai kebutuhan bisnis.
Menggunakan prosesor AMD Genoa dengan kecepatan clock 3,4 GHz hingga 3,75 GHz, memberikan daya komputasi tinggi untuk pemodelan 3D.
Penyimpanan:
Semua instans dalam keluarga ini dioptimalkan I/O.
Mendukung protokol Non-Volatile Memory Express (NVMe). Untuk informasi lebih lanjut, lihat Protokol NVMe.
Mendukung ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.
sgn8ia tipe instans
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth dasar jaringan (Gbit/s) | Laju penerusan paket (pps) | Antrian NIC | ENIs | Alamat IPv4/IPv6 pribadi per ENI | Disk maksimum | IOPS dasar disk | BPS dasar disk (MB/s) |
ecs.sgn8ia-m2.xlarge | 4 | 16 | 2 GB | 2,5 | 1.000.000 | 4 | 4 | 15/15 | 9 | 30.000 | 244 |
ecs.sgn8ia-m4.2xlarge | 8 | 32 | 4 GB | 4 | 1.600.000 | 8 | 4 | 15/15 | 9 | 45.000 | 305 |
ecs.sgn8ia-m8.4xlarge | 16 | 64 | 8 GB | 7 | 2.000.000 | 16 | 8 | 30/30 | 17 | 60.000 | 427 |
ecs.sgn8ia-m16.8xlarge | 32 | 128 | 16 GB | 10 | 3.000.000 | 32 | 8 | 30/30 | 33 | 80.000 | 610 |
ecs.sgn8ia-m24.12xlarge | 48 | 192 | 24 GB | 16 | 4.500.000 | 48 | 8 | 30/30 | 33 | 120.000 | 1.000 |
ecs.sgn8ia-m48.24xlarge | 96 | 384 | 48 GB | 32 | 9.000.000 | 64 | 15 | 30/30 | 33 | 240.000 | 2.000 |
Kolom terkait GPU dalam tabel di atas menunjukkan vGPU yang dipotong menggunakan teknologi pemotongan vGPU.
Memori dan memori GPU dari instans sgn8ia bersifat eksklusif untuk instans tersebut. CPU merupakan sumber daya bersama dengan rasio overcommit sekitar 1:1,5. Jika Anda memiliki persyaratan khusus untuk daya komputasi CPU, gunakan keluarga instans komputasi dioptimalkan dengan akselerasi GPU, seperti instans gn7i GPU-accelerated compute-optimized.
sgn7i-vws, keluarga instans dipercepat vGPU dengan CPU dibagi
Pengenalan:
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk performa ultra-tinggi yang dapat diprediksi dan konsisten. Percepatan jalur cepat pada chip meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, mempercepat penyimpanan data dan pemuatan model.
Instans dalam keluarga ini berbagi sumber daya CPU dan jaringan untuk memaksimalkan pemanfaatan sumber daya bawah. Setiap instans memiliki akses eksklusif ke memori dan memori GPU-nya, memberikan isolasi data dan jaminan performa.
CatatanUntuk sumber daya CPU eksklusif, gunakan keluarga instans vgn7i-vws.
Dilengkapi dengan lisensi NVIDIA GRID vWS, keluarga instans ini mendukung akselerasi grafis bersertifikat untuk perangkat lunak CAD, memenuhi kebutuhan desain grafis profesional. Instans ini cocok sebagai solusi komputasi dioptimalkan ringan dengan akselerasi GPU untuk mengurangi biaya inferensi AI skala kecil.
Skema yang Didukung:
Tugas inferensi AI yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, suara, dan identifikasi perilaku.
Pemrosesan grafis intensif komputasi yang memerlukan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming.
Pemodelan 3D di bidang animasi, produksi film, cloud gaming, dan desain mekanis menggunakan prosesor Ice Lake.
Komputasi:
Menggunakan GPU NVIDIA A10 dengan fitur berikut:
Arsitektur NVIDIA Ampere inovatif.
Dukungan untuk fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk berbagai kebutuhan bisnis.
Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo semua inti sebesar 3,5 GHz.
Penyimpanan:
Semua instans dalam keluarga ini dioptimalkan I/O.
Mendukung ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.
sgn7i-vws tipe instans
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth dasar/meledak jaringan (Gbit/s) | Laju penerusan paket (pps) | Antrian NIC | ENIs | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.sgn7i-vws-m2.xlarge | 4 | 15,5 | NVIDIA A10 * 1/12 | 24GB * 1/12 | 1,5/5 | 500.000 | 4 | 2 | 2 | 1 |
ecs.sgn7i-vws-m4.2xlarge | 8 | 31 | NVIDIA A10 * 1/6 | 24GB * 1/6 | 2,6/10 | 1.000.000 | 4 | 4 | 6 | 1 |
ecs.sgn7i-vws-m8.4xlarge | 16 | 62 | NVIDIA A10 * 1/3 | 24GB * 1/3 | 5/20 | 2.000.000 | 8 | 4 | 10 | 1 |
ecs.sgn7i-vws-m2s.xlarge | 4 | 8 | NVIDIA A10 * 1/12 | 24GB * 1/12 | 1,5/5 | 500.000 | 4 | 2 | 2 | 1 |
ecs.sgn7i-vws-m4s.2xlarge | 8 | 16 | NVIDIA A10 * 1/6 | 24GB * 1/6 | 2,6/10 | 1.000.000 | 4 | 4 | 6 | 1 |
ecs.sgn7i-vws-m8s.4xlarge | 16 | 32 | NVIDIA A10 * 1/3 | 24GB * 1/3 | 5/20 | 2.000.000 | 8 | 4 | 10 | 1 |
Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi pemotongan GPU untuk setiap tipe instans. Setiap GPU dapat dipotong menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans. Contoh:
NVIDIA A10 * 1/12. NVIDIA A10 adalah model GPU. 1/12 menunjukkan bahwa GPU dipotong menjadi 12 partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans.
vgn7i-vws, keluarga instans dipercepat vGPU
Pengenalan:
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk performa ultra-tinggi yang dapat diprediksi dan konsisten. Percepatan jalur cepat pada chip meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, mempercepat penyimpanan data dan pemuatan model.
Dilengkapi dengan lisensi NVIDIA GRID vWS, keluarga instans ini mendukung akselerasi grafis bersertifikat untuk perangkat lunak CAD, memenuhi kebutuhan desain grafis profesional. Instans ini cocok sebagai solusi komputasi dioptimalkan ringan dengan akselerasi GPU untuk mengurangi biaya inferensi AI skala kecil.
Skema yang Didukung:
Tugas inferensi AI yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, suara, dan identifikasi perilaku.
Pemrosesan grafis intensif komputasi yang memerlukan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming.
Pemodelan 3D di bidang animasi, produksi film, cloud gaming, dan desain mekanis menggunakan prosesor Ice Lake.
Komputasi:
Menggunakan GPU NVIDIA A10 dengan fitur berikut:
Arsitektur NVIDIA Ampere inovatif.
Dukungan untuk fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk berbagai kebutuhan bisnis.
Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo semua inti sebesar 3,5 GHz.
Penyimpanan:
Semua instans dalam keluarga ini dioptimalkan I/O.
Mendukung ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.
vgn7i-vws tipe instans
Tipe instans | vCPUs | Memori (GiB) | GPU | Memori GPU | Bandwidth dasar jaringan (Gbit/s) | Laju penerusan paket (pps) | Antrian NIC | ENIs | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.vgn7i-vws-m4.xlarge | 4 | 30 | NVIDIA A10 * 1/6 | 24GB * 1/6 | 3 | 1.000.000 | 4 | 4 | 10 | 1 |
ecs.vgn7i-vws-m8.2xlarge | 10 | 62 | NVIDIA A10 * 1/3 | 24GB * 1/3 | 5 | 2.000.000 | 8 | 6 | 10 | 1 |
ecs.vgn7i-vws-m12.3xlarge | 14 | 93 | NVIDIA A10 * 1/2 | 24GB * 1/2 | 8 | 3.000.000 | 8 | 6 | 15 | 1 |
ecs.vgn7i-vws-m24.7xlarge | 30 | 186 | NVIDIA A10 * 1 | 24GB * 1 | 16 | 6.000.000 | 12 | 8 | 30 | 1 |
Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi pemotongan GPU untuk setiap tipe instans. Setiap GPU dapat dipotong menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans. Contoh:
NVIDIA A10 * 1/6. NVIDIA A10 adalah model GPU. 1/6 menunjukkan bahwa GPU dipotong menjadi enam partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans.
vgn6i-vws, keluarga instans dipercepat vGPU
Sehubungan dengan peningkatan driver NVIDIA GRID, Alibaba Cloud meng-upgrade keluarga instans vgn6i menjadi keluarga instans vgn6i-vws. Keluarga instans vgn6i-vws menggunakan driver NVIDIA GRID terbaru dan menyediakan lisensi NVIDIA GRID vWS. Untuk mengajukan citra gratis dengan driver NVIDIA GRID yang sudah terinstal, ajukan tiket.
Untuk menggunakan citra publik lainnya atau citra kustom yang tidak mengandung driver NVIDIA GRID, ajukan tiket untuk mendapatkan file driver GRID dan menginstal driver NVIDIA GRID. Alibaba Cloud tidak memungut biaya lisensi tambahan untuk driver GRID.
Skema yang Didukung:
Rendering real-time untuk cloud gaming.
Rendering real-time untuk aplikasi Augmented Reality (AR) dan Virtual Reality (VR).
Inferensi AI (deep learning dan machine learning) untuk penyebaran layanan Internet elastis.
Lingkungan pendidikan deep learning.
Lingkungan eksperimen pemodelan deep learning.
Komputasi:
Menggunakan GPU NVIDIA T4.
Menggunakan vGPU.
Mendukung kapasitas komputasi 1/4 dan 1/2 dari GPU NVIDIA Tesla T4.
Mendukung 4 GB dan 8 GB memori GPU.
Menawarkan rasio CPU-memori sebesar 1:5.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Semua instans dalam keluarga ini dioptimalkan I/O.
Mendukung ESSD, Disk ESSD AutoPL, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.
vgn6i-vws tipe instans
Tipe instans | vCPUs | Memori (GiB) | GPU | Memori GPU | Bandwidth dasar jaringan (Gbit/s) | Laju penerusan paket (pps) | Antrian NIC | ENIs | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.vgn6i-m4-vws.xlarge | 4 | 23 | NVIDIA T4 * 1/4 | 16GB * 1/4 | 2 | 500.000 | 4/2 | 3 | 10 | 1 |
ecs.vgn6i-m8-vws.2xlarge | 10 | 46 | NVIDIA T4 * 1/2 | 16GB * 1/2 | 4 | 800.000 | 8/2 | 4 | 10 | 1 |
ecs.vgn6i-m16-vws.5xlarge | 20 | 92 | NVIDIA T4 * 1 | 16GB * 1 | 7,5 | 1.200.000 | 6 | 4 | 10 | 1 |
Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi pemotongan GPU untuk setiap tipe instans. Setiap GPU dapat dipotong menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans. Contoh:
NVIDIA T4 * 1/4. NVIDIA T4 adalah model GPU. 1/4 menunjukkan bahwa GPU dipotong menjadi empat partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans.