Layanan GPU Elastis menyediakan kemampuan komputasi yang dipercepat GPU secara on-demand dengan Auto Scaling. Sebagai bagian dari keluarga komputasi elastis Alibaba Cloud, layanan ini menggabungkan daya komputasi GPU dan CPU untuk memenuhi kebutuhan Anda dalam skenario seperti artificial intelligence (AI), high-performance computing (HPC), serta pemrosesan grafis dan gambar profesional.
View instance types available in each region. Tipe instans yang tersedia untuk pembelian bervariasi berdasarkan wilayah.
Lihat petunjuk pemilihan tipe instans untuk mempelajari cara memilih tipe instans berdasarkan skenario bisnis Anda sebelum membaca topik ini.
Lihat metrik tipe instans sebelum membaca topik ini.
Anda dapat use the ECS Price Calculator untuk memperkirakan biaya instans.
vGPU-dipercepat | Komputasi dioptimalkan dengan akselerasi GPU | Tidak direkomendasikan (Jika keluarga instans berikut habis terjual, gunakan keluarga instans pada kolom sebelumnya sebagai gantinya) |
|
sgn8ia, keluarga instans vGPU-dipercepat
Pengantar:
Ditenagai oleh arsitektur SHENLONG generasi ketiga untuk memberikan performa tinggi yang stabil dan dapat diprediksi. Akselerasi berbasis chip secara signifikan meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, sehingga memungkinkan Anda menyimpan data dan memuat model lebih cepat.
Mencakup lisensi perangkat lunak NVIDIA GRID Virtual Workstation (vWS). Ini menyediakan akselerasi grafis bersertifikasi untuk berbagai aplikasi desain berbantuan komputer (CAD) profesional guna memenuhi kebutuhan desain grafis profesional. Instans ini juga dapat digunakan sebagai instans komputasi dioptimalkan dengan akselerasi GPU ringan untuk mengurangi biaya inferensi AI skala kecil.
Skenario:
CPU berkecepatan clock tinggi, memori, dan GPU memungkinkannya memproses banyak tugas inferensi AI konkuren, menjadikannya ideal untuk aplikasi seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.
Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berkinerja tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans ini mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.
Dengan kecepatan clock hingga 3,75 GHz, prosesor AMD Genoa memberikan performa unggul untuk pemodelan 3D di bidang seperti produksi film dan animasi, cloud gaming, dan desain mekanik.
Komputasi:
Menggunakan GPU NVIDIA Lovelace, yang memiliki fitur-fitur berikut:
Memori GPU besar dan berbagai solusi slicing GPU.
Dukungan fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk memberikan dukungan bisnis yang terdiversifikasi.
Prosesor: Prosesor AMD Genoa berfrekuensi tinggi yang memberikan kecepatan clock 3,4 GHz hingga 3,75 GHz untuk menyediakan daya komputasi tinggi bagi pemodelan 3D.
Penyimpanan:
Instans I/O teroptimasi.
Mendukung protokol Non-Volatile Memory Express (NVMe). Untuk informasi selengkapnya, lihat Protokol NVMe.
Kategori disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
sgn8ia mencakup tipe instans dan data metrik berikut:
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Multi-Queue | ENI | Alamat IPv4/IPv6 privat per ENI | Jumlah maksimum disk | Baseline Disk IOPS | BPS baseline disk (MB/s) |
ecs.sgn8ia-m2.xlarge | 4 | 16 | 2 GB | 2,5 | 1.000.000 | 4 | 4 | 15/15 | 9 | 30.000 | 244 |
ecs.sgn8ia-m4.2xlarge | 8 | 32 | 4 GB | 4 | 1.600.000 | 8 | 4 | 15/15 | 9 | 45.000 | 305 |
ecs.sgn8ia-m8.4xlarge | 16 | 64 | 8 GB | 7 | 2.000.000 | 16 | 8 | 30/30 | 17 | 60.000 | 427 |
ecs.sgn8ia-m16.8xlarge | 32 | 128 | 16 GB | 10 | 3.000.000 | 32 | 8 | 30/30 | 33 | 80.000 | 610 |
ecs.sgn8ia-m24.12xlarge | 48 | 192 | 24 GB | 16 | 4.500.000 | 48 | 8 | 30/30 | 33 | 120.000 | 1000 |
ecs.sgn8ia-m48.24xlarge | 96 | 384 | 48 GB | 32 | 9.000.000 | 64 | 15 | 30/30 | 33 | 240.000 | 2000 |
GPU dalam tabel di atas adalah shard vGPU yang dibuat menggunakan teknologi vGPU.
Memori dan memori GPU instans sgn8ia bersifat eksklusif untuk instans tersebut. CPU instans merupakan resource yang dibagikan dengan rasio overcommit sekitar 1:1,5. Jika Anda memiliki persyaratan khusus terhadap daya komputasi CPU, Anda dapat membeli instans khusus dengan GPU passthrough, seperti instans komputasi dioptimalkan dengan akselerasi GPU gn7i.
sgn7i-vws, keluarga instans vGPU-dipercepat dengan CPU bersama
Ikhtisar keluarga:
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga instans ini menggunakan akselerasi fast path pada chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran. Hal ini memungkinkan penyimpanan data dan pemuatan model dilakukan lebih cepat.
Instans dari keluarga instans ini berbagi resource CPU dan jaringan untuk memaksimalkan pemanfaatan resource dasar. Setiap instans memiliki akses eksklusif ke memori dan memori GPU-nya untuk memberikan isolasi data dan jaminan performa.
CatatanJika Anda ingin menggunakan resource CPU eksklusif, Anda dapat memilih keluarga instans vgn7i-vws.
Keluarga instans ini dilengkapi lisensi NVIDIA GRID vWS dan menyediakan kemampuan akselerasi grafis bersertifikasi untuk perangkat lunak CAD guna memenuhi persyaratan desain grafis profesional. Instans dari keluarga instans ini dapat berfungsi sebagai instans komputasi dioptimalkan dengan akselerasi GPU ringan untuk mengurangi biaya tugas inferensi AI skala kecil.
Skenario:
Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.
Pemodelan 3D di bidang yang memerlukan penggunaan prosesor Ice Lake, seperti produksi animasi dan film, cloud gaming, dan desain mekanik.
Komputasi:
Dilengkapi GPU NVIDIA A10.
Arsitektur Ampere inovatif.
Dukungan fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk memberikan dukungan bisnis yang terdiversifikasi.
Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
sgn7i-vws mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline/burst jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Multi-Queue | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.sgn7i-vws-m2.xlarge | 4 | 15,5 | NVIDIA A10 × 1/12 | 24 GB × 1/12 | 1,5/5 | 500.000 | 4 | 2 | 2 | 1 |
ecs.sgn7i-vws-m4.2xlarge | 8 | 31 | NVIDIA A10 × 1/6 | 24 GB × 1/6 | 2,6/10 | 1.000.000 | 4 | 4 | 6 | 1 |
ecs.sgn7i-vws-m8.4xlarge | 16 | 62 | NVIDIA A10 × 1/3 | 24 GB × 1/3 | 5/20 | 2.000.000 | 8 | 4 | 10 | 1 |
ecs.sgn7i-vws-m2s.xlarge | 4 | 8 | NVIDIA A10 × 1/12 | 24 GB × 1/12 | 1,5/5 | 500.000 | 4 | 2 | 2 | 1 |
ecs.sgn7i-vws-m4s.2xlarge | 8 | 16 | NVIDIA A10 × 1/6 | 24 GB × 1/6 | 2,6/10 | 1.000.000 | 4 | 4 | 6 | 1 |
ecs.sgn7i-vws-m8s.4xlarge | 16 | 32 | NVIDIA A10 × 1/3 | 24 GB × 1/3 | 5/20 | 2.000.000 | 8 | 4 | 10 | 1 |
Kolom GPU dalam tabel di atas mencakup model kartu GPU dan informasi slicing GPU. Setiap GPU dapat diiris menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke suatu instans. Misalnya:
Dalam NVIDIA A10 * 1/12, NVIDIA A10 menunjukkan model kartu GPU dan 1/12 menunjukkan bahwa satu kartu GPU diiris menjadi 12 shard, dan setiap instans menggunakan satu shard.
vgn7i-vws, keluarga instans vGPU-dipercepat
Ikhtisar keluarga:
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga instans ini menggunakan akselerasi fast path pada chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran. Hal ini memungkinkan penyimpanan data dan pemuatan model dilakukan lebih cepat.
Keluarga instans ini dilengkapi lisensi NVIDIA GRID vWS dan menyediakan kemampuan akselerasi grafis bersertifikasi untuk perangkat lunak CAD guna memenuhi persyaratan desain grafis profesional. Instans dari keluarga instans ini dapat berfungsi sebagai instans komputasi dioptimalkan dengan akselerasi GPU ringan untuk mengurangi biaya tugas inferensi AI skala kecil.
Skenario:
Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.
Prosesor Ice Lake memberikan performa yang ditingkatkan untuk pemodelan 3D di bidang seperti produksi film dan animasi, cloud gaming, dan desain mekanik.
Komputasi:
Dilengkapi GPU NVIDIA A10.
Arsitektur Ampere inovatif.
Dukungan fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk memberikan dukungan bisnis yang terdiversifikasi.
Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
vgn7i-vws mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Queues | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.vgn7i-vws-m4.xlarge | 4 | 30 | NVIDIA A10 × 1/6 | 24 GB × 1/6 | 3 | 1.000.000 | 4 | 4 | 10 | 1 |
ecs.vgn7i-vws-m8.2xlarge | 10 | 62 | NVIDIA A10 × 1/3 | 24 GB × 1/3 | 5 | 2.000.000 | 8 | 6 | 10 | 1 |
ecs.vgn7i-vws-m12.3xlarge | 14 | 93 | NVIDIA A10 × 1/2 | 24 GB × 1/2 | 8 | 3.000.000 | 8 | 6 | 15 | 1 |
ecs.vgn7i-vws-m24.7xlarge | 30 | 186 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 6.000.000 | 12 | 8 | 30 | 1 |
Dalam tabel di atas, kolom GPU menentukan model kartu GPU dan informasi slicing GPU. Setiap GPU dapat diiris menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke suatu instans. Misalnya:
Dalam NVIDIA A10 * 1/6, NVIDIA A10 menunjukkan model kartu GPU dan 1/6 menunjukkan bahwa satu kartu GPU diiris menjadi enam shard, dan setiap instans menggunakan satu shard.
vgn6i-vws, keluarga instans vGPU-dipercepat
Alibaba Cloud telah meningkatkan keluarga instans vgn6i menjadi vgn6i-vws untuk mendukung peningkatan driver GRID. Keluarga baru ini menggunakan driver GRID terbaru dan mencakup lisensi GRID vWS gratis. Untuk meminta image gratis dengan driver GRID yang telah dipra-instal, Anda dapat membuat tiket.
Untuk menggunakan image publik atau kustom lain yang tidak mengandung driver GRID, Anda dapat membuat tiket untuk meminta file driver GRID guna instalasi terpisah. Alibaba Cloud tidak membebankan biaya lisensi untuk driver GRID.
Skenario:
Rendering real-time untuk cloud gaming.
Rendering real-time untuk aplikasi Augmented Reality (AR) dan Virtual Reality (VR).
Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk penerapan elastis layanan internet yang mengandung aplikasi inferensi AI.
Lingkungan pendidikan untuk pembelajaran mendalam.
Lingkungan eksperimen pemodelan untuk pembelajaran mendalam.
Komputasi:
Menggunakan akselerator GPU NVIDIA T4.
Menggunakan vGPU yang diiris dan divirtualisasi.
Mendukung 1/4 dan 1/2 daya komputasi GPU NVIDIA Tesla T4.
Mendukung memori GPU 4 GB dan 8 GB.
Menawarkan rasio CPU-memori sekitar 1:5.
Prosesor: Prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, ESSD dengan redundansi regional, SSD standar, dan disk ultra. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
vgn6i-vws mencakup tipe instans dan data metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Queues | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.vgn6i-m4-vws.xlarge | 4 | 23 | NVIDIA T4 × 1/4 | 16 GB × 1/4 | 2 | 500.000 | 4/2 | 3 | 10 | 1 |
ecs.vgn6i-m8-vws.2xlarge | 10 | 46 | NVIDIA T4 × 1/2 | 16 GB × 1/2 | 4 | 800.000 | 8/2 | 4 | 10 | 1 |
ecs.vgn6i-m16-vws.5xlarge | 20 | 92 | NVIDIA T4 × 1 | 16 GB × 1 | 7,5 | 1.200.000 | 6 | 4 | 10 | 1 |
Dalam tabel di atas, kolom GPU berisi model kartu GPU dan informasi slicing GPU. Slicing GPU berarti GPU diiris menjadi beberapa partisi, dan setiap partisi dialokasikan ke suatu instans. Misalnya:
Dalam NVIDIA T4 * 1/4, NVIDIA T4 menunjukkan model kartu GPU dan 1/4 menunjukkan bahwa satu kartu GPU diiris menjadi empat shard, dan setiap instans menggunakan satu shard.
gn8v/gn8v-tee, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Instans ini saat ini hanya tersedia di wilayah tertentu, termasuk di luar Tiongkok. Untuk meminta layanan ini, silakan hubungi perwakilan penjualan Alibaba Cloud.
Pengantar:
gn8v: Keluarga instans ini adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan yang disediakan oleh Alibaba Cloud untuk pelatihan model AI dan tugas inferensi model bahasa besar (LLM) ultra-besar. Keluarga instans ini terdiri dari berbagai tipe instans yang menyediakan satu, dua, empat, atau delapan GPU per instans.
gn8v-tee: Untuk memenuhi persyaratan keamanan dalam pelatihan dan inferensi model bahasa besar, Alibaba Cloud menyediakan keluarga instans generasi kedelapan berbasis gn8v yang mencakup fitur komputasi rahasia. Tipe instans ini mengenkripsi data selama komputasi GPU untuk memastikan keamanan data pengguna.
Skenario:
Komputasi inferensi paralel multi-GPU hemat biaya untuk LLM dengan lebih dari 70 miliar parameter.
Satu GPU menyediakan daya komputasi FP32 sebesar 39,5 TFLOPS dan memberikan performa luar biasa untuk beban kerja pelatihan dalam AI tradisional dan kendaraan otonom.
Skenario pelatihan model skala kecil dan menengah yang memanfaatkan koneksi NVLink di antara delapan GPU.
Fitur dan posisi:
Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU dilengkapi memori HBM3 96 GB dan memberikan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.
Bandwidth antar-GPU tinggi: Beberapa GPU saling terhubung menggunakan koneksi NVLink 900 GB/s. Efisiensi pelatihan dan inferensi multi-GPU jauh lebih tinggi dibandingkan instans berakselerasi GPU generasi sebelumnya.
Kuantisasi model bahasa besar: Keluarga instans ini mendukung daya komputasi dalam format titik mengambang 8-bit (FP8) dan mengoptimalkan daya komputasi untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi pelatihan dan inferensi serta mengurangi penggunaan memori GPU.
(Hanya untuk gn8v-tee) Keamanan tinggi: Keluarga instans gn8v-tee mendukung fitur komputasi rahasia berbasis CPU (Intel TDX) dan komputasi rahasia berbasis GPU (NVIDIA CC), yang menyediakan kemampuan komputasi rahasia end-to-end untuk inferensi model. Kemampuan komputasi rahasia ini memastikan keamanan data inferensi pengguna dan model perusahaan dalam inferensi dan pelatihan model.
Komputasi:
Menggunakan prosesor Cloud Infrastructure Processing Unit (CIPU) 1.0 terbaru.
Memisahkan kemampuan komputasi dari kemampuan penyimpanan, sehingga memungkinkan Anda memilih resource penyimpanan secara fleksibel sesuai kebutuhan.
Menyediakan kemampuan bare metal untuk mendukung komunikasi peer-to-peer (P2P) antar instans berakselerasi GPU, yang merupakan peningkatan dibandingkan instans virtualisasi tradisional.
Prosesor: Prosesor Intel Xeon Scalable generasi keempat yang memberikan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua-core hingga 3,1 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Mendukung protokol Non-Volatile Memory Express (NVMe). Untuk informasi selengkapnya, lihat Protokol NVMe.
Tipe disk yang didukung: disk elastis sementara, SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Mendukung fitur Jumbo Frames. Untuk informasi selengkapnya, lihat Jumbo Frames.
Menyediakan performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30.000.000 PPS (untuk instans yang dilengkapi delapan GPU).
Elastic RDMA Interface (ERI) didukung.
- Catatan
Untuk informasi selengkapnya tentang cara menggunakan ERIs, lihat Enable eRDMA on an enterprise-level instance.
Keamanan: Mendukung fitur Trusted Platform Module (vTPM). Fitur ini didukung oleh gn8v tetapi tidak oleh gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.
gn8v mencakup tipe instans dan metrik yang tercantum dalam tabel berikut:
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | ENIs | Queues (primary) | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI | Jumlah maksimum disk | IOPS baseline disk | Bandwidth baseline disk (GB/s) |
ecs.gn8v.4xlarge | 16 | 96 | 96 GB × 1 | 12 | 8 | 16 | 30 | 30 | 17 | 100.000 | 0,75 |
ecs.gn8v.6xlarge | 24 | 128 | 96 GB × 1 | 15 | 8 | 24 | 30 | 30 | 17 | 120.000 | 0,937 |
ecs.gn8v-2x.8xlarge | 32 | 192 | 96 GB × 2 | 20 | 8 | 32 | 30 | 30 | 25 | 200.000 | 1,25 |
ecs.gn8v-4x.8xlarge | 32 | 384 | 96 GB × 4 | 20 | 8 | 32 | 30 | 30 | 25 | 200.000 | 1,25 |
ecs.gn8v-2x.12xlarge | 48 | 256 | 96 GB × 2 | 25 | 8 | 48 | 30 | 30 | 33 | 300.000 | 1,50 |
ecs.gn8v-8x.16xlarge | 64 | 768 | 96 GB × 8 | 32 | 8 | 64 | 30 | 30 | 33 | 360.000 | 2,5 |
ecs.gn8v-4x.24xlarge | 96 | 512 | 96 GB × 4 | 50 | 15 | 64 | 30 | 30 | 49 | 500.000 | 3 |
ecs.gn8v-8x.48xlarge | 192 | 1024 | 96 GB × 8 | 100 | 15 | 64 | 50 | 50 | 65 | 1.000.000 | 6 |
gn8v-tee mencakup tipe instans dan data metrik berikut:
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | ENIs | Queues (primary) | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI | Jumlah maksimum disk | Baseline Disk IOPS | Bandwidth baseline disk (GB/s) |
ecs.gn8v-tee.4xlarge | 16 | 96 | 96 GB × 1 | 12 | 8 | 16 | 30 | 30 | 17 | 100.000 | 0,75 |
ecs.gn8v-tee.6xlarge | 24 | 128 | 96 GB × 1 | 15 | 8 | 24 | 30 | 30 | 17 | 120.000 | 0,937 |
ecs.gn8v-tee-8x.16xlarge | 64 | 768 | 96 GB × 8 | 32 | 8 | 64 | 30 | 30 | 33 | 360.000 | 2,5 |
ecs.gn8v-tee-8x.48xlarge | 192 | 1024 | 96 GB × 8 | 100 | 15 | 64 | 50 | 50 | 65 | 1.000.000 | 6 |
Keluarga instans gn8v-tee hanya mendukung image Alibaba Cloud Linux 3. Jika Anda menggunakan image kustom yang dibuat berdasarkan Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernel-nya adalah 5.10.134-18 atau yang lebih baru.
gn8is, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk di luar Tiongkok. Untuk menggunakan keluarga instans ini, Anda dapat menghubungi staf penjualan Alibaba Cloud.
Pengantar: gn8is adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, yang dikembangkan sebagai respons terhadap pertumbuhan layanan konten yang dihasilkan AI (AIGC). Instans ini menggunakan GPU NVIDIA L20 terbaru dan menyediakan tipe instans dengan 1-GPU, 2-GPU, 4-GPU, dan 8-GPU, serta tipe instans dengan rasio CPU-GPU yang berbeda, untuk memenuhi berbagai kebutuhan aplikasi.
Fitur dan posisi:
Pemrosesan grafis: Keluarga instans ini menggunakan prosesor Intel Xeon Scalable frekuensi tinggi generasi keempat untuk menyediakan daya komputasi CPU yang cukup bagi skenario pemodelan 3D, sehingga membuat rendering dan desain grafis lebih lancar.
Tugas inferensi: Menggunakan GPU NVIDIA L20 baru dan menyediakan memori GPU 48 GB per GPU untuk mempercepat tugas inferensi. Instans ini mendukung format bilangan titik mengambang FP8 dan dapat digunakan dengan kontainer ACK untuk secara fleksibel mendukung inferensi berbagai model AIGC. Instans ini sangat cocok untuk tugas inferensi pada model LLM dengan kurang dari 70 miliar parameter.
Skenario:
Animasi, efek khusus untuk film dan televisi, serta rendering. Instans ini menyediakan kemampuan pemrosesan grafis setingkat workstation menggunakan driver GRID dari image Alibaba Cloud Marketplace untuk mengaktifkan kemampuan grafis OpenGL dan Direct3D.
Dukungan yang lebih efisien dan hemat biaya untuk pembuatan gambar AIGC dan inferensi LLM menggunakan manajemen kontainerisasi ACK.
Skenario pengenalan AI umum lainnya, seperti pengenalan gambar dan pengenalan suara.
Komputasi:
Menggunakan GPU enterprise-grade NVIDIA L20 terbaru.
Dukungan fitur akselerasi seperti TensorRT dan format bilangan titik mengambang FP8 untuk meningkatkan performa inferensi model.
Hingga 48 GB memori per GPU dan mendukung inferensi model 70B atau lebih besar pada satu instans dengan beberapa GPU.
Kemampuan pemrosesan grafis yang ditingkatkan. Misalnya, setelah Anda menginstal driver GRID pada instans gn8is menggunakan Asisten Cloud atau image Alibaba Cloud Marketplace, instans tersebut dapat memberikan performa pemrosesan grafis dua kali lipat dari platform generasi ketujuh.
Parameter utama NVIDIA L20:
Arsitektur GPU
Memori GPU
Performa komputasi
Kemampuan enkode/dekode video
Koneksi antar-kartu
NVIDIA Ada Lovelace
Kapasitas: 48 GB
Bandwidth: 864 GB/s
FP64: N/A
FP32: 59,3 TFLOPS
FP16/BF16: 119 TFLOPS
FP8/INT8: 237 TFLOPS
3 × Video Encoder (+AV1)
3 × Video Decoder
4 × JPEG Decoder
Antarmuka PCIe: PCIe Gen4 x16
Bandwidth: 64 GB/s
Prosesor: Prosesor Intel® Xeon® frekuensi tinggi terbaru yang memberikan frekuensi turbo semua-core sebesar 3,9 GHz untuk memenuhi persyaratan pemodelan 3D yang kompleks.
Penyimpanan:
Instans I/O teroptimasi.
Mendukung protokol Non-Volatile Memory Express (NVMe). Untuk informasi selengkapnya, lihat Protokol NVMe.
Mendukung disk elastis sementara, SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Elastic RDMA Interface (ERI) didukung.
CatatanUntuk petunjuk penggunaan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.
Keamanan: mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar.
gn8is mencakup tipe instans dan metrik yang tercantum dalam tabel berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | ENIs | Queues (primary) | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI | Jumlah maksimum disk | Baseline Disk IOPS | Bandwidth garis dasar disk (GB/s) |
ecs.gn8is.2xlarge | 8 | 64 | L20 × 1 | 48 GB × 1 | 8 | 4 | 8 | 15 | 15 | 17 | 60.000 | 0,75 |
ecs.gn8is.4xlarge | 16 | 128 | L20 × 1 | 48 GB × 1 | 16 | 8 | 16 | 30 | 30 | 17 | 120.000 | 1,25 |
ecs.gn8is-2x.8xlarge | 32 | 256 | L20 × 2 | 48 GB × 2 | 32 | 8 | 32 | 30 | 30 | 33 | 250.000 | 2 |
ecs.gn8is-4x.16xlarge | 64 | 512 | L20 × 4 | 48 GB × 4 | 64 | 8 | 64 | 30 | 30 | 33 | 450.000 | 4 |
ecs.gn8is-8x.32xlarge | 128 | 1024 | L20 × 8 | 48 GB × 8 | 100 | 15 | 64 | 50 | 50 | 65 | 900.000 | 8 |
gn7e, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Daftar berikut menjelaskan fitur-fitur gn7e:
Ikhtisar keluarga
Anda dapat memilih tipe instans yang menyediakan jumlah GPU dan CPU yang berbeda untuk memenuhi kebutuhan bisnis Anda dalam kasus penggunaan AI.
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata virtual private cloud (VPC), jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.
Skenario:
Pelatihan AI skala kecil dan menengah.
Beban kerja HPC yang dipercepat menggunakan Compute Unified Device Architecture (CUDA).
Tugas inferensi AI yang memerlukan kemampuan pemrosesan GPU tinggi atau jumlah memori GPU yang besar.
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU yang kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan.
PentingSaat menggunakan layanan pelatihan AI yang memiliki beban komunikasi tinggi, seperti model transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, data dapat rusak akibat kegagalan tak terduga yang disebabkan oleh transmisi data skala besar melalui tautan Peripheral Component Interconnect Express (PCIe). Jika Anda tidak memahami topologi tautan komunikasi yang digunakan untuk layanan pelatihan AI, Anda dapat membuat tiket untuk mendapatkan dukungan teknis.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn7e mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Multi-Queue | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn7e-c16g1.4xlarge | 16 | 125 | 80 GB × 1 | 8 | 3.000.000 | 8 | 8 | 10 | 1 |
ecs.gn7e-c16g1.8xlarge | 32 | 250 | 80 GB × 2 | 16 | 6.000.000 | 16 | 8 | 10 | 1 |
ecs.gn7e-c16g1.16xlarge | 64 | 500 | 80 GB × 4 | 32 | 12.000.000 | 32 | 8 | 10 | 1 |
ecs.gn7e-c16g1.32xlarge | 128 | 1000 | 80 GB × 8 | 64 | 24.000.000 | 32 | 16 | 15 | 1 |
gn7i, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Pengantar: Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga instans ini menggunakan akselerasi fast path pada chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran.
Skenario:
Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.
Komputasi:
Dilengkapi GPU NVIDIA A10.
Arsitektur Ampere inovatif.
Dukungan fitur akselerasi seperti RTX dan TensorRT.
Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.
Menyediakan memori hingga 752 GiB, yang jauh lebih besar dibandingkan ukuran memori keluarga instans gn6i.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn7i mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Multi-queue | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn7i-c8g1.2xlarge | 8 | 30 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 1.600.000 | 8 | 4 | 15 | 15 |
ecs.gn7i-c16g1.4xlarge | 16 | 60 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 3.000.000 | 8 | 8 | 30 | 30 |
ecs.gn7i-c32g1.8xlarge | 32 | 188 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 6.000.000 | 12 | 8 | 30 | 30 |
ecs.gn7i-c32g1.16xlarge | 64 | 376 | NVIDIA A10 × 2 | 24 GB × 2 | 32 | 12.000.000 | 16 | 15 | 30 | 30 |
ecs.gn7i-c32g1.32xlarge | 128 | 752 | NVIDIA A10 × 4 | 24 GB × 4 | 64 | 24.000.000 | 32 | 15 | 30 | 30 |
ecs.gn7i-c48g1.12xlarge | 48 | 310 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 9.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-c56g1.14xlarge | 56 | 346 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 10.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-2x.8xlarge | 32 | 128 | NVIDIA A10 × 2 | 24 GB × 2 | 16 | 6.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-4x.8xlarge | 32 | 128 | NVIDIA A10 × 4 | 24 GB × 4 | 32 | 6.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-4x.16xlarge | 64 | 256 | NVIDIA A10 × 4 | 24 GB × 4 | 64 | 12.000.000 | 32 | 8 | 30 | 30 |
ecs.gn7i-8x.32xlarge | 128 | 512 | NVIDIA A10 × 8 | 24 GB × 8 | 64 | 24.000.000 | 32 | 16 | 30 | 30 |
ecs.gn7i-8x.16xlarge | 64 | 256 | NVIDIA A10 × 8 | 24 GB × 8 | 32 | 12.000.000 | 32 | 8 | 30 | 30 |
Anda dapat mengubah tipe instans ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge menjadi ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge, tetapi tidak ke tipe instans lain seperti ecs.gn7i-c32g1.8xlarge.
gn7s, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Untuk menggunakan keluarga instans gn7s, Anda dapat membuat tiket untuk mengajukan permohonan.
Pengantar keluarga spesifikasi:
Keluarga instans ini menggunakan prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Anda dapat memilih tipe instans yang terdiri dari kombinasi GPU dan vCPU yang sesuai untuk memenuhi kebutuhan bisnis Anda dalam skenario AI.
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata VPC, jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.
Skenario: Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
Komputasi:
Dilengkapi GPU NVIDIA A30.
Arsitektur NVIDIA Ampere inovatif.
Dukungan fitur multi-instance GPU (MIG) dan fitur akselerasi (berbasis Tensor core generasi kedua) untuk memberikan dukungan bisnis yang terdiversifikasi.
Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.
Menyediakan ukuran memori yang jauh lebih besar dibandingkan keluarga instans generasi sebelumnya.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn7s mencakup tipe instans dan data metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI | Multi-queue | ENI |
ecs.gn7s-c8g1.2xlarge | 8 | 60 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 1.600.000 | 5 | 1 | 8 | 4 |
ecs.gn7s-c16g1.4xlarge | 16 | 120 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 3.000.000 | 5 | 1 | 8 | 8 |
ecs.gn7s-c32g1.8xlarge | 32 | 250 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 6.000.000 | 5 | 1 | 12 | 8 |
ecs.gn7s-c32g1.16xlarge | 64 | 500 | NVIDIA A30 × 2 | 24 GB × 2 | 32 | 12.000.000 | 5 | 1 | 16 | 15 |
ecs.gn7s-c32g1.32xlarge | 128 | 1000 | NVIDIA A30 × 4 | 24 GB × 4 | 64 | 24.000.000 | 10 | 1 | 32 | 15 |
ecs.gn7s-c48g1.12xlarge | 48 | 380 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 9.000.000 | 8 | 1 | 16 | 8 |
ecs.gn7s-c56g1.14xlarge | 56 | 440 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 10.000.000 | 8 | 1 | 16 | 8 |
gn7, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Skenario:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU yang kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD dengan redundansi regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn7 mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Multi-queue | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn7-c12g1.3xlarge | 12 | 94 | 40 GB × 1 | 4 | 2.500.000 | 4 | 8 | 10 | 1 |
ecs.gn7-c13g1.13xlarge | 52 | 378 | 40 GB × 4 | 16 | 9.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7-c13g1.26xlarge | 104 | 756 | 40 GB × 8 | 30 | 18.000.000 | 16 | 15 | 10 | 1 |
gn6i, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Skenario:
Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk visi komputer, pengenalan suara, sintesis suara, NLP, penerjemahan mesin, dan sistem rekomendasi.
Rendering real-time untuk cloud gaming.
Rendering real-time untuk aplikasi AR dan VR.
Komputasi grafis beban berat atau workstation grafis.
Database yang dipercepat GPU.
Komputasi kinerja tinggi.
Komputasi:
Akselerator GPU: T4.
Arsitektur mikro Turing inovatif.
16 GB memori GPU per GPU (bandwidth memori GPU 320 GB/s).
2.560 CUDA Core per GPU.
Hingga 320 Tensor Core Turing per GPU.
Tensor Core presisi variabel mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4.
Rasio prosesor-memori sekitar 1:4.
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, SSD standar, dan disk ultra. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn6i mencakup tipe instans dan data metrik yang dijelaskan dalam tabel berikut:
Instance Type | vCPUs | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Disk garis dasar IOPS | Multi-Queue | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn6i-c4g1.xlarge | 4 | 15 | NVIDIA T4 × 1 | 16 GB × 1 | 4 | 2.500.000 | N/A | 2 | 2 | 10 | 1 |
ecs.gn6i-c8g1.2xlarge | 8 | 31 | NVIDIA T4 × 1 | 16 GB × 1 | 5 | 2.500.000 | N/A | 2 | 2 | 10 | 1 |
ecs.gn6i-c16g1.4xlarge | 16 | 62 | NVIDIA T4 × 1 | 16 GB × 1 | 6 | 2.500.000 | N/A | 4 | 3 | 10 | 1 |
ecs.gn6i-c24g1.6xlarge | 24 | 93 | NVIDIA T4 × 1 | 16 GB × 1 | 7,5 | 2.500.000 | N/A | 6 | 4 | 10 | 1 |
ecs.gn6i-c40g1.10xlarge | 40 | 155 | NVIDIA T4 × 1 | 16 GB × 1 | 10 | 1.600.000 | N/A | 16 | 10 | 10 | 1 |
ecs.gn6i-c24g1.12xlarge | 48 | 186 | NVIDIA T4 × 2 | 16 GB × 2 | 15 | 4.500.000 | N/A | 12 | 6 | 10 | 1 |
ecs.gn6i-c24g1.24xlarge | 96 | 372 | NVIDIA T4 × 4 | 16 GB × 4 | 30 | 4.500.000 | 250.000 | 24 | 8 | 10 | 1 |
gn6e, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Skenario:
Pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Komputasi:
Menggunakan GPU NVIDIA V100 (32 GB NVLink).
Akselerator GPU: V100 (paket SXM2).
Arsitektur Volta inovatif.
32 GB memori HBM2 per GPU (bandwidth memori GPU 900 GB/s).
5.120 CUDA Cores per GPU.
640 Tensor Core per GPU.
Setiap GPU mendukung enam tautan NVLink. NVLink adalah tautan dua arah. Bandwidth tautan satu arah adalah 25 Gbit/s, dan bandwidth total adalah 300 Gbit/s (6 × 25 × 2).
Rasio prosesor-memori sekitar 1:8.
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung meliputi SSD Perusahaan (ESSD), disk ESSD AutoPL, ESSD dengan redundansi regional, SSD standar, dan disk ultra. Untuk informasi selengkapnya, lihat Ikhtisar Elastic Block Storage.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn6e mencakup tipe instans dan spesifikasi yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Queues | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn6e-c12g1.3xlarge | 12 | 92 | NVIDIA V100 × 1 | 32 GB × 1 | 5 | 800.000 | 8 | 6 | 10 | 1 |
ecs.gn6e-c12g1.6xlarge | 24 | 184 | NVIDIA V100 × 2 | 32 GB × 2 | 8 | 1.200.000 | 8 | 8 | 20 | 1 |
ecs.gn6e-c12g1.12xlarge | 48 | 368 | NVIDIA V100 × 4 | 32 GB × 4 | 16 | 2.400.000 | 8 | 8 | 20 | 1 |
ecs.gn6e-c12g1.24xlarge | 96 | 736 | NVIDIA V100 × 8 | 32 GB × 8 | 32 | 4.500.000 | 16 | 8 | 20 | 1 |
gn6v, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Skenario:
Pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Komputasi:
Menggunakan GPU NVIDIA V100.
Akselerator GPU: V100 (paket SXM2).
Arsitektur Volta inovatif.
16 GB memori HBM2 per GPU (bandwidth memori GPU 900 GB/s).
5.120 CUDA Core per GPU.
640 Tensor Core per GPU.
Setiap GPU mendukung enam tautan NVLink. NVLink adalah tautan dua arah. Bandwidth tautan satu arah adalah 25 Gbit/s, dan bandwidth total adalah 300 Gbit/s (6 × 25 × 2).
Rasio prosesor-memori sekitar 1:4.
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Tipe disk yang didukung: SSD Perusahaan (ESSD), disk ESSD AutoPL, SSD standar, dan disk ultra. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
Keluarga instans gn6v mencakup tipe instans dan metrik yang tercantum dalam tabel berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | IOPS garis dasar disk | Queues | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn6v-c8g1.2xlarge | 8 | 32 | NVIDIA V100 × 1 | 16 GB × 1 | 2,5 | 800.000 | N/A | 4 | 4 | 10 | 1 |
ecs.gn6v-c8g1.4xlarge | 16 | 64 | NVIDIA V100 × 2 | 16 GB × 2 | 5 | 1.000.000 | N/A | 4 | 8 | 20 | 1 |
ecs.gn6v-c8g1.8xlarge | 32 | 128 | NVIDIA V100 × 4 | 16 GB × 4 | 10 | 2.000.000 | N/A | 8 | 8 | 20 | 1 |
ecs.gn6v-c8g1.16xlarge | 64 | 256 | NVIDIA V100 × 8 | 16 GB × 8 | 20 | 2.500.000 | N/A | 16 | 8 | 20 | 1 |
ecs.gn6v-c10g1.20xlarge | 82 | 336 | NVIDIA V100 × 8 | 16 GB × 8 | 35 | 4.500.000 | 250.000 | 16 | 8 | 20 | 1 |
gn5, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Skenario:
Pembelajaran mendalam.
Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, penelitian genomik, dan analisis lingkungan.
Beban kerja komputasi GPU sisi server, seperti komputasi kinerja tinggi, rendering, dan enkode/dekode multimedia.
Komputasi:
Menggunakan GPU NVIDIA P100.
Beberapa rasio prosesor-memori.
Prosesor: Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.
Penyimpanan:
Dilengkapi disk lokal SSD NVMe berperforma tinggi.
Instans I/O teroptimasi.
Kategori disk yang didukung: SSD standar dan disk ultra.
Jaringan:
Hanya mendukung IPv4.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
gn5 mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Penyimpanan lokal (GiB) | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Queues | ENI | Alamat IPv4 privat per ENI |
ecs.gn5-c4g1.xlarge | 4 | 30 | NVIDIA P100 × 1 | 16 GB × 1 | 440 | 3 | 300.000 | 1 | 3 | 10 |
ecs.gn5-c8g1.2xlarge | 8 | 60 | NVIDIA P100 × 1 | 16 GB × 1 | 440 | 3 | 400.000 | 1 | 4 | 10 |
ecs.gn5-c4g1.2xlarge | 8 | 60 | NVIDIA P100 × 2 | 16 GB × 2 | 880 | 5 | 1.000.000 | 4 | 4 | 10 |
ecs.gn5-c8g1.4xlarge | 16 | 120 | NVIDIA P100 × 2 | 16 GB × 2 | 880 | 5 | 1.000.000 | 4 | 8 | 20 |
ecs.gn5-c28g1.7xlarge | 28 | 112 | NVIDIA P100 × 1 | 16 GB × 1 | 440 | 5 | 2.250.000 | 7 | 8 | 10 |
ecs.gn5-c8g1.8xlarge | 32 | 240 | NVIDIA P100 × 4 | 16 GB × 4 | 1760 | 10 | 2.000.000 | 8 | 8 | 20 |
ecs.gn5-c28g1.14xlarge | 56 | 224 | NVIDIA P100 × 2 | 16 GB × 2 | 880 | 10 | 4.500.000 | 14 | 8 | 20 |
ecs.gn5-c8g1.14xlarge | 54 | 480 | NVIDIA P100 × 8 | 16 GB × 8 | 3520 | 25 | 4.000.000 | 14 | 8 | 10 |
gn5i, keluarga instans komputasi dioptimalkan dengan akselerasi GPU
Skenario: Beban kerja komputasi GPU sisi server seperti inferensi pembelajaran mendalam dan enkode/dekode multimedia.
Komputasi:
Menggunakan GPU NVIDIA P4.
Rasio prosesor-memori 1:4.
Prosesor: Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.
Penyimpanan:
Instans I/O teroptimasi.
Kategori disk yang didukung: SSD standar dan disk ultra.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Performa jaringan suatu instans sebanding dengan tipe instansnya.
Keluarga instans gn5i mencakup tipe instans dan metrik berikut:
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth baseline jaringan (Gbit/s) | Laju pengalihan paket (PPS) | Queues | ENI | Alamat IPv4 privat per ENI | Alamat IPv6 per ENI |
ecs.gn5i-c2g1.large | 2 | 8 | NVIDIA P4 × 1 | 8 GB × 1 | 1 | 100.000 | 2 | 2 | 6 | 1 |
ecs.gn5i-c4g1.xlarge | 4 | 16 | NVIDIA P4 × 1 | 8 GB × 1 | 1,5 | 200.000 | 2 | 3 | 10 | 1 |
ecs.gn5i-c8g1.2xlarge | 8 | 32 | NVIDIA P4 × 1 | 8 GB × 1 | 2 | 400.000 | 4 | 4 | 10 | 1 |
ecs.gn5i-c16g1.4xlarge | 16 | 64 | NVIDIA P4 × 1 | 8 GB × 1 | 3 | 800.000 | 4 | 8 | 20 | 1 |
ecs.gn5i-c16g1.8xlarge | 32 | 128 | NVIDIA P4 × 2 | 8 GB × 2 | 6 | 1.200.000 | 8 | 8 | 20 | 1 |
ecs.gn5i-c28g1.14xlarge | 56 | 224 | NVIDIA P4 × 2 | 8 GB × 2 | 10 | 2.000.000 | 14 | 8 | 20 | 1 |