Instans yang dioptimalkan untuk komputasi dengan akselerasi GPU menawarkan komputasi paralel berkinerja-tinggi. Instans ini ideal untuk skenario komputasi paralel berskala besar dan dapat meningkatkan kinerja serta efisiensi bisnis Anda. Topik ini menjelaskan fitur dan spesifikasi keluarga instans ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU.
gn8v dan gn8v-tee, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Keluarga instans gn8v dan gn8v-tee hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakan keluarga instans ini, hubungi tenaga penjualan Alibaba Cloud.
Pengenalan:
gn8v: Keluarga instans ini merupakan keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang khusus untuk pelatihan model AI dan tugas inferensi model bahasa besar (LLM) ultra besar. Keluarga instans ini terdiri dari beberapa tipe instans yang menyediakan satu, dua, empat, atau delapan GPU per instans.
gn8v-tee: Untuk memenuhi persyaratan keamanan dalam pelatihan dan inferensi model bahasa besar, Alibaba Cloud menyediakan keluarga instans generasi kedelapan berbasis gn8v yang mencakup fitur komputasi rahasia. Tipe instans ini mengenkripsi data selama komputasi GPU guna memastikan keamanan data pengguna.
Skema penggunaan:
Komputasi inferensi paralel multi-GPU untuk LLM dengan lebih dari 70 miliar parameter
Pelatihan model AI tradisional dan pelatihan mengemudi otonom, di mana setiap GPU memberikan daya komputasi hingga 39,5 TFLOPS dalam format titik mengambang presisi tunggal (FP32)
Skema pelatihan model berukuran kecil dan menengah yang memanfaatkan koneksi NVLink antar-delapan GPU
Manfaat dan posisi pasar:
Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU dilengkapi memori HBM3 sebesar 96 GB dan memberikan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.
Bandwidth tinggi antar-GPU: Beberapa GPU saling terhubung melalui koneksi NVLink 900 GB/s. Efisiensi pelatihan dan inferensi multi-GPU jauh lebih tinggi dibandingkan generasi instans yang dioptimalkan untuk komputasi dengan akselerasi GPU sebelumnya.
Kuantisasi LLM: Keluarga instans ini mendukung daya komputasi dalam format titik mengambang 8-bit (FP8) dan mengoptimalkan daya komputasi untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi pelatihan dan inferensi serta mengurangi penggunaan memori.
(Hanya untuk keluarga instans gn8v-tee) Keamanan tinggi: Keluarga instans gn8v-tee mendukung kemampuan komputasi rahasia yang mencakup seluruh rantai tugas inferensi model. Kemampuan tersebut mencakup komputasi rahasia berbasis CPU Intel Trust Domain Extensions (TDX) dan komputasi rahasia berbasis GPU NVIDIA Confidential Computing (CC). Kemampuan komputasi rahasia ini menjamin keamanan data inferensi pengguna dan model perusahaan dalam tugas inferensi dan pelatihan model.
Komputasi:
Menggunakan prosesor Cloud Infrastructure Processing Unit (CIPU) 1.0 terbaru.
Mendekouple kemampuan komputasi dari kemampuan penyimpanan, sehingga Anda dapat memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda.
Menyediakan kemampuan mesin fisik untuk mendukung komunikasi peer-to-peer (P2P) antar-instans yang dipercepat GPU.
Menggunakan prosesor Intel Xeon Scalable generasi keempat dengan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua inti hingga 3,1 GHz.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
Mendukung disk elastis sementara, ESSD, disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Instans ini mendukung frame jumbo. Untuk informasi selengkapnya, lihat Frame jumbo.
Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket hingga 30.000.000 pps (untuk instans yang dilengkapi delapan GPU).
Mendukung antarmuka RDMA elastis (ERI).
- Catatan
Untuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Keamanan: Mendukung fitur Modul Platform Tepercaya (vTPM). Fitur ini didukung oleh gn8v tetapi tidak didukung oleh gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.
gn8v mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | ENI | Antrian NIC per ENI primer | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Maksimum disk cloud | IOPS dasar disk | Bandwidth dasar disk (GB/s) |
ecs.gn8v.4xlarge | 16 | 96 | 96 GB × 1 | 12 | 8 | 16 | 30 | 30 | 17 | 100.000 | 0,75 |
ecs.gn8v.6xlarge | 24 | 128 | 96 GB × 1 | 15 | 8 | 24 | 30 | 30 | 17 | 120.000 | 0,937 |
ecs.gn8v-2x.8xlarge | 32 | 192 | 96 GB × 2 | 20 | 8 | 32 | 30 | 30 | 25 | 200.000 | 1,25 |
ecs.gn8v-4x.8xlarge | 32 | 384 | 96 GB × 4 | 20 | 8 | 32 | 30 | 30 | 25 | 200.000 | 1,25 |
ecs.gn8v-2x.12xlarge | 48 | 256 | 96 GB × 2 | 25 | 8 | 48 | 30 | 30 | 33 | 300.000 | 1,50 |
ecs.gn8v-8x.16xlarge | 64 | 768 | 96 GB × 8 | 32 | 8 | 64 | 30 | 30 | 33 | 360.000 | 2,5 |
ecs.gn8v-4x.24xlarge | 96 | 512 | 96 GB × 4 | 50 | 15 | 64 | 30 | 30 | 49 | 500.000 | 3 |
ecs.gn8v-8x.48xlarge | 192 | 1024 | 96 GB × 8 | 100 | 15 | 64 | 50 | 50 | 65 | 1.000.000 | 6 |
gn8v-tee mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | ENI | Antrian NIC per ENI primer | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Maksimum disk cloud | IOPS dasar disk | Bandwidth dasar disk (GB/s) |
ecs.gn8v-tee.4xlarge | 16 | 96 | 96 GB × 1 | 12 | 8 | 16 | 30 | 30 | 17 | 100.000 | 0,75 |
ecs.gn8v-tee.6xlarge | 24 | 128 | 96 GB × 1 | 15 | 8 | 24 | 30 | 30 | 17 | 120.000 | 0,937 |
ecs.gn8v-tee-8x.16xlarge | 64 | 768 | 96 GB × 8 | 32 | 8 | 64 | 30 | 30 | 33 | 360.000 | 2,5 |
ecs.gn8v-tee-8x.48xlarge | 192 | 1024 | 96 GB × 8 | 100 | 15 | 64 | 50 | 50 | 65 | 1.000.000 | 6 |
Keluarga instans gn8v-tee hanya mendukung gambar Alibaba Cloud Linux 3. Jika Anda menggunakan gambar kustom yang dibuat dari Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernel minimal adalah 5.10.134-18.
gn8is, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.
Pengenalan: gn8is adalah keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dikembangkan sebagai respons terhadap pertumbuhan layanan konten yang dihasilkan AI (AIGC). Keluarga ini menggunakan GPU NVIDIA L20 terbaru dan menyediakan tipe instans dengan satu GPU, dua GPU, empat GPU, dan delapan GPU, serta tipe instans dengan rasio CPU-ke-GPU berbeda untuk memenuhi berbagai kebutuhan aplikasi.
Manfaat dan posisi pasar:
Pemrosesan grafis: Keluarga instans ini menggunakan prosesor Intel Xeon Scalable generasi keempat berfrekuensi tinggi untuk menyediakan daya komputasi CPU yang cukup bagi skenario pemodelan 3D, sehingga rendering dan desain grafis menjadi lebih lancar.
Tugas inferensi: Menggunakan GPU NVIDIA L20 baru dan menyediakan memori video 48 GB per GPU untuk mempercepat tugas inferensi. Keluarga ini mendukung format angka titik mengambang FP8 dan dapat digunakan bersama wadah ACK untuk mendukung inferensi berbagai model AIGC secara fleksibel. Keluarga ini sangat cocok untuk tugas inferensi model LLM dengan kurang dari 70 miliar parameter.
Skema penggunaan:
Animasi, efek khusus untuk film dan televisi, serta rendering
Generasi gambar AIGC dan inferensi LLM
Skema pengenalan AI umum lainnya, seperti pengenalan gambar dan pengenalan ucapan
Komputasi:
Menggunakan GPU enterprise-grade NVIDIA L20 baru.
Dukungan fitur percepatan seperti TensorRT dan format angka titik mengambang FP8 untuk meningkatkan kinerja inferensi LLM.
Hingga 48 GB memori per GPU dan dukungan inferensi LLM 70B atau lebih besar pada satu instans dengan banyak GPU.
Peningkatan kemampuan pemrosesan grafis. Misalnya, setelah Anda menginstal driver GRID pada instans gn8is menggunakan Asisten Cloud atau gambar Marketplace Alibaba Cloud, instans ini dapat memberikan kinerja pemrosesan grafis dua kali lipat dibandingkan instans generasi ketujuh.
Parameter utama NVIDIA L20:
Arsitektur GPU
Memori GPU
Kinerja komputasi
Kemampuan enkode/diodek video
Konektivitas antarkartu
NVIDIA Ada Lovelace
Kapasitas: 48 GB
Bandwidth: 864 GB/s
FP64: Tidak tersedia
FP32: 59,3 TFLOPS
FP16/BF16: 119 TFLOPS
FP8/INT8: 237 TFLOPS
3 × Encoder Video (+AV1)
3 × Decoder Video
4 × Decoder JPEG
Antarmuka PCIe: PCIe Gen4 x16
Bandwidth: 64 GB/s
Menggunakan prosesor Intel® Xeon® berfrekuensi tinggi terbaru yang memberikan frekuensi turbo semua inti 3,9 GHz untuk memenuhi kebutuhan pemodelan 3D kompleks.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
Mendukung disk elastis sementara, SSD Perusahaan (ESSD), disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Mendukung ERI.
CatatanUntuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Keamanan: Instans ini mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar komputasi tepercaya.
gn8is mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | ENI | Antrian NIC per ENI primer | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Maksimum disk cloud | IOPS dasar disk | Bandwidth dasar disk (GB/s) |
ecs.gn8is.2xlarge | 8 | 64 | L20 × 1 | 48 GB × 1 | 8 | 4 | 8 | 15 | 15 | 17 | 60.000 | 0,75 |
ecs.gn8is.4xlarge | 16 | 128 | L20 × 1 | 48 GB × 1 | 16 | 8 | 16 | 30 | 30 | 17 | 120.000 | 1,25 |
ecs.gn8is-2x.8xlarge | 32 | 256 | L20 × 2 | 48 GB × 2 | 32 | 8 | 32 | 30 | 30 | 33 | 250.000 | 2 |
ecs.gn8is-4x.16xlarge | 64 | 512 | L20 × 4 | 48 GB × 4 | 64 | 8 | 64 | 30 | 30 | 33 | 450.000 | 4 |
ecs.gn8is-8x.32xlarge | 128 | 1024 | L20 × 8 | 48 GB × 8 | 100 | 15 | 64 | 50 | 50 | 65 | 900.000 | 8 |
gn7e, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Ciri khas
Pengenalan:
Keluarga instans ini memungkinkan Anda memilih tipe instans dengan jumlah GPU dan CPU berbeda untuk memenuhi kebutuhan bisnis Anda dalam skenario AI.
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata virtual private cloud (VPC), jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.
Skema penggunaan:
Pelatihan AI skala kecil dan menengah
Bisnis komputasi berkinerja-tinggi (HPC) yang dipercepat menggunakan Compute Unified Device Architecture (CUDA)
Tugas inferensi AI yang memerlukan kemampuan pemrosesan GPU tinggi atau jumlah memori GPU besar
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
PentingSaat Anda menggunakan layanan pelatihan AI dengan beban komunikasi tinggi, seperti model transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, data dapat rusak akibat kegagalan tak terduga yang disebabkan oleh transmisi data skala besar melalui tautan Peripheral Component Interconnect Express (PCIe). Jika Anda tidak memahami topologi tautan komunikasi yang digunakan untuk layanan pelatihan AI, ajukan tiket untuk mendapatkan dukungan teknis.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Jenis disk yang didukung: ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi selengkapnya, lihat Ikhtisar Elastic Block Storage.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn7e mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.gn7e-c16g1.4xlarge | 16 | 125 | 80 GB × 1 | 8 | 3.000.000 | 8 | 8 | 10 | 1 |
ecs.gn7e-c16g1.8xlarge | 32 | 250 | 80 GB × 2 | 16 | 6.000.000 | 16 | 8 | 10 | 1 |
ecs.gn7e-c16g1.16xlarge | 64 | 500 | 80 GB × 4 | 32 | 12.000.000 | 32 | 8 | 10 | 1 |
ecs.gn7e-c16g1.32xlarge | 128 | 1000 | 80 GB × 8 | 64 | 24.000.000 | 32 | 16 | 15 | 1 |
gn7i, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk menyediakan kinerja ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga ini memanfaatkan percepatan jalur cepat pada chip untuk meningkatkan kinerja penyimpanan, kinerja jaringan, dan stabilitas komputasi hingga sepuluh kali lipat.
Skema penggunaan:
Tugas inferensi AI bersamaan yang memerlukan CPU, memori, dan GPU berkinerja-tinggi, seperti pengenalan gambar, pengenalan ucapan, dan identifikasi perilaku
Tugas pemrosesan grafisyang membutuhkan kemampuan virtualisasi grafis 3D berkinerja-tinggi, seperti desain grafis jarak jauh dan cloud gaming
Komputasi:
Menggunakan GPU NVIDIA A10 dengan fitur berikut:
Arsitektur NVIDIA Ampere inovatif
Dukungan fitur percepatan seperti RTX dan TensorRT
Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz.
Menyediakan memori hingga 752 GiB, jauh lebih besar dibandingkan keluarga instans gn6i.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Jenis disk yang didukung: ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi selengkapnya, lihat Ikhtisar Elastic Block Storage.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn7i mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.gn7i-c8g1.2xlarge | 8 | 30 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 1.600.000 | 8 | 4 | 15 | 15 |
ecs.gn7i-c16g1.4xlarge | 16 | 60 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 3.000.000 | 8 | 8 | 30 | 30 |
ecs.gn7i-c32g1.8xlarge | 32 | 188 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 6.000.000 | 12 | 8 | 30 | 30 |
ecs.gn7i-c32g1.16xlarge | 64 | 376 | NVIDIA A10 × 2 | 24 GB × 2 | 32 | 12.000.000 | 16 | 15 | 30 | 30 |
ecs.gn7i-c32g1.32xlarge | 128 | 752 | NVIDIA A10 × 4 | 24 GB × 4 | 64 | 24.000.000 | 32 | 15 | 30 | 30 |
ecs.gn7i-c48g1.12xlarge | 48 | 310 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 9.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-c56g1.14xlarge | 56 | 346 | NVIDIA A10 × 1 | 24 GB × 1 | 16 | 10.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-2x.8xlarge | 32 | 128 | NVIDIA A10 × 2 | 24 GB × 2 | 16 | 6.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-4x.8xlarge | 32 | 128 | NVIDIA A10 × 4 | 24 GB × 4 | 32 | 6.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7i-4x.16xlarge | 64 | 256 | NVIDIA A10 × 4 | 24 GB × 4 | 64 | 12.000.000 | 32 | 8 | 30 | 30 |
ecs.gn7i-8x.32xlarge | 128 | 512 | NVIDIA A10 × 8 | 24 GB × 8 | 64 | 24.000.000 | 32 | 16 | 30 | 30 |
ecs.gn7i-8x.16xlarge | 64 | 256 | NVIDIA A10 × 8 | 24 GB × 8 | 32 | 12.000.000 | 32 | 8 | 30 | 30 |
Anda hanya dapat mengubah tipe instans berikut ke ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge: ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge.
gn7s, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Untuk menggunakan keluarga instans gn7s, ajukan tiket untuk mengajukan permohonan.
Pengenalan:
Keluarga instans ini menggunakan prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Anda dapat memilih tipe instans yang terdiri dari kombinasi GPU dan vCPU yang sesuai untuk memenuhi kebutuhan bisnis Anda dalam skenario AI.
Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata VPC, jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.
Skema penggunaan: tugas inferensi AI bersamaan yang memerlukan CPU, memori, dan GPU berkinerja-tinggi, seperti pengenalan gambar, pengenalan ucapan, dan identifikasi perilaku.
Komputasi:
Menggunakan GPU NVIDIA A30 dengan fitur berikut:
Arsitektur NVIDIA Ampere inovatif
Dukungan fitur multi-instance GPU (MIG) dan fitur percepatan (berbasis Tensor core generasi kedua) untuk menyediakan dukungan bisnis yang beragam
Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz.
Ukuran memori meningkat secara signifikan dibandingkan keluarga instans generasi sebelumnya.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Jenis disk yang didukung: ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi selengkapnya, lihat Ikhtisar Elastic Block Storage.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn7s mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Antrian NIC | ENI |
ecs.gn7s-c8g1.2xlarge | 8 | 60 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 1.600.000 | 5 | 1 | 8 | 4 |
ecs.gn7s-c16g1.4xlarge | 16 | 120 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 3.000.000 | 5 | 1 | 8 | 8 |
ecs.gn7s-c32g1.8xlarge | 32 | 250 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 6.000.000 | 5 | 1 | 12 | 8 |
ecs.gn7s-c32g1.16xlarge | 64 | 500 | NVIDIA A30 × 2 | 24 GB × 2 | 32 | 12.000.000 | 5 | 1 | 16 | 15 |
ecs.gn7s-c32g1.32xlarge | 128 | 1000 | NVIDIA A30 × 4 | 24 GB × 4 | 64 | 24.000.000 | 10 | 1 | 32 | 15 |
ecs.gn7s-c48g1.12xlarge | 48 | 380 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 9.000.000 | 8 | 1 | 16 | 8 |
ecs.gn7s-c56g1.14xlarge | 56 | 440 | NVIDIA A30 × 1 | 24 GB × 1 | 16 | 10.000.000 | 8 | 1 | 16 | 8 |
gn7, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Skema penggunaan:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Jenis disk yang didukung: ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi selengkapnya, lihat Ikhtisar Elastic Block Storage.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn7 mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.gn7-c12g1.3xlarge | 12 | 94 | 40 GB × 1 | 4 | 2.500.000 | 4 | 8 | 10 | 1 |
ecs.gn7-c13g1.13xlarge | 52 | 378 | 40 GB × 4 | 16 | 9.000.000 | 16 | 8 | 30 | 30 |
ecs.gn7-c13g1.26xlarge | 104 | 756 | 40 GB × 8 | 30 | 18.000.000 | 16 | 15 | 10 | 1 |
gn6i, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Skema penggunaan:
Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk visi komputer, pengenalan ucapan, sintesis ucapan, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem rekomendasi
Rendering real-time untuk cloud gaming
Rendering real-time untuk aplikasi AR dan VR
Workstation grafis atau komputasi berat grafis
Database yang dipercepat GPU
Komputasi berkinerja-tinggi
Komputasi:
Menggunakan GPU NVIDIA T4 dengan fitur berikut:
Arsitektur NVIDIA Turing inovatif
16 GB memori (bandwidth 320 GB/s) per GPU
2.560 core CUDA per GPU
Hingga 320 core Tensor Turing per GPU
Core Tensor presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4
Menawarkan rasio CPU-ke-memori 1:4.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, SSD standar, dan disk ultra. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn6i mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | IOPS dasar disk | Multi-antrian | ENI | Jumlah alamat IPv4 pribadi per ENI | Jumlah alamat IPv6 per ENI |
ecs.gn6i-c4g1.xlarge | 4 | 15 | NVIDIA T4 × 1 | 16 GB × 1 | 4 | 2.500.000 | Tidak tersedia | 2 | 2 | 10 | 1 |
ecs.gn6i-c8g1.2xlarge | 8 | 31 | NVIDIA T4 × 1 | 16 GB × 1 | 5 | 2.500.000 | Tidak tersedia | 2 | 2 | 10 | 1 |
ecs.gn6i-c16g1.4xlarge | 16 | 62 | NVIDIA T4 × 1 | 16 GB × 1 | 6 | 2.500.000 | Tidak tersedia | 4 | 3 | 10 | 1 |
ecs.gn6i-c24g1.6xlarge | 24 | 93 | NVIDIA T4 × 1 | 16 GB × 1 | 7,5 | 2.500.000 | Tidak tersedia | 6 | 4 | 10 | 1 |
ecs.gn6i-c40g1.10xlarge | 40 | 155 | NVIDIA T4 × 1 | 16 GB × 1 | 10 | 1.600.000 | Tidak tersedia | 16 | 10 | 10 | 1 |
ecs.gn6i-c24g1.12xlarge | 48 | 186 | NVIDIA T4 × 2 | 16 GB × 2 | 15 | 4.500.000 | Tidak tersedia | 12 | 6 | 10 | 1 |
ecs.gn6i-c24g1.24xlarge | 96 | 372 | NVIDIA T4 × 4 | 16 GB × 4 | 30 | 4.500.000 | 250.000 | 24 | 8 | 10 | 1 |
gn6e, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Skema penggunaan:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
Komputasi:
Menggunakan GPU NVIDIA V100 yang masing-masing memiliki memori GPU 32 GB dan mendukung NVLink.
Menggunakan GPU NVIDIA V100 (berbasis SXM2) dengan fitur berikut:
Arsitektur NVIDIA Volta inovatif
32 GB memori HBM2 (bandwidth 900 GB/s) per GPU
5.120 core CUDA per GPU
640 core Tensor per GPU
Hingga enam koneksi NVLink dua arah per GPU, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah sehingga total bandwidth mencapai 300 Gbit/s (6 × 25 × 2 = 300)
Menawarkan rasio CPU-ke-memori 1:8.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Jenis disk yang didukung: ESSD, Disk ESSD AutoPL, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi selengkapnya, lihat Ikhtisar Elastic Block Storage.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
Tabel berikut mencantumkan tipe instans dan spesifikasi keluarga instans gn6e.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.gn6e-c12g1.3xlarge | 12 | 92 | 1 × NVIDIA V100 | 1 × 32 GB | 5 | 800.000 | 8 | 6 | 10 | 1 |
ecs.gn6e-c12g1.6xlarge | 24 | 184 | 2 × NVIDIA V100 | 2 × 32 GB | 8 | 1.200.000 | 8 | 8 | 20 | 1 |
ecs.gn6e-c12g1.12xlarge | 48 | 368 | 4 × NVIDIA V100 | 4 × 32 GB | 16 | 2.400.000 | 8 | 8 | 20 | 1 |
ecs.gn6e-c12g1.24xlarge | 96 | 736 | 8 × NVIDIA V100 | 8 × 32 GB | 32 | 4.500.000 | 16 | 8 | 20 | 1 |
gn6v, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Skema penggunaan:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
Komputasi:
Menggunakan GPU NVIDIA V100.
Menggunakan GPU NVIDIA V100 (berbasis SXM2) dengan fitur berikut:
Arsitektur NVIDIA Volta inovatif
16 GB memori HBM2 (bandwidth 900 GB/s) per GPU
5.120 core CUDA per GPU
640 core Tensor per GPU
Hingga enam koneksi NVLink dua arah per GPU, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah sehingga total bandwidth mencapai 300 Gbit/s (6 × 25 × 2 = 300)
Menawarkan rasio CPU-ke-memori 1:4.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, SSD standar, dan disk ultra. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn6v mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Pengalihan paket (pps) | IOPS dasar disk | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.gn6v-c8g1.2xlarge | 8 | 32 | NVIDIA V100 × 1 | 16 GB × 1 | 2,5 | 800.000 | Tidak tersedia | 4 | 4 | 10 | 1 |
ecs.gn6v-c8g1.4xlarge | 16 | 64 | NVIDIA V100 × 2 | 16 GB × 2 | 5 | 1.000.000 | Tidak tersedia | 4 | 8 | 20 | 1 |
ecs.gn6v-c8g1.8xlarge | 32 | 128 | NVIDIA V100 × 4 | 16 GB × 4 | 10 | 2.000.000 | Tidak tersedia | 8 | 8 | 20 | 1 |
ecs.gn6v-c8g1.16xlarge | 64 | 256 | NVIDIA V100 × 8 | 16 GB × 8 | 20 | 2.500.000 | Tidak tersedia | 16 | 8 | 20 | 1 |
ecs.gn6v-c10g1.20xlarge | 82 | 336 | NVIDIA V100 × 8 | 16 GB × 8 | 35 | 4.500.000 | 250.000 | 16 | 8 | 20 | 1 |
ebmgn9g, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Keluarga instans ebmgn9g sedang dalam pratinjau undangan. Untuk menggunakannya, Anda dapat mengajukan tiket.
Pengenalan: ebmgn9g adalah keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kesembilan, lengkap fitur, dan hemat biaya dari Alibaba Cloud. Keluarga ini menggunakan CIPU 2.0 terbaru untuk memberikan layanan cloud. Dilengkapi CPU berfrekuensi tinggi, memori berkapasitas besar, dan GPU profesional berarsitektur Blackwell terbaru, keluarga instans ini menyediakan komputasi GPU cloud hemat biaya untuk pelatihan mengemudi otonom dan AI berwujud, inferensi model bahasa besar, rendering film dan animasi, layanan metaverse dan cloud gaming, serta beban kerja lain yang dipercepat GPU.
Skema penggunaan dan fitur utama:
Mengemudi otonom dan AI berwujud:
Menyediakan 256 vCPU. Semua core CPU berjalan pada frekuensi hingga 4,2 GHz atau lebih tinggi. Dipasangkan dengan memori 2,3 TB, keluarga ini mendukung kebutuhan pemrosesan data untuk pelatihan mengemudi otonom dan AI berwujud.Pencarian dan rekomendasi:
GPU Blackwell memberikan daya komputasi TF32 berkinerja-tinggi sebesar 137 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk beban kerja pencarian dan iklan.Inferensi model besar:
GPU generasi terbaru memberikan daya komputasi lebih tinggi dibandingkan keluarga instans generasi kedelapan. Bandwidth memori GPU ditingkatkan menjadi 1344 GB/s. Dukungan baru untuk komputasi FP4 secara signifikan meningkatkan kinerja inferensi dan efisiensi biaya. Delapan GPU dihubungkan melalui PCIe Gen5, yang memberikan bandwidth antar-GPU sebesar 128 GB/s dan sangat meningkatkan efisiensi inferensi paralel multi-GPU.Cloud gaming, rendering, dan metaverse:
CPU mencapai frekuensi clock hingga 5 GHz, menjadikannya pilihan utama untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan mencakup driver grafis kelas workstation yang telah disertifikasi untuk desain profesional. Keluarga ini sepenuhnya mempercepat OpenGL, menjadikannya pilihan terbaik untuk pengembangan film dan animasi kelas atas serta desain berbantu komputer (CAD).
Didukung oleh prosesor cloud CIPU 2.0 terbaru:
CIPU generasi kedua memberikan daya pemrosesan cloud yang lebih tinggi dan peningkatan kinerja komponen eRDMA, VPC, dan EBS. Instans Mesin Fisik ECS memberikan akses langsung ke sumber daya fisik. Keluarga ini juga mendukung beban kerja yang memerlukan lisensi terikat perangkat keras. Wadah seperti Docker, Clear Container, dan Pouch didukung.
Komputasi:
Menampilkan GPU profesional berarsitektur Blackwell terbaru:
Mendukung OpenGL untuk pemrosesan grafis kelas profesional.
Mendukung fitur percepatan umum seperti RTX dan TensorRT. Baru ditingkatkan untuk mendukung interkoneksi FP4 dan PCIe Gen5.
Menggunakan interkoneksi PCIe Switch. Dibandingkan dengan koneksi langsung ke CPU, kinerja NCCL meningkat 36%. Untuk inferensi model besar terbagi multi-GPU, kinerja puncak meningkat hingga 9%.
Spesifikasi GPU:
Arsitektur GPU
Memori GPU
Kinerja komputasi
Kemampuan enkode/dekode video
Interkoneksi antar-GPU
API yang dipercepat
Blackwell
Kapasitas: 48 GB
Bandwidth: 1344 GB/s
TF32: 126 TFLOPS
FP32: 52 TFLOPS
FP16/BF16: 266 TFLOPS
FP8/INT8: 533 TFLOPS
FP4: 970 TFLOPS
Core RT: 196 TFLOPS
3 × Encoder Video
3 × Decoder Video
PCIe Gen5 x16: 128 GB/s
Dukungan P2P
Mendukung DX12,
OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, DirectCompute
Prosesor: Menggunakan prosesor AMD Turin-C (SPR) dengan frekuensi clock 3,3 GHz hingga 5 GHz. Frekuensi semua core hingga 4,2 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung protokol NVMe. Untuk detailnya, lihat Protokol NVMe.
Jenis disk yang didukung termasuk Disk elastis sementara, ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi lebih lanjut tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi lebih lanjut tentang komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan ultra-tinggi hingga 30 juta PPS untuk pengalihan paket.
Mendukung Antarmuka RDMA Elastis (ERI). Dalam jaringan VPC, ERI memungkinkan akselerasi tembus RDMA dan meningkatkan bandwidth hingga 360 Gbit/s. Anda dapat menggunakannya untuk mengemudi otonom, AI berwujud, visi komputer (CV), dan pelatihan model tradisional.
CatatanUntuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan .
Tipe instans ebmgn9g
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (PPS) | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Multi-antrian (ENI primer / ENI sekunder) | Elastic Network Interface (ENI) | Jumlah maksimum disk data | Bandwidth disk maksimum (GB/s) |
ecs.ebmgn9g.64xlarge | 256 | 2304 | 48 GB × 8 | 360 (180 × 2) | 30 juta | 30 | 30 | 64 / 16 | 38 | 33 | 8 |
Instans ebmgn9g harus boot menggunakan mode UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
ebmgn9ge, Keluarga Instans Mesin Fisik ECS yang Dioptimalkan untuk Komputasi dengan Akselerasi GPU
Keluarga instans ebmgn9ge sedang dalam pratinjau undangan. Untuk menggunakan keluarga instans ini, ajukan tiket.
Pengenalan: Keluarga ebmgn9ge adalah keluarga instans Mesin Fisik ECS generasi kesembilan, lengkap fitur, dan hemat biaya dari Alibaba Cloud. Keluarga ini menggunakan CIPU 2.0 terbaru dan menampilkan CPU berfrekuensi tinggi, kapasitas memori besar, serta kartu grafis profesional berbasis arsitektur Blackwell terbaru. Kombinasi ini memberikan akselerasi GPU hemat biaya untuk skenario seperti pelatihan mengemudi otonom dan intelijensi berwujud, inferensi model bahasa besar (LLM), rendering film dan animasi, serta layanan metaverse atau cloud gaming.
Skema penggunaan dan fitur:
Mengemudi otonom dan intelijensi berwujud:
Instans ini menyediakan 256 vCPU dengan semua core berjalan di atas 4,2 GHz dan memori 2,3 TB, memenuhi persyaratan pemrosesan data untuk pelatihan mengemudi otonom dan intelijensi berwujud.Pencarian dan rekomendasi:
GPU Blackwell memberikan daya komputasi TF32 berkinerja-tinggi sebesar 137 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, menawarkan konfigurasi optimal untuk layanan pencarian dan periklanan.Inferensi model besar:
Instans ebmgn9ge dirancang untuk model bahasa besar. Instans ini menyediakan memori GPU 72 GB per kartu dan bandwidth memori 1344 GB/s, memungkinkan inferensi berkinerja-tinggi untuk skenario LLM. Dengan arsitektur komputasi FP4 baru dan bandwidth PCIe generasi kelima sebesar 128 GB/s, instans ini mendukung inferensi paralel 8-kartu untuk model dengan lebih dari 671 miliar parameter.
Cloud gaming, rendering, dan metaverse:
CPU mencapai frekuensi clock tinggi hingga 5 GHz, menjadikannya ideal untuk pemodelan 3D. GPU secara native mendukung grafis dan mencakup driver kelas workstation yang disertifikasi untuk desain profesional. Instans ini juga mendukung akselerasi OpenGL lengkap, menjadikannya pilihan optimal untuk pengembangan film dan animasi kelas atas serta desain berbantu komputer (CAD).
Menggunakan prosesor cloud CIPU 2.0 terbaru:
CIPU generasi kedua memberikan daya pemrosesan cloud yang lebih tinggi dan peningkatan kemampuan komputasi untuk komponen elastic Remote Direct Memory Access (eRDMA), VPC, dan EBS. Instans Mesin Fisik ECS memungkinkan akses langsung ke sumber daya fisik dan ideal untuk beban kerja yang memerlukan lisensi terikat perangkat keras. Instans ini mendukung wadah seperti Docker, Clear Container, dan Pouch.
Komputasi:
Menggunakan kartu grafis profesional berbasis arsitektur Blackwell terbaru:
Mendukung pemrosesan grafis OpenGL kelas profesional.
Mendukung fitur percepatan umum seperti RTX dan TensorRT dan baru ditingkatkan untuk mendukung interkoneksi FP4 dan PCIe Gen5.
Menggunakan PCIe Switch untuk interkoneksi. Dibandingkan dengan koneksi langsung ke CPU, ini meningkatkan kinerja NCCL sebesar 36% dan meningkatkan kinerja hingga 9% untuk inferensi model besar multi-kartu terbagi.
Parameter utama GPU:
Arsitektur GPU
Memori GPU
Kinerja komputasi
Kemampuan enkode/dekode video
Koneksi antarkartu
API Akselerasi
Blackwell
Kapasitas: 72 GB
Bandwidth: 1344 GB/s
TF32: 126 TFLOPS
FP32: 52 TFLOPS
FP16/BF16: 266 TFLOPS
FP8/INT8: 533 TFLOPS
FP4: 970 TFLOPS
Core RT: 196 TFLOPS
3 × Encoder Video
3 × Decoder Video
PCIe Gen5 x16: 128 GB/s
Dukungan P2P
Mendukung DX12,
OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute
Prosesor: Prosesor AMD Turin-C (SPR) dengan frekuensi clock berkisar antara 3,3 GHz hingga 5 GHz. Semua core dapat mencapai hingga 4,2 GHz.
Penyimpanan:
Instans dioptimalkan untuk I/O.
Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Protokol NVMe.
Jenis disk yang didukung: Disk elastis sementara, ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
Kinerja jaringan ultra-tinggi dengan kemampuan pengalihan paket 30 juta PPS.
Mendukung Antarmuka RDMA Elastis (ERI). ERI memungkinkan akselerasi tembus RDMA untuk interkoneksi dipercepat dalam VPC, meningkatkan bandwidth hingga 360 Gbit/s. Fitur ini dapat digunakan untuk tugas pelatihan dalam mengemudi otonom, intelijensi berwujud, visi komputer (CV), dan model tradisional.
CatatanUntuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Tabel berikut mencantumkan tipe instans dan spesifikasi untuk keluarga ebmgn9ge.
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (PPS) | Alamat IPv4 pribadi per NIC | Alamat IPv6 per NIC | Antrian (NIC primer/NIC sekunder) | ENI | Jumlah maksimum disk data | Bandwidth disk maksimum (GB/s) |
ecs.ebmgn9ge.64xlarge | 256 | 2304 | 72 GB × 8 | 360 (180 × 2) | 30 juta | 30 | 30 | 64/16 | 38 | 33 | 8 |
Gambar untuk tipe instans ebmgn9ge harus menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
ebmgn9gc, Keluarga Instans Mesin Fisik ECS yang Dioptimalkan untuk Komputasi dengan Akselerasi GPU
Keluarga instans ebmgn9gc sedang dalam pratinjau undangan. Untuk menggunakan keluarga instans ini, Anda harus mengajukan tiket.
Pengenalan: ebmgn9gc adalah instans Mesin Fisik ECS generasi kesembilan, hemat biaya, dan lengkap fitur dari Alibaba Cloud. Instans ini dilengkapi dengan CIPU 2.0 terbaru, CPU berfrekuensi tinggi, memori berkapasitas besar, dan GPU profesional berarsitektur Blackwell. Keluarga instans ini menyediakan komputasi cloud GPU hemat biaya untuk beban kerja seperti pelatihan mengemudi otonom dan AI berwujud, inferensi LLM, rendering film dan animasi, serta layanan metaverse dan cloud gaming.
Skema penggunaan dan fitur:
Mengemudi otonom dan AI berwujud:
Instans ini menyediakan 256 vCPU dengan semua core berjalan pada frekuensi clock hingga 4,2 GHz, dan memori 2,3 TB. Konfigurasi ini memenuhi persyaratan pemrosesan data yang menuntut untuk pelatihan mengemudi otonom dan AI berwujud.Pencarian dan rekomendasi:
GPU Blackwell memberikan daya komputasi TF32 berkinerja-tinggi sebesar 137 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, yang memberikan konfigurasi optimal untuk beban kerja pencarian dan periklanan.Inferensi model:
Instans ebmgn9gc dirancang khusus untuk model bahasa besar, menawarkan memori GPU 72 GB per GPU dan bandwidth memori GPU hingga 1344 GB/s. Instans ini menyediakan daya komputasi inferensi berkinerja-tinggi untuk skenario LLM, mendukung arsitektur komputasi FP4 baru, dan menampilkan bandwidth PCIe generasi kelima sebesar 128 GB/s. Hal ini memungkinkan inferensi paralel model besar dengan lebih dari 671 miliar parameter di delapan GPU.
Cloud gaming, rendering, dan metaverse:
CPU memiliki frekuensi clock hingga 5 GHz, yang ideal untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan mencakup driver grafis kelas workstation yang disertifikasi untuk aplikasi desain profesional. Instans ini sepenuhnya mempercepat OpenGL, yang menjadikannya pilihan unggul untuk pengembangan film dan animasi kelas atas serta desain CAD.
Didukung oleh prosesor cloud CIPU 2.0 terbaru:
CIPU generasi kedua memberikan peningkatan kemampuan pemrosesan cloud, termasuk peningkatan kinerja untuk komponen eRDMA, VPC, dan EBS. Instans Mesin Fisik ECS memberikan akses langsung ke perangkat keras fisik atau mendukung beban kerja yang memerlukan lisensi terikat perangkat keras. CIPU generasi kedua mendukung wadah seperti Docker, Clear Containers, dan Pouch.
Komputasi:
Instans ini menggunakan GPU profesional berbasis arsitektur Blackwell:
Mendukung OpenGL untuk pemrosesan grafis kelas profesional.
Mendukung fitur percepatan umum, seperti RTX dan TensorRT, bersama dengan interkoneksi FP4 dan PCIe Gen5.
Instans ini menggunakan interkoneksi PCIe Switch. Dibandingkan dengan koneksi langsung ke CPU, hal ini meningkatkan kinerja NCCL sebesar 36%. Untuk inferensi LLM multi-GPU terbagi, kinerja puncak meningkat hingga 9%.
Spesifikasi GPU:
Arsitektur GPU
Memori GPU
Kinerja komputasi
Kemampuan enkode/dekode video
Interkoneksi GPU-ke-GPU
API yang Dipercepat
Blackwell
Kapasitas: 72 GB
Bandwidth: 1344 GB/s
TF32: 126 TFLOPS
FP32: 52 TFLOPS
FP16/BF16: 266 TFLOPS
FP8/INT8: 533 TFLOPS
FP4: 970 TFLOPS
Core RT: 196 TFLOPS
3 × Encoder Video
3 × Decoder Video
PCIe Gen5 x16: 128 GB/s
Dukungan peer-to-peer (P2P)
Mendukung DX12,
OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute
Prosesor: Instans ini menggunakan prosesor AMD Turin-C (SPR) dengan frekuensi clock 3,3 GHz hingga 5 GHz. Frekuensi clock semua core hingga 4,2 GHz.
Penyimpanan:
Instans dioptimalkan untuk I/O.
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Protokol NVMe.
Jenis disk yang didukung adalah Disk elastis sementara, ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi selengkapnya tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
Instans ini menyediakan kinerja jaringan ultra-tinggi dengan hingga 30 juta PPS untuk pengalihan paket.
Instans ini mendukung Antarmuka RDMA Elastis (ERI). Dalam VPC, ERI memungkinkan akselerasi tembus RDMA dan meningkatkan bandwidth hingga 360 Gbit/s. Fitur ini ideal untuk mengemudi otonom, AI berwujud, visi komputer (CV), dan pelatihan model tradisional.
CatatanUntuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Tabel berikut mencantumkan tipe instans dan spesifikasi untuk keluarga ebmgn9gc.
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (PPS) | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Multi-antrian (ENI primer / ENI sekunder) | Elastic Network Interface (ENI) | Jumlah maksimum disk data | Bandwidth disk maksimum (GB/s) |
ecs.ebmgn9gc.64xlarge | 256 | 1536 | 72 GB × 8 | 360 (180 × 2) | 30 juta | 30 | 30 | 64 / 16 | 38 | 33 | 8 |
Instans ebmgn9gc harus boot dari gambar yang dikonfigurasi untuk mode UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
ebmgn8v, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.
Pengenalan: Keluarga instans ini adalah keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang khusus untuk pelatihan model AI dan model ultra-besar. Setiap instans dalam keluarga ini dilengkapi delapan GPU.
Skema penggunaan:
Komputasi inferensi paralel multi-GPU untuk LLM dengan lebih dari 70 miliar parameter
Pelatihan model AI tradisional dan pelatihan mengemudi otonom, di mana setiap GPU memberikan daya komputasi hingga 39,5 TFLOPS dalam format titik mengambang presisi tunggal (FP32)
Skema pelatihan model berukuran kecil dan menengah yang memanfaatkan koneksi NVLink antar-delapan GPU
Manfaat dan posisi pasar:
Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU dilengkapi memori HBM3 sebesar 96 GB dan memberikan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.
Bandwidth tinggi antar-GPU: Beberapa GPU saling terhubung melalui koneksi NVLink 900 GB/s. Efisiensi pelatihan dan inferensi multi-GPU jauh lebih tinggi dibandingkan generasi instans yang dioptimalkan untuk komputasi dengan akselerasi GPU sebelumnya.
Kuantisasi model besar: Keluarga instans ini mendukung daya komputasi dalam format titik mengambang 8-bit (FP8) dan mengoptimalkan daya komputasi untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi pelatihan dan inferensi serta mengurangi penggunaan memori.
Komputasi:
Menggunakan prosesor CIPU 1.0 terbaru.
Mendekouple kemampuan komputasi dari kemampuan penyimpanan, memungkinkan Anda memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda, dan meningkatkan bandwidth antar-instans hingga 160 Gbit/s untuk transmisi dan pemrosesan data lebih cepat dibandingkan keluarga instans generasi ketujuh.
Menggunakan kemampuan mesin fisik yang disediakan oleh prosesor CIPU untuk mendukung komunikasi peer-to-peer (P2P) antar-instans yang dipercepat GPU.
Menggunakan prosesor Intel Xeon Scalable generasi keempat yang memberikan frekuensi turbo semua inti hingga 3,1 GHz dan menyediakan 192 vCPU.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
Mendukung disk elastis sementara, ESSD, disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 30.000.000 pps.
Mendukung ERI untuk memungkinkan komunikasi berbasis RDMA antar-instans dalam VPC dan menyediakan bandwidth hingga 160 Gbit/s per instans, yang cocok untuk tugas pelatihan berbasis model CV dan model tradisional.
CatatanUntuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Tipe instans ebmgn8v
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Antrian NIC (ENI Primer/ENI Sekunder) | ENI | Jumlah maksimum disk data yang dipasang | Bandwidth disk maksimum (Gbit/s) |
ecs.ebmgn8v.48xlarge | 192 | 1024 | 96GB*8 | 170 (85 * 2) | 30.000.000 | 30 | 30 | 64 | 32 | 31 | 6 |
Mode boot gambar yang digunakan oleh instans keluarga ini harus UEFI. Jika Anda ingin menggunakan gambar kustom pada instans, pastikan gambar tersebut mendukung mode boot UEFI dan mode boot gambar diatur ke UEFI. Untuk informasi tentang cara mengatur mode boot gambar kustom, lihat Mode boot instans.
ebmgn8ia, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.
Pengenalan: Keluarga instans ini adalah generasi kedelapan instans komputasi percepatan Mesin Fisik ECS dari Alibaba Cloud, dirancang untuk aplikasi seperti pencarian, rekomendasi, dan simulasi yang memerlukan jumlah sumber daya vCPU tinggi per GPU. Keluarga ini didukung oleh GPU NVIDIA L20 terbaru, dan setiap instans merupakan host mesin fisik tunggal yang dilengkapi dua CPU berfrekuensi tinggi dan empat GPU.
Manfaat dan Skema penggunaan:
Frekuensi clock tinggi: Produk ini didukung oleh dua prosesor AMD EPYC™ Genoa 9T34. Setiap prosesor memiliki 64 core fisik, menyediakan total 256 vCPU dengan frekuensi clock berkisar antara 3,4 GHz hingga 3,75 GHz. Konfigurasi ini secara signifikan meningkatkan kinerja CPU single-core, menjadikannya ideal untuk pemodelan CAD dan mempercepat pra-pemrosesan untuk simulasi CAE.
Alokasi sumber daya jarang: Setiap GPU dipasangkan rata-rata dengan 64 vCPU dan memori 384 GiB, menyediakan bandwidth memori rata-rata 230 GB/s. Konfigurasi ini ideal untuk skenario komputasi GPU yang memerlukan throughput I/O tinggi, seperti periklanan, pencarian, rekomendasi, dan simulasi CAE tradisional. Konfigurasi ini juga mendukung tugas produksi film dan televisi tertentu yang bergantung pada rendering CPU.
Menggunakan prosesor CIPU 1.0 terbaru yang memberikan manfaat berikut:
Mendekouple kemampuan komputasi dari kemampuan penyimpanan, memungkinkan Anda memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda, dan meningkatkan bandwidth antar-instans hingga 160 Gbit/s untuk transmisi dan pemrosesan data lebih cepat dibandingkan keluarga instans generasi sebelumnya.
Menggunakan kemampuan mesin fisik yang disediakan oleh prosesor CIPU untuk mendukung komunikasi Peripheral Component Interconnect Express (PCIe) P2P antar-instans yang dipercepat GPU.
Komputasi:
Dengan GPU Enterprise NVIDIA L20 baru:
Dukungan fitur percepatan seperti vGPU, teknologi RTX, dan mesin inferensi TensorRT.
Dukungan presisi titik mengambang 8-bit meningkatkan efisiensi komputasi.
Parameter utama NVIDIA L20:
Arsitektur GPU
Memori GPU
Kinerja komputasi
Kemampuan codec video
Interkoneksi antarkartu
NVIDIA Ada Lovelace
Kapasitas: 48 GB
Bandwidth: 864 GB/s
FP64: Tidak tersedia
FP32: 59,3 TFLOPS
FP16/BF16: 119 TFLOPS
FP8/INT8: 237 TFLOPS
3 * Encoder Video (+AV1)
3 * Decoder Video
4 * Decoder JPEG
Antarmuka PCIe: PCIe Gen4 x16
Bandwidth: 64 GB/s
Prosesor: AMD EPYC™ Genoa 9T34, 3,4 GHz hingga 3,75 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
Mendukung disk elastis sementara, ESSD, disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Newtork:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 30.000.000 pps.
Mendukung ERI untuk memungkinkan komunikasi berbasis RDMA antar-instans dalam VPC dan menyediakan bandwidth hingga 160 Gbit/s per instans, yang cocok untuk tugas pelatihan berbasis model CV dan model tradisional.
CatatanUntuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Tipe instans ebmgn8ia
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Antrian NIC (ENI Primer/ENI Sekunder) | ENI | Jumlah maksimum disk data yang dipasang | Bandwidth disk maksimum (Gbit/s) |
ecs.ebmgn8ia.64xlarge | 256 | 1536 | L20 * 4 | 48GB * 4 | 160 (80 × 2) | 30.000.000 | 30 | 30 | 64/16 | 32 | 31 | 6 |
Mode boot gambar yang digunakan oleh instans keluarga ini harus UEFI. Jika Anda ingin menggunakan gambar kustom pada instans, pastikan gambar tersebut mendukung mode boot UEFI dan mode boot gambar diatur ke UEFI. Untuk informasi tentang cara mengatur mode boot gambar kustom, lihat Mode boot instans.
ebmgn8is, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.
Pengenalan: ebmgn8is adalah generasi kedelapan keluarga spesifikasi komputasi percepatan (keluarga instans Mesin Fisik ECS) yang diluncurkan oleh Alibaba Cloud untuk mengatasi perkembangan terkini bisnis pembuatan konten AI. Keluarga ini menggunakan GPU NVIDIA L20 terbaru. Setiap instans merupakan host mesin fisik yang menggunakan delapan kartu komputasi GPU.
Manfaat dan posisi pasar:
Pemrosesan grafis: Keluarga instans ini menggunakan prosesor Intel Xeon Scalable generasi keempat berfrekuensi tinggi untuk memberikan daya komputasi CPU yang cukup dalam skenario pemodelan 3D dan mencapai rendering dan desain grafis yang lancar.
Tugas inferensi: menggunakan memori GPU NVIDIA L20 baru sebesar 48 GB pada satu kartu GPU untuk mempercepat tugas inferensi. Keluarga ini mendukung format titik mengambang FP8 dan mendukung inferensi berbasis berbagai model AIGC, terutama untuk tugas inferensi yang menggunakan model LLM di bawah 70 MB.
Tugas pelatihan: Keluarga instans ini menyediakan kemampuan komputasi hemat biaya dan memberikan kinerja komputasi FP32 dua kali lipat dibandingkan instans inferensi generasi ketujuh. Instans keluarga ini cocok untuk pelatihan model CV berbasis FP32 dan model kecil-menengah lainnya.
Skema penggunaan:
Produksi dan rendering efek khusus untuk animasi, film, dan televisi berdasarkan kemampuan pemrosesan grafis kelas workstation dalam skenario di mana gambar GRID Marketplace Alibaba Cloud digunakan, driver GRID diinstal, dan kemampuan grafis OpenGL dan Direct3D diaktifkan
Skenario di mana layanan manajemen yang disediakan oleh Container Service for Kubernetes (ACK) untuk aplikasi wadah digunakan untuk mendukung konten grafis yang dihasilkan AI dan tugas inferensi LLM dengan hingga 130 miliar parameter
Skema pengenalan AI umum lainnya, pengenalan gambar, dan pengenalan ucapan
Menggunakan prosesor CIPU 1.0 terbaru yang memberikan manfaat berikut:
Mendekouple kemampuan komputasi dari kemampuan penyimpanan, memungkinkan Anda memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda, dan meningkatkan bandwidth antar-instans hingga 160 Gbit/s untuk transmisi dan pemrosesan data lebih cepat dibandingkan keluarga instans generasi sebelumnya.
Menggunakan kemampuan mesin fisik yang disediakan oleh prosesor CIPU untuk mendukung komunikasi PCIe P2P antar-instans yang dipercepat GPU.
Komputasi:
Dengan GPU Enterprise NVIDIA L20 baru:
Dukungan fitur percepatan seperti vGPU, teknologi RTX, dan mesin inferensi TensorRT
Dukungan interkoneksi PCIe Switch, yang mencapai peningkatan kinerja 36% pada Perpustakaan Komunikasi Kolektif NVIDIA (NCCL) dibandingkan skema koneksi langsung CPU dan membantu meningkatkan kinerja inferensi hingga 9% saat menjalankan tugas inferensi LLM multi-GPU secara paralel
Parameter utama NVIDIA L20:
Arsitektur GPU
Memori GPU
Kinerja komputasi
Kemampuan codec video
Interkoneksi antarkartu
NVIDIA Ada Lovelace
Kapasitas: 48 GB
Bandwidth: 864 GB/s
FP64: Tidak tersedia
FP32: 59,3 TFLOPS
FP16/BF16: 119 TFLOPS
FP8/INT8: 237 TFLOPS
3 * Encoder Video(+AV1)
3 * Decoder Video
4 * Decoder JPEG
Antarmuka PCIe: PCIe Gen4 x16
Bandwidth: 64 GB/s
Menggunakan prosesor Intel® Xeon® Scalable (SPR) 3,4 GHz yang memberikan frekuensi turbo semua inti hingga 3,9 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
Mendukung disk elastis sementara, ESSD, disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 30.000.000 pps.
Mendukung ERI untuk memungkinkan komunikasi berbasis RDMA antar-instans dalam VPC dan menyediakan bandwidth hingga 160 Gbit/s per instans, yang cocok untuk tugas pelatihan berbasis model CV dan model tradisional.
CatatanUntuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.
Tipe instans ebmgn8is
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI | Antrian NIC (ENI Primer/ENI Sekunder) | ENI | Jumlah maksimum disk data yang dipasang | Bandwidth disk maksimum (Gbit/s) |
ecs.ebmgn8is.32xlarge | 128 | 1024 | L20 * 8 | 48GB*8 | 160 (80 × 2) | 30.000.000 | 30 | 30 | 64/16 | 32 | 31 | 6 |
Mode boot gambar yang digunakan oleh instans keluarga ini harus UEFI. Jika Anda ingin menggunakan gambar kustom pada instans, pastikan gambar tersebut mendukung mode boot UEFI dan mode boot gambar diatur ke UEFI. Untuk informasi tentang cara mengatur mode boot gambar kustom, lihat Mode boot instans.
ebmgn7e, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.
Skema penggunaan:
Pelatihan dan pengembangan pembelajaran mendalam
Komputasi berkinerja-tinggi (HPC) dan simulasi
PentingSaat Anda menggunakan layanan pelatihan AI yang memiliki beban komunikasi tinggi, seperti model transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, data dapat rusak akibat kegagalan tak terduga yang disebabkan oleh transmisi data skala besar melalui tautan Peripheral Component Interconnect Express (PCIe). Jika Anda tidak memahami topologi tautan komunikasi yang digunakan untuk layanan pelatihan AI, ajukan tiket untuk mendapatkan dukungan teknis.
Komputasi:
Menggunakan prosesor Intel® Xeon® Scalable 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz dan mendukung antarmuka PCIe 4.0.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 24.000.000 pps.
Tipe instans ebmgn7e
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC (NIC Primer/NIC Sekunder) | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.ebmgn7e.32xlarge | 128 | 1024 | 80GB * 8 | 64 | 24.000.000 | 32/12 | 32 | 10 | 1 |
Anda harus memeriksa status fitur multi-instance GPU (MIG) dan mengaktifkan atau menonaktifkan fitur MIG setelah memulai instans ebmgn7e. Untuk informasi tentang fitur MIG, lihat Panduan Pengguna Multi-Instance GPU NVIDIA.
Tabel berikut menjelaskan apakah fitur MIG didukung oleh tipe instans dalam keluarga instans ebmgn7e.
Tipe instans | Dukungan MIG | Deskripsi |
ecs.ebmgn7e.32xlarge | Ya | Fitur MIG didukung oleh instans ebmgn7e. |
ebmgn7i, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.
Skema penggunaan:
Tugas inferensi AI bersamaan yang memerlukan CPU, memori, dan GPU berkinerja-tinggi, seperti pengenalan gambar, pengenalan ucapan, dan identifikasi perilaku
Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berkinerja-tinggi, seperti desain grafis jarak jauh dan cloud gaming
Skema yang memerlukan bandwidth jaringan dan bandwidth disk tinggi, seperti pembuatan render farm berkinerja-tinggi
Aplikasi pelatihan dan pembelajaran mendalam skala kecil yang memerlukan bandwidth jaringan tinggi
Komputasi:
Menggunakan GPU NVIDIA A10 yang memiliki fitur berikut:
Arsitektur NVIDIA Ampere inovatif
Dukungan fitur percepatan seperti vGPU, teknologi RTX, dan mesin inferensi TensorRT
Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 24.000.000 pps.
Tipe instans ebmgn7i
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.ebmgn7i.32xlarge | 128 | 768 | NVIDIA A10 * 4 | 24GB * 4 | 64 | 24.000.000 | 32 | 32 | 10 | 1 |
Keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU ebmgn7
Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.
Skema penggunaan:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
Komputasi:
Menggunakan prosesor Intel® Xeon® Platinum 8269CY (Cascade Lake) 2,5 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, dan ESSD Regional. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
Tipe instans ebmgn7
Tipe instans | vCPU | Memori (GiB) | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.ebmgn7.26xlarge | 104 | 768 | 40GB*8 | 30 | 18.000.000 | 16 | 15 | 10 | 1 |
Anda harus memeriksa dan memutuskan apakah akan mengaktifkan atau menonaktifkan fitur MIG setelah memulai instans ebmgn7. Sistem tidak menjamin bahwa fitur MIG diaktifkan atau dinonaktifkan. Untuk informasi selengkapnya tentang MIG, lihat Panduan Pengguna Multi-Instance GPU NVIDIA.
Tabel berikut menjelaskan apakah instans ebmgn7 mendukung MIG.
Tipe instans | Dukungan MIG | Deskripsi |
ecs.ebmgn7.26xlarge | Ya | Instans mesin fisik ebmgn7 mendukung MIG. |
ebmgn6e, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Pengenalan:
Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.
Keluarga instans ini menggunakan GPU NVIDIA V100 yang masing-masing memiliki memori GPU 32 GB dan mendukung NVLink.
Keluarga instans ini menggunakan GPU NVIDIA V100 (berbasis SXM2) yang memiliki fitur berikut:
Arsitektur NVIDIA Volta inovatif
32 GB memori HBM2 (bandwidth 900 GB/s) per GPU
5.120 core CUDA per GPU
640 core Tensor per GPU
Hingga enam koneksi NVLink per GPU, masing-masing menyediakan bandwidth 25 GB/s di setiap arah untuk total bandwidth 300 GB/s (6 × 25 × 2 = 300)
Skema penggunaan:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
Komputasi:
Menawarkan rasio CPU-ke-memori 1:8.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
Tipe instans ebmgn6e
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.ebmgn6e.24xlarge | 96 | 768 | NVIDIA V100 * 8 | 32GB * 8 | 32 | 4.800.000 | 16 | 15 | 10 | 1 |
ebmgn6v, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Pengenalan:
Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.
Keluarga instans ini menggunakan GPU NVIDIA V100.
Keluarga instans ini menggunakan GPU NVIDIA V100 (berbasis SXM2) yang memiliki fitur berikut:
Arsitektur NVIDIA Volta inovatif
16 GB memori HBM2 (bandwidth 900 GB/s) per GPU
5.120 core CUDA per GPU
640 core Tensor per GPU
Hingga enam koneksi NVLink per GPU, masing-masing menyediakan bandwidth 25 GB/s di setiap arah untuk total bandwidth 300 GB/s (6 × 25 × 2 = 300)
Skema penggunaan:
Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan
Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan
Komputasi:
Menawarkan rasio CPU-ke-memori 1:4.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
Tipe instans ebmgn6v
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.ebmgn6v.24xlarge | 96 | 384 | NVIDIA V100 * 8 | 16GB * 8 | 30 | 4.500.000 | 8 | 32 | 10 | 1 |
ebmgn6i, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU
Pengenalan:
Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.
Keluarga instans ini menggunakan GPU NVIDIA T4 yang memiliki fitur berikut:
Arsitektur NVIDIA Turing inovatif
16 GB memori (bandwidth 320 GB/s) per GPU
2.560 core CUDA per GPU
Hingga 320 core Tensor Turing per GPU
Core Tensor presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4
Skema penggunaan:
Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk visi komputer, pengenalan suara, sintesis suara, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem referensi
Rendering real-time untuk cloud gaming
Rendering real-time untuk aplikasi Augmented Reality (AR) dan Virtual Reality (VR)
Workstation grafis atau komputasi berat grafis
Database yang dipercepat GPU
Komputasi berkinerja-tinggi
Komputasi:
Menawarkan rasio CPU-ke-memori 1:4.
Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
Ini adalah instans yang dioptimalkan untuk I/O.
Mendukung ESSD, Disk ESSD AutoPL, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi tentang disk, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
Tipe instans ebmgn6i
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.ebmgn6i.24xlarge | 96 | 384 | NVIDIA T4 * 4 | 16GB * 4 | 30 | 4.500.000 | 8 | 32 | 10 | 1 |
gn5i, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Skema penggunaan: Beban kerja komputasi GPU sisi server, seperti inferensi pembelajaran mendalam dan enkode/dekode multimedia.
Komputasi:
Menggunakan GPU NVIDIA P4.
Menawarkan rasio CPU-ke-memori 1:4.
Menggunakan prosesor Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.
Penyimpanan:
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Mendukung SSD standar dan disk ultra.
Jaringan:
Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn5i mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI | Alamat IPv6 per ENI |
ecs.gn5i-c2g1.large | 2 | 8 | NVIDIA P4 × 1 | 8 GB × 1 | 1 | 100.000 | 2 | 2 | 6 | 1 |
ecs.gn5i-c4g1.xlarge | 4 | 16 | NVIDIA P4 × 1 | 8 GB × 1 | 1,5 | 200.000 | 2 | 3 | 10 | 1 |
ecs.gn5i-c8g1.2xlarge | 8 | 32 | NVIDIA P4 × 1 | 8 GB × 1 | 2 | 400.000 | 4 | 4 | 10 | 1 |
ecs.gn5i-c16g1.4xlarge | 16 | 64 | NVIDIA P4 × 1 | 8 GB × 1 | 3 | 800.000 | 4 | 8 | 20 | 1 |
ecs.gn5i-c16g1.8xlarge | 32 | 128 | NVIDIA P4 × 2 | 8 GB × 2 | 6 | 1.200.000 | 8 | 8 | 20 | 1 |
ecs.gn5i-c28g1.14xlarge | 56 | 224 | NVIDIA P4 × 2 | 8 GB × 2 | 10 | 2.000.000 | 14 | 8 | 20 | 1 |
gn5, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU
Skema penggunaan:
Pembelajaran mendalam
Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, genomika, dan analitik lingkungan
Beban kerja komputasi GPU sisi server, seperti komputasi berkinerja-tinggi, rendering, dan enkode/dekode multimedia
Komputasi:
Menggunakan GPU NVIDIA P100.
Menawarkan beberapa rasio CPU-ke-memori.
Menggunakan prosesor Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.
Penyimpanan:
Mendukung SSD Non-Volatile Memory Express (NVMe) lokal berkinerja-tinggi.
Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.
Mendukung SSD standar dan disk ultra.
Jaringan:
Hanya mendukung IPv4.
Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.
gn5 mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.
Tipe instans | vCPU | Memori (GiB) | GPU | Memori GPU | Penyimpanan lokal (GiB) | Bandwidth jaringan dasar (Gbit/s) | Laju pengalihan paket (pps) | Antrian NIC | ENI | Alamat IPv4 pribadi per ENI |
ecs.gn5-c4g1.xlarge | 4 | 30 | 1 × NVIDIA P100 | 1 × 16 GB | 440 | 3 | 300.000 | 1 | 3 | 10 |
ecs.gn5-c8g1.2xlarge | 8 | 60 | 1 × NVIDIA P100 | 1 × 16 GB | 440 | 3 | 400.000 | 1 | 4 | 10 |
ecs.gn5-c4g1.2xlarge | 8 | 60 | 2 × NVIDIA P100 | 2 × 16 GB | 880 | 5 | 1.000.000 | 4 | 4 | 10 |
ecs.gn5-c8g1.4xlarge | 16 | 120 | 2 × NVIDIA P100 | 2 × 16 GB | 880 | 5 | 1.000.000 | 4 | 8 | 20 |
ecs.gn5-c28g1.7xlarge | 28 | 112 | 1 × NVIDIA P100 | 1 × 16 GB | 440 | 5 | 2.250.000 | 7 | 8 | 10 |
ecs.gn5-c8g1.8xlarge | 32 | 240 | 4 × NVIDIA P100 | 4 × 16 GB | 1760 | 10 | 2.000.000 | 8 | 8 | 20 |
ecs.gn5-c28g1.14xlarge | 56 | 224 | 2 × NVIDIA P100 | 2 × 16 GB | 880 | 10 | 4.500.000 | 14 | 8 | 20 |
ecs.gn5-c8g1.14xlarge | 54 | 480 | 8 × NVIDIA P100 | 8 × 16 GB | 3520 | 25 | 4.000.000 | 14 | 8 | 10 |