Instans komputasi GPU menyediakan performa tinggi dan paralelisme masif, menjadikannya ideal untuk workload komputasi paralel skala besar. Instans ini meningkatkan performa dan efisiensi komputasi bisnis Anda. Topik ini menjelaskan fitur keluarga instans komputasi GPU Elastic Compute Service (ECS) dan mencantumkan tipe instans yang tersedia.
-
Lihat ketersediaan instans berdasarkan wilayah: Tipe instans dapat bervariasi tergantung wilayahnya. Kami menyarankan Anda memeriksa ketersediaan pembelian di setiap wilayah.
-
Lihat panduan pemilihan tipe instans: Pertama, tentukan keluarga instans mana yang sesuai dengan skenario bisnis Anda. Kemudian, gunakan topik ini untuk memilih tipe instans tertentu.
-
Lihat deskripsi metrik instans: Baca topik ini untuk memahami metrik tipe instans.
-
Gunakan Kalkulator Harga ECS: Anda dapat menggunakan kalkulator harga untuk memperkirakan biaya instans.
Type | Related links |
GPU-accelerated compute-optimized (gn series) | |
ECS Bare Metal Instance | |
Not recommended (If this instance family is unavailable, we recommend one of the families listed above.) |
gn9gc, GPU-accelerated compute-optimized instance family
gn9gc berada dalam pratinjau undangan. Untuk menggunakan gn9gc, kirimkan tiket.
-
Ikhtisar: gn9gc adalah keluarga instans cloud server GPU hemat biaya generasi ke-9 dari Alibaba Cloud. Instans ini menggunakan CIPU generasi terbaru 2.0 untuk memberikan kemampuan layanan cloud, dilengkapi prosesor berkecepatan clock tinggi, serta kapasitas memori yang sesuai. Keluarga instans ini menyediakan instans hemat biaya untuk skenario generasi model bahasa besar (LLM) dan skenario generasi video/gambar. GPU juga dapat langsung menyediakan kemampuan pemrosesan grafis untuk mendukung berbagai workload rendering.
-
Kasus penggunaan:
-
Inferensi LLM: GPU generasi baru memberikan daya komputasi yang melampaui generasi ke-8 dengan bandwidth memori yang jauh lebih baik. Dukungan FP4 yang baru secara komprehensif meningkatkan performa inferensi dan efektivitas biaya. Efisiensi inferensi paralel multi-GPU sangat ditingkatkan.
-
-
Komputasi:
-
Menggunakan prosesor cloud CIPU 2.0 terbaru.
-
CIPU generasi ke-2 menyediakan daya pemrosesan cloud yang lebih tinggi dengan peningkatan kemampuan komponen eRDMA, VPC, dan EBS. Mendukung kontainer (termasuk namun tidak terbatas pada Docker, Clear Container, dan Pouch).
-
-
Menggunakan kartu grafis profesional berarsitektur Blackwell generasi baru:
-
Mendukung pemrosesan grafis OpenGL tingkat profesional.
-
Mendukung fitur akselerasi umum seperti RTX, TensorRT, dan lainnya, dengan dukungan FP4 yang baru ditingkatkan serta interkoneksi PCIe Gen5.
-
-
Spesifikasi utama GPU:
Arsitektur GPU
Memori GPU
Performa komputasi
Enkode/dekode video
Interkoneksi antar-GPU
API akselerasi
NVIDIA Blackwell
-
Kapasitas: 72 GB
-
Bandwidth: 1.344 GB/s
-
TF32: 126 TFLOPS
-
FP32: 52 TFLOPS
-
FP16/BF16: 266 TFLOPS
-
FP8/INT8: 530 TFLOPS
-
FP4: 970 TFLOPS
-
Inti RT: 196 TFLOPS
-
3 × Enkoder Video
-
3 × Dekoder Video
-
Antarmuka PCIe: PCIe Gen5 x16
-
Bandwidth: 128 GB/s, P2P didukung
DX12, OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, DirectCompute
-
-
-
Penyimpanan:
-
Optimasi I/O.
-
Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Protokol NVMe.
-
Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL disk, dan ESSD regional. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat IPv6.
-
Performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta PPS (instans 8-GPU).
-
Mendukung ERI (Elastic RDMA Interface) untuk akselerasi langsung RDMA melalui jaringan VPC, dengan bandwidth hingga 360 Gbit/s. Cocok untuk workload pelatihan model tradisional, visi komputer, kecerdasan terwujud, dan pengemudi otonom.
-
Catatan
Untuk informasi selengkapnya tentang ERI, lihat Aktifkan eRDMA pada instans enterprise-level.
-
Tabel berikut menjelaskan tipe instans dalam keluarga instans gn9gc.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth dasar/burst (Gbit/s) |
Laju pengalihan paket (pps) |
Alamat IPv4 per ENI |
Alamat IPv6 per ENI |
Antrian NIC (primer/sekunder) |
ENI |
Disk data maks |
Bandwidth disk maks (GB/s) |
|
ecs.gn9gc.4xlarge |
16 |
128 |
72 GB × 1 |
16 |
3,6 juta |
30 |
30 |
8/32 |
8 |
1 |
1 |
|
ecs.gn9gc.8xlarge |
32 |
192 |
72 GB × 1 |
32 |
7,5 juta |
30 |
30 |
16/64 |
8 |
1 |
1 |
|
ecs.gn9gc-2x.16xlarge |
64 |
384 |
72 GB × 2 |
65 |
15 juta |
30 |
30 |
32/64 |
15 |
2 |
2 |
|
ecs.gn9gc-4x.32xlarge |
128 |
768 |
72 GB × 4 |
131 |
30 juta |
50 |
50 |
64/64 |
15 |
4 |
4 |
|
ecs.gn9gc-8x.64xlarge |
256 |
1.536 |
72 GB × 8 |
204 |
30 juta |
50 |
50 |
128/64 |
15 |
6 |
6 |
Gambar yang digunakan untuk instans gn9gc harus dalam mode boot UEFI. Jika Anda ingin menggunakan gambar kustom, pastikan gambar kustom tersebut mendukung mode boot UEFI dan atribut mode boot gambarnya diatur ke UEFI. Untuk informasi selengkapnya, lihat Atur mode boot gambar kustom ke UEFI dengan memanggil operasi API.
gn8v dan gn8v-tee, GPU-accelerated compute-optimized instance family
Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakannya, hubungi perwakilan penjualan Alibaba Cloud Anda.
-
Pengantar:
-
gn8v: Keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi ke-8 dari Alibaba Cloud untuk pelatihan dan inferensi model AI pada model bahasa ultra-besar (LLM). Keluarga ini menyediakan tipe instans dengan satu, dua, empat, atau delapan GPU untuk berbagai kebutuhan aplikasi.
-
gn8v-tee: Untuk meningkatkan keamanan pelatihan dan inferensi model besar, Alibaba Cloud menawarkan gn8v-tee, keluarga instans generasi ke-8 berbasis gn8v dengan fitur komputasi rahasia. Instans ini mengenkripsi data selama komputasi GPU untuk melindungi data Anda.
-
-
Kasus penggunaan:
-
Hemat biaya untuk inferensi paralel multi-GPU pada LLM dengan lebih dari 70 miliar parameter.
-
Setiap GPU menyediakan daya komputasi FP32 sebesar 39,5 TFLOPS dan memberikan performa luar biasa untuk workload pelatihan model AI tradisional dan pelatihan pengemudi otonom.
-
Delapan GPU mendukung konektivitas NVLink dan cocok untuk pelatihan model skala kecil hingga menengah.
-
-
Fitur:
-
Memori GPU berkapasitas besar dan berkecepatan tinggi: Setiap GPU dilengkapi memori GPU HBM3 96 GB dan menyediakan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.
-
Bandwidth antar-GPU tinggi: Beberapa GPU saling terhubung melalui NVLink pada 900 GB/s. Hal ini memungkinkan efisiensi pelatihan dan inferensi multi-GPU yang jauh lebih tinggi dibandingkan instans GPU generasi sebelumnya.
-
Kuantisasi LLM: Mendukung daya komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan pelatihan dan inferensi serta mengurangi penggunaan memori GPU.
-
(Hanya untuk instans gn8v-tee) Keamanan tinggi: Mendukung komputasi rahasia CPU dengan Intel® Trust Domain Extensions (TDX) dan komputasi rahasia GPU dengan NVIDIA Confidential Computing (CC). Ini menyediakan komputasi rahasia end-to-end untuk seluruh pipeline inferensi model, melindungi data inferensi dan model perusahaan Anda selama pelatihan dan inferensi model.
-
-
Komputasi:
-
Didukung oleh CIPU 1.0 terbaru.
-
Memisahkan komputasi dari penyimpanan, sehingga Anda dapat secara fleksibel memilih sumber daya penyimpanan yang Anda butuhkan.
-
Menyediakan kemampuan bare metal, yang mendukung komunikasi peer-to-peer (P2P) antar instans GPU, berbeda dengan instans virtualisasi tradisional.
-
-
Didukung oleh prosesor Intel® Xeon® Scalable generasi ke-4 dengan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua-core hingga 3,1 GHz.
-
-
Penyimpanan:
-
Instans Optimasi I/O.
-
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL disk, dan ESSD Regional. Untuk informasi selengkapnya tentang disk cloud, lihat ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Instans ini mendukung frame jumbo. Untuk informasi selengkapnya, lihat Frame jumbo.
-
Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta pps (pada instans 8-GPU).
-
Mendukung antarmuka RDMA elastis (ERI).
-
Catatan
Untuk informasi tentang cara menggunakan ERI, lihat Aktifkan pada instans enterprise-level.
-
-
Keamanan: Mendukung fitur komputasi tepercaya (vTPM). Fitur ini tersedia pada instans gn8v tetapi tidak pada instans gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.
Tabel berikut menjelaskan tipe instans dalam keluarga gn8v.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
ENI |
Antrian ENI primer |
Alamat IPv4 per ENI |
Alamat IPv6 per ENI |
Disk cloud maks |
IOPS dasar |
Bandwidth dasar (GB/s) |
|
ecs.gn8v.4xlarge |
16 |
96 |
96 GB × 1 |
12 |
8 |
16 |
30 |
30 |
17 |
100.000 |
0,75 |
|
ecs.gn8v.6xlarge |
24 |
128 |
96 GB × 1 |
15 |
8 |
24 |
30 |
30 |
17 |
120.000 |
0,937 |
|
ecs.gn8v-2x.8xlarge |
32 |
192 |
96 GB × 2 |
20 |
8 |
32 |
30 |
30 |
25 |
200.000 |
1,25 |
|
ecs.gn8v-4x.8xlarge |
32 |
384 |
96 GB × 4 |
20 |
8 |
32 |
30 |
30 |
25 |
200.000 |
1,25 |
|
ecs.gn8v-2x.12xlarge |
48 |
256 |
96 GB × 2 |
25 |
8 |
48 |
30 |
30 |
33 |
300.000 |
1,50 |
|
ecs.gn8v-8x.16xlarge |
64 |
768 |
96 GB × 8 |
32 |
8 |
64 |
30 |
30 |
33 |
360.000 |
2,5 |
|
ecs.gn8v-4x.24xlarge |
96 |
512 |
96 GB × 4 |
50 |
15 |
64 |
30 |
30 |
49 |
500.000 |
3 |
|
ecs.gn8v-8x.48xlarge |
192 |
1024 |
96 GB × 8 |
100 |
15 |
64 |
50 |
50 |
65 |
1.000.000 |
6 |
Tabel berikut menjelaskan tipe instans dalam keluarga gn8v-tee .
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
ENI |
Antrian ENI primer |
Alamat IPv4 per ENI |
Alamat IPv6 per ENI |
Disk cloud maks |
IOPS dasar |
Bandwidth dasar (GB/s) |
|
ecs.gn8v-tee.4xlarge |
16 |
96 |
96 GB × 1 |
12 |
8 |
16 |
30 |
30 |
17 |
100.000 |
0,75 |
|
ecs.gn8v-tee.6xlarge |
24 |
128 |
96 GB × 1 |
15 |
8 |
24 |
30 |
30 |
17 |
120.000 |
0,937 |
|
ecs.gn8v-tee-8x.16xlarge |
64 |
768 |
96 GB × 8 |
32 |
8 |
64 |
30 |
30 |
33 |
360.000 |
2,5 |
|
ecs.gn8v-tee-8x.48xlarge |
192 |
1024 |
96 GB × 8 |
100 |
15 |
64 |
50 |
50 |
65 |
1.000.000 |
6 |
Keluarga instans gn8v-tee hanya mendukung gambar Alibaba Cloud Linux 3. Jika Anda menggunakan gambar kustom yang dibuat berdasarkan Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernelnya 5.10.134-18 atau yang lebih baru.
gn8is, GPU-accelerated compute-optimized instance family
Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakan keluarga instans ini, hubungi perwakilan penjualan Alibaba Cloud Anda.
-
Pengantar: gn8is adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang untuk memenuhi permintaan yang terus berkembang dari konten yang dihasilkan AI (AIGC). Didukung oleh GPU NVIDIA L20 generasi terbaru, keluarga ini menawarkan tipe instans dengan satu, dua, empat, atau delapan GPU, serta berbagai rasio CPU-ke-GPU untuk memenuhi kebutuhan aplikasi yang beragam.
-
Fitur:
-
Pemrosesan grafis: Didukung oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi ke-4, instans ini menyediakan daya komputasi CPU yang kuat untuk skenario pemodelan 3D, memastikan rendering grafis dan alur kerja desain yang lebih lancar.
-
Tugas inferensi: Dilengkapi dengan GPU NVIDIA L20 baru, masing-masing dengan memori GPU 48 GB, instans ini mempercepat tugas inferensi. Mereka mendukung format floating-point FP8 dan dapat dipasangkan dengan Container Service for Kubernetes (ACK) untuk menjalankan inferensi secara fleksibel untuk berbagai model AIGC. Mereka sangat cocok untuk tugas inferensi pada model bahasa besar (LLM) dengan kurang dari 70 miliar parameter.
-
-
Kasus penggunaan:
-
Gunakan driver GRID dengan gambar dari Alibaba Cloud Marketplace untuk mengaktifkan kemampuan OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk workload seperti animasi, efek khusus film dan televisi, dan rendering.
-
Gunakan kemampuan manajemen kontainer Container Service for Kubernetes (ACK) untuk menghasilkan gambar AIGC dan inferensi LLM yang lebih efisien dan hemat biaya.
-
Aplikasi AI tujuan umum lainnya, seperti pengenalan gambar dan pengenalan suara.
-
-
Komputasi:
-
Didukung oleh GPU NVIDIA L20 tingkat enterprise baru.
-
Mendukung fitur akselerasi umum seperti TensorRT dan format floating-point FP8 untuk meningkatkan performa inferensi model.
-
Hingga 48 GB memori GPU per GPU. Dengan beberapa GPU, instans dalam keluarga ini mendukung inferensi single-instance untuk model dengan 70 miliar atau lebih parameter.
-
Kemampuan pemrosesan grafis yang ditingkatkan. Setelah Anda menginstal driver GRID menggunakan Cloud Assistant atau gambar dari Alibaba Cloud Marketplace, performa pemrosesan grafis menjadi dua kali lipat dari platform generasi ke-7.
-
-
Parameter utama GPU NVIDIA L20:
Arsitektur GPU
Memori GPU
Performa komputasi
Enkode/dekode video
Konektivitas antar-GPU
NVIDIA Ada Lovelace
-
Kapasitas: 48 GB
-
Bandwidth: 864 GB/s
-
FP64: N/A
-
FP32: 59,3 TFLOPS
-
FP16/BF16: 119 TFLOPS
-
FP8/INT8: 237 TFLOPS
-
3 × Enkoder Video (+AV1)
-
3 × Dekoder Video
-
4 × Dekoder JPEG
-
Antarmuka PCIe: PCIe Gen4 x16
-
Bandwidth: 64 GB/s
-
-
Prosesor: Didukung oleh prosesor Intel® Xeon® frekuensi tinggi terbaru dengan frekuensi turbo semua-core hingga 3,9 GHz untuk menangani permintaan pemodelan 3D yang kompleks.
-
-
Penyimpanan:
-
Semua instans dalam keluarga ini adalah instans Optimasi I/O.
-
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL disk, dan ESSD Regional. Untuk informasi selengkapnya tentang disk cloud, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Mendukung Elastic RDMA Interface (ERI).
CatatanUntuk detail penggunaan ERI, lihat Aktifkan eRDMA untuk instans enterprise-level.
-
-
Keamanan: Instans ini mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar komputasi tepercaya.
Tabel berikut menjelaskan tipe dan spesifikasi instans untuk keluarga gn8is.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
ENI |
Antrian ENI primer |
Alamat IPv4 privat |
Alamat IPv6 |
Disk cloud maks |
IOPS disk |
Bandwidth disk (GB/s) |
|
ecs.gn8is.2xlarge |
8 |
64 |
L20 × 1 |
48 GB × 1 |
8 |
4 |
8 |
15 |
15 |
17 |
60.000 |
0,75 |
|
ecs.gn8is.4xlarge |
16 |
128 |
L20 × 1 |
48 GB × 1 |
16 |
8 |
16 |
30 |
30 |
17 |
120.000 |
1,25 |
|
ecs.gn8is-2x.8xlarge |
32 |
256 |
L20 × 2 |
48 GB × 2 |
32 |
8 |
32 |
30 |
30 |
33 |
250.000 |
2 |
|
ecs.gn8is-4x.16xlarge |
64 |
512 |
L20 × 4 |
48 GB × 4 |
64 |
8 |
64 |
30 |
30 |
33 |
450.000 |
4 |
|
ecs.gn8is-8x.32xlarge |
128 |
1024 |
L20 × 8 |
48 GB × 8 |
100 |
15 |
64 |
50 |
50 |
65 |
900.000 |
8 |
gn7e, GPU-accelerated compute-optimized instance family
Fitur keluarga instans gn7e meliputi:
-
Ikhtisar:
-
keluarga instans ini memungkinkan Anda memilih tipe instans dengan jumlah GPU dan sumber daya CPU yang berbeda untuk memenuhi berbagai kebutuhan bisnis AI Anda.
-
Dibangun di atas arsitektur X-Dragon generasi ketiga, instans gn7e memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan dengan generasi sebelumnya.
-
-
Kasus penggunaan:
-
Workload pelatihan AI skala kecil dan menengah.
-
Workload komputasi berkinerja tinggi (HPC) yang dipercepat menggunakan CUDA.
-
Workload inferensi AI yang memerlukan performa komputasi GPU tinggi atau memori GPU besar.
-
Pembelajaran mendalam, seperti pelatihan algoritma AI untuk klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
-
Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
PentingSaat menjalankan workload pelatihan AI dengan beban komunikasi tinggi, seperti model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi antar-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin tentang topologi tautan komunikasi untuk workload pelatihan Anda, kirimkan tiket untuk mendapatkan dukungan dari pakar teknis Alibaba Cloud.
-
-
Penyimpanan:
-
Semua instans dalam keluarga ini adalah Optimasi I/O.
-
Jenis disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Intra-city Redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.
-
Keluarga instans gn7e mencakup tipe dan spesifikasi instans yang dijelaskan dalam tabel berikut.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth dasar (Gbit/s) |
Laju pengalihan (pps) |
Antrian |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.gn7e-c16g1.4xlarge |
16 |
125 |
80 GB × 1 |
8 |
3.000.000 |
8 |
8 |
10 |
1 |
|
ecs.gn7e-c16g1.8xlarge |
32 |
250 |
80 GB × 2 |
16 |
6.000.000 |
16 |
8 |
10 |
1 |
|
ecs.gn7e-c16g1.16xlarge |
64 |
500 |
80 GB × 4 |
32 |
12.000.000 |
32 |
8 |
10 |
1 |
|
ecs.gn7e-c16g1.32xlarge |
128 |
1000 |
80 GB × 8 |
64 |
24.000.000 |
32 |
16 |
15 |
1 |
gn7i, GPU-accelerated compute-optimized instance family
-
Ikhtisar: Didukung oleh arsitektur SHENLONG generasi ketiga, instans gn7i memberikan performa tinggi yang stabil dan dapat diprediksi. Mereka menggunakan akselerasi jalur cepat berbasis chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran.
-
Kasus penggunaan:
-
Dilengkapi CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk tugas inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.
-
Instans ini mendukung fitur RTX dan menggunakan CPU frekuensi tinggi untuk memberikan virtualisasi grafis 3D berperforma tinggi. Mereka cocok untuk workload intensif grafis, seperti desain grafis jarak jauh dan cloud gaming.
-
-
Komputasi:
-
Dilengkapi akselerator GPU NVIDIA A10 yang memiliki:
-
Arsitektur inovatif NVIDIA Ampere.
-
Dukungan untuk fitur akselerasi umum seperti RTX dan TensorRT.
-
-
Prosesor: Prosesor Intel ® Xeon ® Scalable 2,9 GHz (Ice Lake) dengan frekuensi turbo semua-core 3,5 GHz.
-
Keluarga instans ini menyediakan hingga 752 GiB memori, peningkatan signifikan dibandingkan keluarga instans gn6i.
-
-
Penyimpanan:
-
Semua instans dalam keluarga ini adalah Optimasi I/O.
-
Jenis disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.
-
Keluarga instans gn7i mencakup tipe dan spesifikasi instans berikut.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
Laju paket (PPS) |
Antrian NIC |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.gn7i-c8g1.2xlarge |
8 |
30 |
NVIDIA A10 * 1 |
24 GB * 1 |
16 |
1.600.000 |
8 |
4 |
15 |
15 |
|
ecs.gn7i-c16g1.4xlarge |
16 |
60 |
NVIDIA A10 * 1 |
24 GB * 1 |
16 |
3.000.000 |
8 |
8 |
30 |
30 |
|
ecs.gn7i-c32g1.8xlarge |
32 |
188 |
NVIDIA A10 * 1 |
24 GB * 1 |
16 |
6.000.000 |
12 |
8 |
30 |
30 |
|
ecs.gn7i-c32g1.16xlarge |
64 |
376 |
NVIDIA A10 * 2 |
24 GB * 2 |
32 |
12.000.000 |
16 |
15 |
30 |
30 |
|
ecs.gn7i-c32g1.32xlarge |
128 |
752 |
NVIDIA A10 * 4 |
24 GB * 4 |
64 |
24.000.000 |
32 |
15 |
30 |
30 |
|
ecs.gn7i-c48g1.12xlarge |
48 |
310 |
NVIDIA A10 * 1 |
24 GB * 1 |
16 |
9.000.000 |
16 |
8 |
30 |
30 |
|
ecs.gn7i-c56g1.14xlarge |
56 |
346 |
NVIDIA A10 * 1 |
24 GB * 1 |
16 |
10.000.000 |
16 |
8 |
30 |
30 |
|
ecs.gn7i-2x.8xlarge |
32 |
128 |
NVIDIA A10 * 2 |
24 GB * 2 |
16 |
6.000.000 |
16 |
8 |
30 |
30 |
|
ecs.gn7i-4x.8xlarge |
32 |
128 |
NVIDIA A10 * 4 |
24 GB * 4 |
32 |
6.000.000 |
16 |
8 |
30 |
30 |
|
ecs.gn7i-4x.16xlarge |
64 |
256 |
NVIDIA A10 * 4 |
24 GB * 4 |
64 |
12.000.000 |
32 |
8 |
30 |
30 |
|
ecs.gn7i-8x.32xlarge |
128 |
512 |
NVIDIA A10 * 8 |
24 GB * 8 |
64 |
24.000.000 |
32 |
16 |
30 |
30 |
|
ecs.gn7i-8x.16xlarge |
64 |
256 |
NVIDIA A10 * 8 |
24 GB * 8 |
32 |
12.000.000 |
32 |
8 |
30 |
30 |
Anda dapat mengubah instans tipe ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge menjadi ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge. Namun, Anda tidak dapat mengubahnya menjadi tipe instans lain seperti ecs.gn7i-c32g1.8xlarge.
gn7s, GPU-accelerated compute-optimized instance family
Untuk menggunakan keluarga instans gn7s, kirimkan tiket.
-
Pengantar:
-
Keluarga instans ini didukung oleh prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Keluarga ini menawarkan berbagai tipe instans dengan konfigurasi GPU dan CPU yang berbeda untuk memenuhi kebutuhan AI spesifik Anda.
-
Dibangun di atas arsitektur SHENLONG generasi ketiga Alibaba Cloud, instans gn7s memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan dengan generasi sebelumnya.
-
-
Kasus penggunaan: Menampilkan CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk workload inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
-
Komputasi:
-
Menampilkan GPU NVIDIA A30, yang mencakup:
-
Arsitektur inovatif NVIDIA Ampere.
-
Dukungan untuk fitur Multi-Instance GPU (MIG) dan akselerasi berbasis Tensor Core generasi kedua untuk berbagai workload.
-
-
Prosesor: Prosesor Intel ® Xeon ® Scalable 2,9 GHz (Ice Lake) dengan frekuensi turbo semua-core 3,5 GHz.
-
Menawarkan memori yang jauh lebih banyak dibandingkan keluarga instans generasi sebelumnya.
-
-
Penyimpanan:
-
Semua instans dalam keluarga ini adalah Optimasi I/O.
-
Jenis disk cloud yang didukung: ESSD, ESSD AutoPL, dan ESSD redundansi zona. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
Keluarga instans gn7s mencakup tipe dan spesifikasi instans berikut:
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
Laju paket (pps) |
IPv4 privat per ENI |
IPv6 per ENI |
Multi-antrian |
ENI |
|
ecs.gn7s-c8g1.2xlarge |
8 |
60 |
NVIDIA A30 * 1 |
24GB * 1 |
16 |
1.600.000 |
5 |
1 |
8 |
4 |
|
ecs.gn7s-c16g1.4xlarge |
16 |
120 |
NVIDIA A30 * 1 |
24GB * 1 |
16 |
3.000.000 |
5 |
1 |
8 |
8 |
|
ecs.gn7s-c32g1.8xlarge |
32 |
250 |
NVIDIA A30 * 1 |
24GB * 1 |
16 |
6.000.000 |
5 |
1 |
12 |
8 |
|
ecs.gn7s-c32g1.16xlarge |
64 |
500 |
NVIDIA A30 * 2 |
24GB * 2 |
32 |
12.000.000 |
5 |
1 |
16 |
15 |
|
ecs.gn7s-c32g1.32xlarge |
128 |
1000 |
NVIDIA A30 * 4 |
24GB * 4 |
64 |
24.000.000 |
10 |
1 |
32 |
15 |
|
ecs.gn7s-c48g1.12xlarge |
48 |
380 |
NVIDIA A30 * 1 |
24GB * 1 |
16 |
9.000.000 |
8 |
1 |
16 |
8 |
|
ecs.gn7s-c56g1.14xlarge |
56 |
440 |
NVIDIA A30 * 1 |
24GB * 1 |
16 |
10.000.000 |
8 |
1 |
16 |
8 |
gn7, GPU-accelerated compute-optimized instance family
-
Skenario:
-
Pembelajaran mendalam, seperti pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
-
Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
-
-
Penyimpanan:
-
Instans adalah Optimasi I/O.
-
Mendukung ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga gn7.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
Laju paket (pps) |
Antrian NIC |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.gn7-c12g1.3xlarge |
12 |
94 |
40 GB × 1 |
4 |
2.500.000 |
4 |
8 |
10 |
1 |
|
ecs.gn7-c13g1.13xlarge |
52 |
378 |
40 GB × 4 |
16 |
9.000.000 |
16 |
8 |
30 |
30 |
|
ecs.gn7-c13g1.26xlarge |
104 |
756 |
40 GB × 8 |
30 |
18.000.000 |
16 |
15 |
10 |
1 |
gn6i, GPU-accelerated compute-optimized instance family
-
Kasus penggunaan:
-
Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk aplikasi seperti visi komputer, pengenalan suara, sintesis suara, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem rekomendasi.
-
Rendering real-time untuk cloud gaming.
-
Rendering real-time berbasis cloud untuk augmented reality (AR) dan virtual reality (VR).
-
Komputasi atau workstation grafis yang intensif grafis.
-
Database yang dipercepat GPU.
-
Komputasi berkinerja tinggi (HPC).
-
-
Komputasi:
-
Dilengkapi akselerator GPU NVIDIA T4, yang memiliki:
-
Arsitektur inovatif NVIDIA Turing.
-
16 GB memori per GPU dengan bandwidth memori 320 GB/s.
-
2.560 core CUDA per GPU.
-
Hingga 320 Tensor Core Turing per GPU.
-
Tensor Core presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4.
-
-
Rasio vCPU-ke-memori sekitar 1:4.
-
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
-
-
Penyimpanan:
-
Instans Optimasi I/O.
-
Jenis disk yang didukung: ESSD, ESSD AutoPL disk, disk SSD, dan disk ultra. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk detailnya, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
Keluarga instans gn6i mencakup tipe instans berikut.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
Laju paket (pps) |
IOPS disk |
Multi-antrian |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.gn6i-c4g1.xlarge |
4 |
15 |
NVIDIA T4 × 1 |
16 GB × 1 |
4 |
2.500.000 |
N/A |
2 |
2 |
10 |
1 |
|
ecs.gn6i-c8g1.2xlarge |
8 |
31 |
NVIDIA T4 × 1 |
16 GB × 1 |
5 |
2.500.000 |
N/A |
2 |
2 |
10 |
1 |
|
ecs.gn6i-c16g1.4xlarge |
16 |
62 |
NVIDIA T4 × 1 |
16 GB × 1 |
6 |
2.500.000 |
N/A |
4 |
3 |
10 |
1 |
|
ecs.gn6i-c24g1.6xlarge |
24 |
93 |
NVIDIA T4 × 1 |
16 GB × 1 |
7,5 |
2.500.000 |
N/A |
6 |
4 |
10 |
1 |
|
ecs.gn6i-c40g1.10xlarge |
40 |
155 |
NVIDIA T4 × 1 |
16 GB × 1 |
10 |
2.500.000 |
N/A |
16 |
10 |
10 |
1 |
|
ecs.gn6i-c24g1.12xlarge |
48 |
186 |
NVIDIA T4 × 2 |
16 GB × 2 |
15 |
4.500.000 |
N/A |
12 |
6 |
10 |
1 |
|
ecs.gn6i-c24g1.24xlarge |
96 |
372 |
NVIDIA T4 × 4 |
16 GB × 4 |
30 |
4.500.000 |
250.000 |
24 |
8 |
10 |
1 |
gn6e, GPU-accelerated compute-optimized instance family
-
Kasus penggunaan:
-
Aplikasi pembelajaran mendalam, seperti pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
-
Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
-
-
Komputasi:
-
Menampilkan kartu GPU NVIDIA V100 (32 GB NVLink).
-
Akselerator GPU: V100 (paket SXM2).
-
Arsitektur inovatif NVIDIA Volta.
-
32 GB memori HBM2 per GPU dengan bandwidth memori GPU 900 GB/s.
-
5.120 Core CUDA per GPU.
-
640 Tensor Core per GPU.
-
Setiap GPU mendukung enam koneksi NVLink dua arah, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah untuk total 300 Gbit/s.
-
-
Menampilkan rasio vCPU-ke-memori sekitar 1:8.
-
Prosesor: Intel ® Xeon ® Platinum 8163 (Skylake) 2,5 GHz.
-
-
Penyimpanan:
-
Instans Optimasi I/O.
-
Jenis disk cloud yang didukung: ESSD, ESSD AutoPL disk, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi selengkapnya, lihat Elastic Block Storage.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
gn6e mencakup tipe dan spesifikasi instans yang tercantum dalam tabel di bawah ini.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth dasar (Gbit/s) |
Laju paket (PPS) |
Antrian NIC |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.gn6e-c12g1.3xlarge |
12 |
92 |
1 × NVIDIA V100 |
1 × 32 GB |
5 |
800.000 |
8 |
6 |
10 |
1 |
|
ecs.gn6e-c12g1.6xlarge |
24 |
184 |
2 × NVIDIA V100 |
2 × 32 GB |
8 |
1.200.000 |
8 |
8 |
20 |
1 |
|
ecs.gn6e-c12g1.12xlarge |
48 |
368 |
4 × NVIDIA V100 |
4 × 32 GB |
16 |
2.400.000 |
8 |
8 |
20 |
1 |
|
ecs.gn6e-c12g1.24xlarge |
96 |
736 |
8 × NVIDIA V100 |
8 × 32 GB |
32 |
4.500.000 |
16 |
8 |
20 |
1 |
gn6v, GPU-accelerated compute-optimized instance family
-
Kasus penggunaan:
-
Aplikasi pembelajaran mendalam, seperti pelatihan dan inferensi untuk algoritma AI dalam klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
-
Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
-
-
Komputasi:
-
Dilengkapi GPU NVIDIA V100.
-
Akselerator GPU: V100 (paket SXM2).
-
Arsitektur inovatif NVIDIA Volta.
-
16 GB memori HBM2 GPU per GPU dengan bandwidth memori 900 GB/s.
-
5.120 Core CUDA per GPU.
-
640 Tensor Core per GPU.
-
Hingga enam koneksi NVLink dua arah per GPU. Setiap koneksi menyediakan bandwidth 25 Gbit/s di setiap arah, untuk total bandwidth 300 Gbit/s.
-
-
Menampilkan rasio vCPU-ke-memori sekitar 1:4.
-
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.
-
-
Penyimpanan:
-
Semua instans dalam keluarga ini adalah Optimasi I/O.
-
Jenis disk yang didukung: ESSD, ESSD AutoPL, SSD Cloud Disk, dan Ultra Disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
Keluarga instans gn6v mencakup tipe dan spesifikasi instans yang tercantum di bawah ini.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
Laju paket (pps) |
IOPS baseline disk |
Multi-antrian |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.gn6v-c8g1.2xlarge |
8 |
32 |
1 × NVIDIA V100 |
1 × 16 GB |
2,5 |
800.000 |
N/A |
4 |
4 |
10 |
1 |
|
ecs.gn6v-c8g1.4xlarge |
16 |
64 |
2 × NVIDIA V100 |
2 × 16 GB |
5 |
1.000.000 |
N/A |
4 |
8 |
20 |
1 |
|
ecs.gn6v-c8g1.8xlarge |
32 |
128 |
4 × NVIDIA V100 |
4 × 16 GB |
10 |
2.000.000 |
N/A |
8 |
8 |
20 |
1 |
|
ecs.gn6v-c8g1.16xlarge |
64 |
256 |
8 × NVIDIA V100 |
8 × 16 GB |
20 |
2.500.000 |
N/A |
16 |
8 |
20 |
1 |
|
ecs.gn6v-c10g1.20xlarge |
82 |
336 |
8 × NVIDIA V100 |
8 × 16 GB |
35 |
4.500.000 |
250.000 |
16 |
8 |
20 |
1 |
GPU elastic bare metal server instance family ebmgn9g
Keluarga instans ebmgn9g hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.
-
Pengantar keluarga instans: Keluarga instans ebmgn9g adalah lini instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, kapasitas memori besar, dan GPU profesional berarsitektur Blackwell terbaru. Mereka memberikan layanan cloud GPU berperforma tinggi dan hemat biaya untuk berbagai workload akselerasi, seperti pelatihan untuk pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan untuk metaverse dan cloud gaming.
-
Kasus penggunaan dan fitur:
-
Pengemudi otonom/kecerdasan terwujud:
Dengan 256 vCPU yang berjalan pada frekuensi semua-core hingga 4,2 GHz dan memori 2.304 GiB, instans ini menangani kebutuhan pemrosesan data yang menuntut untuk pelatihan pengemudi otonom dan kecerdasan terwujud. -
Pencarian dan rekomendasi:
GPU Blackwell menyediakan daya komputasi TF32 sebesar 123 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, menjadikannya konfigurasi optimal untuk layanan pencarian dan periklanan. -
Inferensi model besar:
GPU generasi baru menawarkan lompatan performa signifikan dibandingkan pendahulunya, dengan bandwidth memori video meningkat menjadi 1.344 GB/s. Dukungan untuk daya komputasi FP4 secara signifikan meningkatkan performa dan efektivitas biaya inferensi. Delapan GPU saling terhubung melalui PCIe Gen5 dengan bandwidth 128 GB/s. Koneksi ini secara dramatis meningkatkan efisiensi inferensi paralel multi-kartu. -
Cloud gaming/rendering/metaverse:
Dengan frekuensi CPU hingga 5 GHz, instans ini merupakan pilihan unggul untuk pemodelan 3D. GPU menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikan instans ini pilihan optimal untuk pengembangan film dan animasi high-end serta desain CAD.
-
-
Didukung oleh CIPU 2.0 terbaru:
CIPU generasi kedua menawarkan daya pemrosesan yang lebih tinggi, meningkatkan performa komponen eRDMA, VPC, dan disk cloud. Instans bare metal ideal untuk workload yang memerlukan akses langsung ke sumber daya fisik atau memiliki persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, termasuk namun tidak terbatas pada Docker, Clear Containers, dan PouchContainer.
-
Komputasi:
-
Didukung oleh GPU profesional berarsitektur Blackwell terbaru:
-
Mendukung pemrosesan grafis OpenGL tingkat profesional.
-
Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dengan dukungan tambahan untuk FP4 dan interkoneksi PCIe Gen5.
-
Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-kartu.
-
-
Spesifikasi utama GPU:
Arsitektur GPU
Memori video
Performa komputasi
Enjin enkode/dekode
Interkoneksi antar-GPU
API akselerasi
Blackwell
-
Kapasitas: 48 GB
-
Bandwidth: 1.344 GB/s
-
TF32: 123 TFLOPS
-
FP32: 52 TFLOPS
-
FP16/BF16: 261 TFLOPS
-
FP8/INT8: 533 TFLOPS
-
FP4: 970 TFLOPS
-
Inti RT: 196 TFLOPS
-
3 × Enkoder Video
-
3 × Dekoder Video
-
PCIe Gen5 x16: 128 GB/s
-
Mendukung P2P
Mendukung DX12,
OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute
-
-
Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5 GHz dan turbo semua-core hingga 4,2 GHz.
-
-
Penyimpanan:
-
Instans Optimasi I/O.
-
Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Jenis disk cloud yang didukung: disk sementara elastis, ESSD, ESSD AutoPL, dan ESSD dengan redundansi zona. Untuk informasi selengkapnya tentang penyimpanan blok, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Memberikan performa jaringan hingga 30 juta PPS Jaringan.
-
Mendukung eRDMA, yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. eRDMA meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.
CatatanUntuk petunjuk cara menggunakan eRDMA, lihat Aktifkan eRDMA untuk instans enterprise-level.
-
Tabel berikut mencantumkan spesifikasi untuk keluarga instans ebmgn9g.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori video |
Bandwidth jaringan (Gbit/s) |
PPS Jaringan |
Alamat IPv4 privat |
Alamat IPv6 |
Antrian (primer/sekunder) |
ENI |
Disk data maks |
Bandwidth disk cloud (GB/s) |
|
ecs.ebmgn9g.64xlarge |
256 |
2304 |
48 GB × 8 |
360 (180 × 2) |
30 juta |
30 |
30 |
64/16 |
38 |
33 |
8 |
Instans ebmgn9g memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
GPU elastic bare metal server instance family ebmgn9ge
Keluarga instans ebmgn9ge hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.
-
Pengantar: Keluarga instans ebmgn9ge adalah instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, kapasitas memori besar, dan GPU profesional berarsitektur Blackwell terbaru. Mereka memberikan layanan cloud GPU berperforma tinggi dan hemat biaya untuk berbagai workload akselerasi, termasuk pelatihan pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan metaverse dan cloud gaming.
-
Kasus penggunaan dan fitur:
-
Pengemudi otonom dan kecerdasan terwujud:
Dengan 256 vCPU yang berjalan pada frekuensi semua-core lebih dari 4,2 GHz dan memori 2,3 TB, instans ini memenuhi kebutuhan pemrosesan data yang menuntut untuk pelatihan pengemudi otonom dan kecerdasan terwujud. -
Pencarian dan rekomendasi:
GPU Blackwell menyediakan daya komputasi TF32 sebesar 126 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk layanan pencarian dan periklanan. -
Inferensi model besar:
Keluarga instans ebmgn9ge dirancang khusus untuk model bahasa besar, menawarkan memori GPU 72 GB per GPU. Bandwidth memori GPU mencapai 1.344 GB/s, memberikan inferensi berperforma tinggi untuk skenario LLM. Dikombinasikan dengan arsitektur komputasi FP4 baru dan bandwidth PCIe Gen5 128 GB/s, satu instans dapat mendukung inferensi paralel untuk model dengan lebih dari 671 miliar parameter di 8 GPU.
-
Cloud gaming, rendering, dan metaverse:
Dengan frekuensi CPU hingga 5 GHz, instans ini sangat cocok untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikannya ideal untuk pengembangan film dan animasi high-end serta desain CAD.
-
-
Didukung oleh CIPU 2.0 terbaru:
CIPU generasi ke-2 memberikan daya pemrosesan cloud yang lebih besar, meningkatkan performa untuk komponen eRDMA, VPC, dan EBS. Instans bare metal memungkinkan workload mengakses sumber daya fisik secara langsung atau memenuhi persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, seperti Docker, Clear Containers, dan Pouch.
-
Komputasi:
-
Didukung oleh GPU profesional berarsitektur Blackwell terbaru:
-
Mendukung pemrosesan grafis OpenGL tingkat profesional.
-
Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dan menambahkan dukungan untuk komputasi FP4 dan interkoneksi PCIe Gen5.
-
Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-GPU.
-
-
Spesifikasi utama GPU:
Arsitektur GPU
Memori GPU
Performa komputasi
Enjin enkode/dekode video
Interkoneksi antar-GPU
API dipercepat
Blackwell
-
Kapasitas: 72 GB
-
Bandwidth: 1.344 GB/s
-
TF32: 126 TFLOPS
-
FP32: 52 TFLOPS
-
FP16/BF16: 266 TFLOPS
-
FP8/INT8: 530 TFLOPS
-
FP4: 971 TFLOPS
-
Inti RT: 196 TFLOPS
-
3 × Enkoder Video
-
3 × Dekoder Video
-
PCIe Gen5 x16: 128 GB/s
-
Mendukung P2P
Mendukung DX12,
OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute
-
-
Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5 GHz dan turbo semua-core hingga 4,2 GHz.
-
-
Penyimpanan:
-
Instans Optimasi I/O.
-
Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar Protokol NVMe.
-
Jenis disk cloud yang didukung: disk sementara elastis, ESSD, ESSD AutoPL disk, dan ESSD Zone-Redundant Disk. Untuk informasi selengkapnya tentang penyimpanan blok, lihat Ikhtisar Penyimpanan Blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Memberikan performa jaringan hingga 30 juta paket jaringan per detik (PPS).
-
Mendukung ERI (Elastic RDMA Interface), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.
CatatanUntuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.
-
Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn9ge.
Untuk versi dengan memori lebih rendah, Anda dapat memilih ebmgn9gc.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan dasar (Gbit/s) |
PPS Jaringan |
Alamat IPv4 privat per ENI |
Alamat IPv6 per ENI |
Pasangan antrian (ENI primer/sekunder) |
ENI |
Disk data yang dapat dilampirkan maks |
Bandwidth disk cloud maks (GB/s) |
|
ecs.ebmgn9ge.64xlarge |
256 |
2.304 |
72 GB × 8 |
360 (180 × 2) |
30 juta |
30 |
30 |
64/16 |
38 |
33 |
8 |
Instans dari keluarga instans ebmgn9ge memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan bahwa gambar tersebut mendukung mode boot UEFI dan bahwa properti mode boot-nya disetel ke UEFI. Untuk informasi selengkapnya, lihat Mode Boot Instans.
GPU-accelerated elastic bare metal instance family ebmgn9gc
Keluarga instans ebmgn9gc hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.
-
Pengantar: Keluarga instans ebmgn9gc adalah instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, memori kapasitas besar, dan GPU profesional berarsitektur Blackwell terbaru untuk memberikan layanan cloud GPU hemat biaya untuk berbagai workload akselerasi, termasuk pelatihan pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan metaverse dan cloud gaming.
-
Kasus penggunaan dan fitur:
-
Pengemudi otonom dan kecerdasan terwujud:
Menawarkan 256 vCPU dengan rentang frekuensi 3,3 GHz hingga 5,0 GHz dan turbo semua-core hingga 4,2 GHz. Dipasangkan dengan memori 1,5 TB, instans ini memenuhi permintaan pemrosesan data untuk pelatihan pengemudi otonom dan kecerdasan terwujud. -
Pencarian dan rekomendasi:
GPU Blackwell yang dilengkapi menyediakan komputasi TF32 berperforma tinggi sebesar 126 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk layanan pencarian dan periklanan. -
Inferensi model besar:
Instans ebmgn9gc dirancang untuk model bahasa besar. Dengan memori GPU 72 GB dan bandwidth memori 1.344 GB/s per GPU, mereka memberikan inferensi berperforma tinggi untuk skenario LLM. Dikombinasikan dengan arsitektur komputasi FP4 baru dan bandwidth PCIe Gen5 128 GB/s, instans 8-kartu dapat mendukung inferensi paralel untuk model dengan lebih dari 671 miliar parameter.
-
Cloud gaming, rendering, dan metaverse:
Dengan frekuensi CPU hingga 5,0 GHz, instans ini sangat cocok untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikannya pilihan yang baik untuk pengembangan film dan animasi high-end serta desain CAD.
-
-
Didukung oleh CIPU 2.0 terbaru:
CIPU generasi ke-2 menawarkan daya pemrosesan cloud yang lebih tinggi dan kemampuan komputasi yang ditingkatkan untuk eRDMA, VPC, dan penyimpanan blok. Instans bare metal memungkinkan workload mengakses sumber daya fisik secara langsung atau memenuhi persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, seperti Docker, Clear Container, dan Pouch.
-
Komputasi:
-
Didukung oleh GPU profesional berarsitektur Blackwell terbaru:
-
Mendukung fitur pemrosesan grafis tingkat profesional.
-
Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dan menambahkan dukungan untuk FP4 dan interkoneksi PCIe Gen5.
-
Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-kartu.
-
-
Parameter utama GPU:
Arsitektur GPU
Memori GPU
Performa komputasi
Enkode/dekode video
Interkoneksi GPU-ke-GPU
API akselerasi
Blackwell
-
Kapasitas: 72 GB
-
Bandwidth: 1.344 GB/s
-
TF32: 126 TFLOPS
-
FP32: 52 TFLOPS
-
FP16/BF16: 266 TFLOPS
-
FP8/INT8: 530 TFLOPS
-
FP4: 971 TFLOPS
-
Inti RT: 196 TFLOPS
-
3 × Enkoder Video
-
3 × Dekoder Video
-
PCIe Gen5 x16: 128 GB/s
-
Mendukung P2P
Mendukung DX12,
OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute
-
-
Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5,0 GHz dan turbo semua-core hingga 4,2 GHz.
-
-
Penyimpanan:
-
Instans Optimasi I/O.
-
Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Jenis disk cloud yang didukung: Disk Sementara Elastis, ESSD, ESSD AutoPL, dan Disk ESSD Redundansi Zona. Untuk informasi selengkapnya tentang penyimpanan blok, lihat Ikhtisar Penyimpanan Blok.
-
-
Jaringan:
-
Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Memberikan performa jaringan hingga 30 juta paket per detik (PPS).
-
Mendukung RDMA elastis (eRDMA), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. eRDMA meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.
CatatanUntuk petunjuk cara menggunakan eRDMA, lihat Aktifkan eRDMA pada instans enterprise-level.
-
Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn9gc.
Untuk versi dengan memori lebih banyak, Anda dapat memilih ebmgn9ge.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
PPS Jaringan |
Alamat IPv4 privat |
Alamat IPv6 |
Multi-antrian (primer/sekunder) |
Antarmuka jaringan elastis |
Disk data maksimum |
Bandwidth disk cloud (GB/s) |
|
ecs.ebmgn9gc.64xlarge |
256 |
1536 |
72 GB × 8 |
360 (180 × 2) |
30.000.000 |
30 |
30 |
64/16 |
38 |
33 |
8 |
Instans dalam keluarga ebmgn9gc harus diluncurkan dari gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
GPU compute-optimized elastic bare metal server instance family ebmgn8v
Keluarga instans ini saat ini hanya tersedia di wilayah tertentu. Untuk meminta akses, hubungi perwakilan penjualan Alibaba Cloud Anda.
-
Ikhtisar keluarga instans: ebmgn8v adalah keluarga instans komputasi akselerasi generasi kedelapan Alibaba Cloud (keluarga instans Elastic Bare Metal Server), dirancang untuk pelatihan model AI dan model parameter ultra-besar. Setiap instans adalah host bare metal yang dilengkapi delapan kartu GPU.
-
Kasus penggunaan:
-
Hemat biaya untuk inferensi paralel multi-GPU pada model bahasa besar (LLM) dengan lebih dari 70 miliar parameter.
-
Setiap GPU memberikan daya komputasi FP32 sebesar 39,5 TFLOPS, menjadikannya ideal untuk pelatihan model AI tradisional dan workload pengemudi otonom.
-
Konektivitas NVLINK di antara delapan GPU mendukung skenario pelatihan model skala kecil dan menengah.
-
-
Fitur utama dan posisi:
-
Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU memiliki memori HBM3 96 GB, memberikan bandwidth memori 4 TB/s. Hal ini secara signifikan mempercepat pelatihan dan inferensi model.
-
Bandwidth antar-GPU tinggi: GPU saling terhubung melalui NVLINK 900 GB/s, memberikan efisiensi yang jauh lebih tinggi untuk pelatihan dan inferensi multi-GPU dibandingkan generasi GPU sebelumnya.
-
Teknologi kuantisasi model besar: Mendukung komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi dengan parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi dan mengurangi penggunaan memori GPU.
-
-
Komputasi:
-
Didukung oleh CIPU (Cloud Processing Unit) 1.0 terbaru:
-
Memisahkan komputasi dan penyimpanan, memungkinkan pemilihan sumber daya penyimpanan secara fleksibel. Dibandingkan dengan instans GPU generasi ke-7, bandwidth antar-host ditingkatkan menjadi 160 Gbit/s untuk transfer dan pemrosesan data yang lebih cepat.
-
Tidak seperti instans virtualisasi tradisional, CIPU menyediakan kemampuan bare metal yang mendukung komunikasi P2P antar instans GPU.
-
-
Didukung oleh prosesor Intel® Xeon® Scalable generasi ke-4, menyediakan 192 vCPU dengan frekuensi turbo semua-core hingga 3,1 GHz.
-
-
Penyimpanan:
-
Ini adalah instans Optimasi I/O.
-
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Jenis disk cloud yang didukung: disk sementara elastis, ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD cloud disk redundansi zona. Untuk informasi selengkapnya tentang disk cloud, lihat Ikhtisar Penyimpanan Blok.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Memberikan performa jaringan ultra-tinggi hingga 30 juta PPS.
-
Mendukung Elastic RDMA Interface (ERI), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk workload pelatihan visi komputer (CV) dan model tradisional.
CatatanUntuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.
-
Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga instans ebmgn8v.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan dasar (Gbit/s) |
Laju pengalihan paket (PPS) |
IPv4 privat per ENI |
IPv6 per ENI |
Multi-antrian |
ENI |
Disk data maks |
Bandwidth disk cloud maks (GB/s) |
|
ecs.ebmgn8v.48xlarge |
192 |
1.024 |
96 GB × 8 |
170 (85 × 2) |
30 juta |
30 |
30 |
64 |
32 |
31 |
6 |
Mode boot untuk gambar yang digunakan oleh instans ebmgn8v harus UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan atribut mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
GPU-accelerated ebmgn8ia instance family
Keluarga instans ini saat ini hanya tersedia di wilayah tertentu. Untuk meminta akses, hubungi perwakilan penjualan Alibaba Cloud Anda.
-
Pengantar: ebmgn8ia, keluarga instans bare metal elastis, adalah keluarga instans komputasi akselerasi generasi kedelapan Alibaba Cloud. Dirancang untuk pencarian dan rekomendasi, simulasi, dan workload intensif GPU lainnya yang memerlukan rasio vCPU-ke-GPU tinggi. Didukung oleh GPU NVIDIA L20 terbaru, setiap instans adalah server bare metal yang dilengkapi dua prosesor frekuensi tinggi dan empat GPU.
-
Fitur dan kasus penggunaan:
-
Frekuensi tinggi: Instans ini dilengkapi dua prosesor AMD EPYC™ Genoa 9T34. Setiap prosesor memiliki 64 core fisik, menyediakan total 256 vCPU per instans, dengan rentang frekuensi 3,4 GHz hingga 3,75 GHz. Hal ini secara signifikan meningkatkan performa CPU single-core, menjadikannya ideal untuk pemodelan CAD dan mempercepat pra-pemrosesan untuk simulasi CAE.
-
Rasio sumber daya jarang: Setiap GPU dipasangkan dengan 64 vCPU dan memori 384 GiB, memberikan bandwidth memori rata-rata 230 GB/s per GPU. Konfigurasi ini cocok untuk skenario komputasi GPU yang memerlukan throughput I/O tinggi, seperti periklanan, pencarian, rekomendasi, simulasi CAE tradisional, dan tugas rendering berbasis CPU tertentu dalam produksi film.
-
-
Didukung oleh CIPU 1.0 terbaru:
-
Memisahkan komputasi dan penyimpanan, memungkinkan Anda secara fleksibel memilih sumber daya penyimpanan. Dibandingkan dengan generasi sebelumnya, bandwidth antar-mesin tipe instans ini ditingkatkan menjadi 160 Gbit/s untuk transfer dan pemrosesan data yang lebih cepat.
-
CIPU menyediakan kemampuan bare metal, memungkinkan komunikasi PCIe P2P antar instans GPU, peningkatan dibandingkan instans virtualisasi tradisional.
-
-
Komputasi:
-
Didukung oleh GPU NVIDIA L20 kelas enterprise baru:
-
Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
-
Mendukung presisi FP8 untuk meningkatkan efisiensi komputasi.
-
-
Spesifikasi utama NVIDIA L20:
Arsitektur GPU
Memori GPU
Performa komputasi
Enjin enkode/dekode video
Interkoneksi GPU
NVIDIA Ada Lovelace
-
Kapasitas: 48 GB
-
Bandwidth: 864 GB/s
-
FP64: N/A
-
FP32: 59,3 TFLOPS
-
FP16/BF16: 119 TFLOPS
-
FP8/INT8: 237 TFLOPS
-
3 × Enkoder Video (+AV1)
-
3 × Dekoder Video
-
4 × Dekoder JPEG
-
Antarmuka PCIe: PCIe Gen4 x16
-
Bandwidth: 64 GB/s
-
-
Prosesor: Prosesor AMD EPYC™ Genoa 9T34 dengan rentang frekuensi 3,4 GHz hingga 3,75 GHz.
-
-
Penyimpanan:
-
Ini adalah instans Optimasi I/O.
-
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Disk cloud yang didukung: disk sementara elastis, ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Memberikan performa jaringan ultra-tinggi hingga 30.000.000 PPS.
-
Mendukung Elastic RDMA Interface (ERI), yang memungkinkan passthrough RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk melatih model visi komputer (CV) dan model tradisional.
CatatanUntuk petunjuk penggunaan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.
-
Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn8ia.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan dasar (Gbit/s) |
PPS Jaringan |
Alamat IPv4 privat per ENI |
Alamat IPv6 per ENI |
Jumlah antrian (ENI Primer/Sekunder) |
Antarmuka jaringan elastis |
Disk data maks |
Bandwidth disk cloud maks (GB/s) |
|
ecs.ebmgn8ia.64xlarge |
256 |
1536 |
L20 × 4 |
48 GB × 4 |
160 (80 × 2) |
30.000.000 |
30 |
30 |
64/16 |
32 |
31 |
6 |
Instans keluarga ebmgn8ia memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, gambar tersebut harus mendukung boot UEFI, dan properti mode boot-nya harus diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.
GPU compute-optimized elastic bare metal family ebmgn8is
Keluarga instans ini saat ini hanya tersedia di wilayah tertentu di luar Tiongkok daratan. Untuk pertanyaan, hubungi perwakilan penjualan Alibaba Cloud Anda.
-
Ikhtisar keluarga instans: ebmgn8is adalah keluarga instans komputasi akselerasi generasi kedelapan dari Alibaba Cloud. Sebagai keluarga instans bare metal elastis, keluarga ini dibangun untuk permintaan yang terus berkembang dalam workload yang dihasilkan AI. Didukung oleh GPU NVIDIA L20 terbaru, setiap instans adalah host bare metal dengan delapan kartu GPU.
-
Fitur dan posisi:
-
Pemrosesan grafis: Instans ini didukung oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi ke-4. Mereka menyediakan daya komputasi CPU yang cukup untuk pemodelan 3D, memastikan rendering dan desain grafis yang lebih lancar.
-
Tugas inferensi: Didukung oleh GPU NVIDIA L20 baru, di mana setiap kartu menyediakan memori 48 GB untuk mempercepat tugas inferensi. Instans ini mendukung format floating-point FP8. Dikombinasikan dengan Container Service for Kubernetes (ACK) Alibaba Cloud, mereka secara fleksibel mendukung inferensi pada berbagai model AIGC dan sangat cocok untuk tugas inferensi pada model bahasa besar (LLM) dengan hingga 70 miliar parameter.
-
Tugas pelatihan: Instans ini menawarkan daya komputasi hemat biaya, memberikan performa komputasi FP32 dua kali lipat dibandingkan instans inferensi generasi ke-7. Mereka sangat cocok untuk melatih model visi komputer (CV) yang menggunakan FP32, dan untuk melatih model skala kecil hingga menengah lainnya.
-
-
Kasus penggunaan:
-
Gunakan gambar GRID dengan driver grafis GRID dari Cloud Marketplace untuk mengaktifkan kemampuan grafis OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk workload seperti animasi, efek khusus film dan televisi, dan rendering.
-
Dikombinasikan dengan kemampuan manajemen kontainer ACK, Anda dapat lebih efisien dan hemat biaya mendukung generasi grafis AIGC dan inferensi model bahasa besar (LLM) (hingga 130 miliar parameter).
-
Skenario AI umum lainnya, seperti pengenalan gambar dan pengenalan suara.
-
-
Didukung oleh CIPU 1.0 terbaru:
-
Menampilkan komputasi dan penyimpanan yang terpisah, yang memungkinkan Anda secara fleksibel memilih sumber daya penyimpanan yang diperlukan. Dibandingkan dengan generasi sebelumnya, bandwidth antar-instans keluarga instans ini ditingkatkan menjadi 160 Gbit/s untuk memungkinkan transfer dan pemrosesan data yang lebih cepat.
-
CIPU menyediakan kemampuan bare metal yang memungkinkan komunikasi PCIe P2P antar GPU, yang tidak didukung oleh instans virtualisasi tradisional.
-
-
Komputasi:
-
Didukung oleh GPU NVIDIA L20 kelas enterprise baru:
-
Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
-
Menggunakan switch PCIe untuk interkoneksi. Dibandingkan dengan koneksi langsung ke CPU, desain ini meningkatkan performa NCCL sebesar 36% dan dapat meningkatkan performa inferensi hingga 9% ketika Anda menjalankan inferensi terbagi untuk model besar di beberapa kartu.
-
-
Parameter utama NVIDIA L20:
Arsitektur GPU
Memori GPU
Performa komputasi
Enkode/dekode video
Interkoneksi antar-GPU
NVIDIA Ada Lovelace
-
Kapasitas: 48 GB
-
Bandwidth: 864 GB/s
-
FP64: N/A
-
FP32: 59,3 TFLOPS
-
FP16/BF16: 119 TFLOPS
-
FP8/INT8: 237 TFLOPS
-
3 × Enkoder Video (+AV1)
-
3 × Dekoder Video
-
4 × Dekoder JPEG
-
Antarmuka PCIe: PCIe Gen4 x16
-
Bandwidth: 64 GB/s
-
-
Prosesor: Prosesor Intel® Xeon® Scalable (SPR) dengan frekuensi dasar 3,4 GHz dan frekuensi turbo semua-core hingga 3,9 GHz.
-
-
Penyimpanan:
-
Ini adalah instans Optimasi I/O.
-
Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
-
Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL, dan ESSD redundansi zona. Untuk informasi selengkapnya tentang disk cloud, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket 30 juta PPS.
-
Mendukung ERI (Elastic RDMA Interface), yang memungkinkan akselerasi passthrough RDMA dalam jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk workload pelatihan CV dan model tradisional.
CatatanUntuk menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.
-
Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga instans ebmgn8is.
|
Instance type |
vCPUs |
Memory (GiB) |
GPU |
GPU memory |
Base bandwidth (Gbit/s) |
Packet forwarding rate (PPS) |
Private IPv4 addresses |
IPv6 addresses |
Queue pairs (primary/secondary ENI) |
ENIs |
Attachable data disks |
Cloud disk bandwidth (GB/s) |
|
ecs.ebmgn8is.32xlarge |
128 |
1024 |
L20 × 8 |
48 GB × 8 |
160 (80 × 2) |
30.000.000 |
30 |
30 |
64/16 |
32 |
31 |
6 |
Mode boot image untuk tipe instans ebmgn8is harus UEFI. Jika Anda menggunakan custom image, pastikan bahwa custom image tersebut mendukung UEFI dan atribut mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Instance boot modes.
Keluarga instans ebmgn7e
-
Deskripsi keluarga instans: ebmgn7e adalah keluarga instans yang dibangun di atas arsitektur X-Dragon. Keluarga ini menggabungkan performa perangkat keras yang andal dengan fleksibilitas dan elastisitas berbasis software-defined.
-
Kasus penggunaan:
-
Pelatihan dan pengembangan deep learning.
-
Komputasi akselerasi HPC dan simulasi.
PentingSaat menjalankan workload pelatihan AI dengan beban komunikasi tinggi, seperti yang melibatkan model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi antar-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin mengenai topologi tautan komunikasi untuk workload pelatihan Anda, submit a ticket untuk mendapatkan dukungan dari pakar teknis Alibaba Cloud.
-
-
Komputasi:
-
Prosesor: Menggunakan prosesor Intel® Xeon® Scalable dengan frekuensi dasar 2,9 GHz, frekuensi turbo semua core 3,5 GHz, dan dukungan PCIe 4.0.
-
-
Penyimpanan:
-
Instans ini merupakan Instans I/O teroptimasi.
-
Tipe disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi lebih lanjut mengenai disk cloud, lihat Block storage overview.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat IPv6 communication.
-
Mencapai laju pengalihan paket hingga 24 juta PPS.
-
Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn7e.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
PPS jaringan |
Multi-queue (primary/secondary) |
ENIs |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.ebmgn7e.32xlarge |
128 |
1024 |
80 GB × 8 |
64 |
24 juta |
32/12 |
32 |
10 |
1 |
Setelah menjalankan instans ebmgn7e, Anda harus memeriksa apakah fitur Multi-Instance GPU (MIG) dalam keadaan aktif atau nonaktif karena status default-nya tidak dijamin. Untuk informasi lebih lanjut mengenai MIG, lihat NVIDIA Multi-Instance GPU User Guide.
Tabel berikut menjelaskan apakah instans ebmgn7e mendukung fitur MIG.
|
Tipe instans |
Dukungan fitur MIG |
Deskripsi |
|
ecs.ebmgn7e.32xlarge |
Yes |
Anda dapat mengaktifkan fitur MIG pada instans bare metal ebmgn7e. |
Keluarga instans ebmgn7i yang dipercepat GPU
-
Pendahuluan: ebmgn7i adalah keluarga instans yang dibangun di atas arsitektur X-Dragon. Instans-instans ini menyediakan komputasi perangkat keras berbasis software-defined, menghadirkan elastisitas sekaligus kinerja tinggi.
-
Kasus penggunaan:
-
Dilengkapi CPU, memori, dan GPU berkinerja-tinggi, instans ini mampu menangani beban kerja inferensi AI konkuren dalam volume tinggi, sehingga ideal untuk pengenalan gambar, suara, dan perilaku.
-
Dukungan RTX, dikombinasikan dengan CPU berfrekuensi tinggi, menghadirkan virtualisasi grafis 3D berkinerja-tinggi yang ideal untuk beban kerja pemrosesan grafis intensif seperti desain grafis remote dan cloud gaming.
-
Dukungan RTX, dikombinasikan dengan bandwidth jaringan dan disk cloud yang tinggi, menjadikan instans ini ideal untuk membangun rendering farm berkinerja-tinggi.
-
Dengan multiple GPU dan bandwidth jaringan tinggi, instans ini mendukung beban kerja pelatihan pembelajaran mendalam skala kecil.
-
-
Komputasi:
-
Ditenagai oleh GPU NVIDIA A10:
-
Arsitektur Ampere inovatif.
-
Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
-
-
Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) dengan frekuensi dasar 2,9 GHz dan frekuensi turbo semua-core 3,5 GHz.
-
-
Penyimpanan:
-
Instans ini merupakan instans I/O teroptimasi.
-
Tipe disk cloud yang didukung: ESSD, ESSD AutoPL, dan ESSD Zone-redundant. Untuk informasi lebih lanjut mengenai penyimpanan blok, lihat Ikhtisar penyimpanan blok.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
-
Menghadirkan kinerja jaringan ultra-tinggi dengan PPS jaringan hingga 24 juta.
-
Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn7i.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
PPS jaringan |
Multi-queue |
Antarmuka jaringan elastis |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.ebmgn7i.32xlarge |
128 |
768 |
NVIDIA A10 × 4 |
24 GB × 4 |
64 |
24 juta |
32 |
32 |
10 |
1 |
Keluarga instans ebmgn7 yang dipercepat GPU
-
Pendahuluan: Berdasarkan Arsitektur X-Dragon, keluarga tipe instans ebmgn7 menampilkan perangkat keras yang didefinisikan oleh perangkat lunak, menawarkan fleksibilitas sekaligus kinerja komputasi yang andal.
-
Kasus penggunaan:
-
Beban kerja pelatihan deep learning, seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
-
Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi (CFD), keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
-
-
Komputasi:
-
Prosesor: Prosesor Intel® Xeon® Platinum 8269CY (Cascade Lake) berkecepatan 2,5 GHz.
-
-
Penyimpanan:
-
Instans ini merupakan instans I/O teroptimasi.
-
Tipe disk cloud yang didukung: ESSD, ESSD AutoPL, dan ESSD Zone-redundant. Untuk informasi lebih lanjut mengenai disk cloud, lihat Ikhtisar Block Storage.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
-
Kinerja jaringan meningkat seiring dengan tipe instans.
-
Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga tipe instans ebmgn7.
|
Tipe instans |
vCPU |
Memori (GiB) |
Memori GPU |
Bandwidth dasar (Gbit/s) |
PPS |
Multi-queue |
ENI |
IPv4 per ENI |
IPv6 per ENI |
|
ecs.ebmgn7.26xlarge |
104 |
768 |
40 GB × 8 |
30 |
18.000.000 |
16 |
15 |
10 |
1 |
Fitur Multi-Instance GPU (MIG) mungkin diaktifkan atau dinonaktifkan secara default saat instans ebmgn7 dimulai. Anda harus memeriksa statusnya dan mengaktifkan atau menonaktifkannya sesuai kebutuhan. Untuk informasi lebih lanjut mengenai MIG, lihat NVIDIA Multi-Instance GPU User Guide.
Tabel berikut menjelaskan dukungan MIG untuk instans ebmgn7.
Tipe instans | MIG didukung | Deskripsi |
ecs.ebmgn7.26xlarge | Ya | Instans ini mendukung fitur MIG. |
Keluarga instans GPU-accelerated ebmgn6e
-
Pengenalan:
-
Keluarga instans ebmgn6e, yang dibangun di atas arsitektur X-Dragon, menghadirkan komputasi perangkat keras berbasis software-defined yang menggabungkan fleksibilitas, elastisitas, dan performa tinggi.
-
Instans ini didukung oleh kartu komputasi GPU NVIDIA V100 (32 GB NVLink).
-
Akselerator GPU-nya adalah V100 (paket SXM2), yang memiliki fitur-fitur berikut:
-
Arsitektur Volta yang inovatif.
-
32 GB memori HBM2 per GPU (dengan bandwidth memori GPU sebesar 900 GB/s).
-
5.120 CUDA Core per GPU.
-
640 Tensor Core per GPU.
-
Setiap GPU mendukung enam tautan NVLink dua arah. Setiap tautan satu arah menyediakan bandwidth 25 GB/s, sehingga total mencapai 300 GB/s (6 × 25 × 2).
-
-
-
Kasus penggunaan:
-
Deep learning, seperti pelatihan dan inferensi untuk algoritma AI seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
-
Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
-
-
Komputasi:
-
Rasio vCPU-memori 1:8.
-
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.
-
-
Penyimpanan:
-
Instans ini merupakan Instans I/O teroptimasi.
-
Tipe disk cloud yang didukung: ESSDs, ESSD AutoPLs, Zone-redundant ESSDs, SSD cloud disks, dan ultra disks. Untuk informasi selengkapnya, lihat Ikhtisar block storage.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn6e.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth dasar (Gbit/s) |
PPS |
Multi-queue |
ENIs |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.ebmgn6e.24xlarge |
96 |
768 |
NVIDIA V100 × 8 |
32 GB × 8 |
32 |
4.800.000 |
16 |
15 |
10 |
1 |
Keluarga instans ebmgn6v
-
Deskripsi keluarga instans:
-
Keluarga instans ebmgn6v dibangun di atas arsitektur X-Dragon. Instans ini menawarkan komputasi perangkat keras berdefinisi-perangkat lunak berkinerja-tinggi dengan elastisitas cloud.
-
Ditenagai oleh GPU NVIDIA V100.
-
Akselerator GPU V100 (paket SXM2) memiliki fitur-fitur berikut:
-
Arsitektur Volta yang inovatif
-
Memori GPU HBM2 sebesar 16 GB per GPU, dengan bandwidth memori 900 GB/s
-
5.120 CUDA Core per GPU
-
640 Tensor Core per GPU
-
Tiap GPU mendukung enam tautan NVLink dua arah, dengan bandwidth satu arah sebesar 25 GB/s per tautan, sehingga total bandwidth mencapai 300 GB/s (6 × 25 × 2 = 300 GB/s)
-
-
-
Kasus penggunaan:
-
Beban kerja pelatihan dan inferensi deep learning, seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara
-
Beban kerja komputasi ilmiah, seperti dinamika fluida komputasional, keuangan komputasional, dinamika molekuler, dan analisis lingkungan
-
-
Komputasi:
-
Rasio vCPU-memori sebesar 1:4.
-
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.
-
-
Penyimpanan:
-
Instans ini merupakan instans I/O teroptimasi.
-
Tipe disk cloud yang didukung: ESSD, ESSD AutoPL, Zone-redundant ESSD, SSD standar, dan Ultra Disk. Untuk informasi selengkapnya, lihat Ikhtisar Block Storage.
-
-
Jaringan:
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
-
Kinerja jaringan meningkat seiring dengan tipe instans.
-
Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn6v.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
PPS jaringan |
Multi-queue |
ENI |
IPv4 per ENI |
IPv6 per ENI |
|
ecs.ebmgn6v.24xlarge |
96 |
384 |
NVIDIA V100 × 8 |
16 GB × 8 |
30 |
4.500.000 |
8 |
32 |
10 |
1 |
Keluarga instans komputasi GPU ebmgn6i
-
Pengantar
-
ebmgn6i adalah keluarga tipe instans yang dibangun di atas Arsitektur X-Dragon, menghadirkan komputasi perangkat keras berbasis software-defined, serta menggabungkan elastisitas fleksibel dengan performa tinggi.
-
Instans-Instans ini didukung oleh akselerator GPU NVIDIA T4 dengan fitur-fitur berikut:
-
Arsitektur Turing inovatif
-
16 GB memori GPU per GPU dengan bandwidth memori 320 GB/s
-
2.560 CUDA Core per GPU
-
Hingga 320 Turing Tensor Core per GPU
-
Tensor Core presisi variabel menghadirkan performa FP16 sebesar 65 TFLOPS, 130 INT8 TOPS, dan 260 INT4 TOPS.
-
-
-
Kasus penggunaan
-
Inferensi AI (DL/ML), termasuk aplikasi seperti computer vision, pengenalan suara, speech synthesis, NLP, machine translation, dan sistem rekomendasi.
-
Rendering cloud real-time untuk cloud gaming.
-
Rendering cloud real-time untuk AR/VR.
-
Beban kerja grafis intensif komputasi atau workstation grafis.
-
Database yang dipercepat GPU.
-
Komputasi berkinerja tinggi (high-performance computing).
-
-
Komputasi
-
Rasio vCPU terhadap memori sebesar 1:4.
-
Prosesor: Intel® Xeon® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.
-
-
Penyimpanan
-
Instans ini merupakan instans I/O teroptimasi.
-
Tipe disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, ESSD Zone-redundant cloud disk, SSD cloud disk, dan Ultra Disk. Untuk informasi selengkapnya, lihat Ikhtisar Block Storage.
-
-
Jaringan
-
Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
-
Performa jaringan meningkat seiring dengan tipe instans.
-
Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn6i.
|
Tipe instans |
vCPU |
Memori (GiB) |
GPU |
Memori GPU |
Bandwidth jaringan (Gbit/s) |
Laju forwarding (PPS) |
Multiqueue |
ENI |
Alamat IPv4 privat |
Alamat IPv6 |
|
ecs.ebmgn6i.24xlarge |
96 |
384 |
NVIDIA T4 × 4 |
16 GB × 4 |
30 |
4,5 juta |
8 |
32 |
10 |
1 |