GPU compute-optimized: gn, ebm, and scc - Elastic GPU Service

Instans komputasi GPU menyediakan performa tinggi dan paralelisme masif, menjadikannya ideal untuk workload komputasi paralel skala besar. Instans ini meningkatkan performa dan efisiensi komputasi bisnis Anda. Topik ini menjelaskan fitur keluarga instans komputasi GPU Elastic Compute Service (ECS) dan mencantumkan tipe instans yang tersedia.

Catatan

Lihat ketersediaan instans berdasarkan wilayah: Tipe instans dapat bervariasi tergantung wilayahnya. Kami menyarankan Anda memeriksa ketersediaan pembelian di setiap wilayah.
Lihat panduan pemilihan tipe instans: Pertama, tentukan keluarga instans mana yang sesuai dengan skenario bisnis Anda. Kemudian, gunakan topik ini untuk memilih tipe instans tertentu.
Lihat deskripsi metrik instans: Baca topik ini untuk memahami metrik tipe instans.
Gunakan Kalkulator Harga ECS: Anda dapat menggunakan kalkulator harga untuk memperkirakan biaya instans.

Type	Related links
GPU-accelerated compute-optimized (gn series)	gn9gc, GPU-accelerated compute-optimized instance family instance family gn8v/gn8v-tee instance family gn8is instance family gn7e instance family gn7i instance family gn7 instance family gn6i instance family gn6e instance family gn6v
ECS Bare Metal Instance	ECS Bare Metal Instance family ebmgn9g ECS Bare Metal Instance family ebmgn9ge ECS Bare Metal Instance family ebmgn9gc ECS Bare Metal Instance family ebmgn8v ECS Bare Metal Instance family ebmgn8ia ECS Bare Metal Instance family ebmgn8is ECS Bare Metal Instance family ebmgn7e ECS Bare Metal Instance family ebmgn7i ECS Bare Metal Instance family ebmgn7 ECS Bare Metal Instance family ebmgn6e ECS Bare Metal Instance family ebmgn6v ECS Bare Metal Instance family ebmgn6i
Not recommended (If this instance family is unavailable, we recommend one of the families listed above.)	instance family gn7s

gn9gc, GPU-accelerated compute-optimized instance family

Catatan

gn9gc berada dalam pratinjau undangan. Untuk menggunakan gn9gc, kirimkan tiket.

Ikhtisar: gn9gc adalah keluarga instans cloud server GPU hemat biaya generasi ke-9 dari Alibaba Cloud. Instans ini menggunakan CIPU generasi terbaru 2.0 untuk memberikan kemampuan layanan cloud, dilengkapi prosesor berkecepatan clock tinggi, serta kapasitas memori yang sesuai. Keluarga instans ini menyediakan instans hemat biaya untuk skenario generasi model bahasa besar (LLM) dan skenario generasi video/gambar. GPU juga dapat langsung menyediakan kemampuan pemrosesan grafis untuk mendukung berbagai workload rendering.
Kasus penggunaan:
- Inferensi LLM: GPU generasi baru memberikan daya komputasi yang melampaui generasi ke-8 dengan bandwidth memori yang jauh lebih baik. Dukungan FP4 yang baru secara komprehensif meningkatkan performa inferensi dan efektivitas biaya. Efisiensi inferensi paralel multi-GPU sangat ditingkatkan.

Komputasi:

Menggunakan prosesor cloud CIPU 2.0 terbaru.
- CIPU generasi ke-2 menyediakan daya pemrosesan cloud yang lebih tinggi dengan peningkatan kemampuan komponen eRDMA, VPC, dan EBS. Mendukung kontainer (termasuk namun tidak terbatas pada Docker, Clear Container, dan Pouch).
Menggunakan kartu grafis profesional berarsitektur Blackwell generasi baru:
- Mendukung pemrosesan grafis OpenGL tingkat profesional.
- Mendukung fitur akselerasi umum seperti RTX, TensorRT, dan lainnya, dengan dukungan FP4 yang baru ditingkatkan serta interkoneksi PCIe Gen5.

Spesifikasi utama GPU:

Arsitektur GPU	Memori GPU	Performa komputasi	Enkode/dekode video	Interkoneksi antar-GPU	API akselerasi
NVIDIA Blackwell	Kapasitas: 72 GB Bandwidth: 1.344 GB/s	TF32: 126 TFLOPS FP32: 52 TFLOPS FP16/BF16: 266 TFLOPS FP8/INT8: 530 TFLOPS FP4: 970 TFLOPS Inti RT: 196 TFLOPS	3 × Enkoder Video 3 × Dekoder Video	Antarmuka PCIe: PCIe Gen5 x16 Bandwidth: 128 GB/s, P2P didukung	DX12, OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, DirectCompute

Penyimpanan:
- Optimasi I/O.
- Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Protokol NVMe.
- Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL disk, dan ESSD regional. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat IPv6.
- Performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta PPS (instans 8-GPU).
- Mendukung ERI (Elastic RDMA Interface) untuk akselerasi langsung RDMA melalui jaringan VPC, dengan bandwidth hingga 360 Gbit/s. Cocok untuk workload pelatihan model tradisional, visi komputer, kecerdasan terwujud, dan pengemudi otonom.
- Catatan
  Untuk informasi selengkapnya tentang ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut menjelaskan tipe instans dalam keluarga instans gn9gc.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth dasar/burst (Gbit/s)	Laju pengalihan paket (pps)	Alamat IPv4 per ENI	Alamat IPv6 per ENI	Antrian NIC (primer/sekunder)	ENI	Disk data maks	Bandwidth disk maks (GB/s)
ecs.gn9gc.4xlarge	16	128	72 GB × 1	16	3,6 juta	30	30	8/32	8	1	1
ecs.gn9gc.8xlarge	32	192	72 GB × 1	32	7,5 juta	30	30	16/64	8	1	1
ecs.gn9gc-2x.16xlarge	64	384	72 GB × 2	65	15 juta	30	30	32/64	15	2	2
ecs.gn9gc-4x.32xlarge	128	768	72 GB × 4	131	30 juta	50	50	64/64	15	4	4
ecs.gn9gc-8x.64xlarge	256	1.536	72 GB × 8	204	30 juta	50	50	128/64	15	6	6

Catatan

Gambar yang digunakan untuk instans gn9gc harus dalam mode boot UEFI. Jika Anda ingin menggunakan gambar kustom, pastikan gambar kustom tersebut mendukung mode boot UEFI dan atribut mode boot gambarnya diatur ke UEFI. Untuk informasi selengkapnya, lihat Atur mode boot gambar kustom ke UEFI dengan memanggil operasi API.

gn8v dan gn8v-tee, GPU-accelerated compute-optimized instance family

Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakannya, hubungi perwakilan penjualan Alibaba Cloud Anda.

Pengantar:
- gn8v: Keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi ke-8 dari Alibaba Cloud untuk pelatihan dan inferensi model AI pada model bahasa ultra-besar (LLM). Keluarga ini menyediakan tipe instans dengan satu, dua, empat, atau delapan GPU untuk berbagai kebutuhan aplikasi.
- gn8v-tee: Untuk meningkatkan keamanan pelatihan dan inferensi model besar, Alibaba Cloud menawarkan gn8v-tee, keluarga instans generasi ke-8 berbasis gn8v dengan fitur komputasi rahasia. Instans ini mengenkripsi data selama komputasi GPU untuk melindungi data Anda.
Kasus penggunaan:
- Hemat biaya untuk inferensi paralel multi-GPU pada LLM dengan lebih dari 70 miliar parameter.
- Setiap GPU menyediakan daya komputasi FP32 sebesar 39,5 TFLOPS dan memberikan performa luar biasa untuk workload pelatihan model AI tradisional dan pelatihan pengemudi otonom.
- Delapan GPU mendukung konektivitas NVLink dan cocok untuk pelatihan model skala kecil hingga menengah.
Fitur:
- Memori GPU berkapasitas besar dan berkecepatan tinggi: Setiap GPU dilengkapi memori GPU HBM3 96 GB dan menyediakan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.
- Bandwidth antar-GPU tinggi: Beberapa GPU saling terhubung melalui NVLink pada 900 GB/s. Hal ini memungkinkan efisiensi pelatihan dan inferensi multi-GPU yang jauh lebih tinggi dibandingkan instans GPU generasi sebelumnya.
- Kuantisasi LLM: Mendukung daya komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan pelatihan dan inferensi serta mengurangi penggunaan memori GPU.
- (Hanya untuk instans gn8v-tee) Keamanan tinggi: Mendukung komputasi rahasia CPU dengan Intel® Trust Domain Extensions (TDX) dan komputasi rahasia GPU dengan NVIDIA Confidential Computing (CC). Ini menyediakan komputasi rahasia end-to-end untuk seluruh pipeline inferensi model, melindungi data inferensi dan model perusahaan Anda selama pelatihan dan inferensi model.
Komputasi:
- Didukung oleh CIPU 1.0 terbaru.
  - Memisahkan komputasi dari penyimpanan, sehingga Anda dapat secara fleksibel memilih sumber daya penyimpanan yang Anda butuhkan.
  - Menyediakan kemampuan bare metal, yang mendukung komunikasi peer-to-peer (P2P) antar instans GPU, berbeda dengan instans virtualisasi tradisional.
- Didukung oleh prosesor Intel® Xeon® Scalable generasi ke-4 dengan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua-core hingga 3,1 GHz.
Penyimpanan:
- Instans Optimasi I/O.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL disk, dan ESSD Regional. Untuk informasi selengkapnya tentang disk cloud, lihat ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Instans ini mendukung frame jumbo. Untuk informasi selengkapnya, lihat Frame jumbo.
- Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta pps (pada instans 8-GPU).
- Mendukung antarmuka RDMA elastis (ERI).
- Catatan
  Untuk informasi tentang cara menggunakan ERI, lihat Aktifkan pada instans enterprise-level.
Keamanan: Mendukung fitur komputasi tepercaya (vTPM). Fitur ini tersedia pada instans gn8v tetapi tidak pada instans gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.

Tabel berikut menjelaskan tipe instans dalam keluarga gn8v.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan (Gbit/s)	ENI	Antrian ENI primer	Alamat IPv4 per ENI	Alamat IPv6 per ENI	Disk cloud maks	IOPS dasar	Bandwidth dasar (GB/s)
ecs.gn8v.4xlarge	16	96	96 GB × 1	12	8	16	30	30	17	100.000	0,75
ecs.gn8v.6xlarge	24	128	96 GB × 1	15	8	24	30	30	17	120.000	0,937
ecs.gn8v-2x.8xlarge	32	192	96 GB × 2	20	8	32	30	30	25	200.000	1,25
ecs.gn8v-4x.8xlarge	32	384	96 GB × 4	20	8	32	30	30	25	200.000	1,25
ecs.gn8v-2x.12xlarge	48	256	96 GB × 2	25	8	48	30	30	33	300.000	1,50
ecs.gn8v-8x.16xlarge	64	768	96 GB × 8	32	8	64	30	30	33	360.000	2,5
ecs.gn8v-4x.24xlarge	96	512	96 GB × 4	50	15	64	30	30	49	500.000	3
ecs.gn8v-8x.48xlarge	192	1024	96 GB × 8	100	15	64	50	50	65	1.000.000	6

Tabel berikut menjelaskan tipe instans dalam keluarga gn8v-tee .

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan (Gbit/s)	ENI	Antrian ENI primer	Alamat IPv4 per ENI	Alamat IPv6 per ENI	Disk cloud maks	IOPS dasar	Bandwidth dasar (GB/s)
ecs.gn8v-tee.4xlarge	16	96	96 GB × 1	12	8	16	30	30	17	100.000	0,75
ecs.gn8v-tee.6xlarge	24	128	96 GB × 1	15	8	24	30	30	17	120.000	0,937
ecs.gn8v-tee-8x.16xlarge	64	768	96 GB × 8	32	8	64	30	30	33	360.000	2,5
ecs.gn8v-tee-8x.48xlarge	192	1024	96 GB × 8	100	15	64	50	50	65	1.000.000	6

Catatan

Keluarga instans gn8v-tee hanya mendukung gambar Alibaba Cloud Linux 3. Jika Anda menggunakan gambar kustom yang dibuat berdasarkan Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernelnya 5.10.134-18 atau yang lebih baru.

gn8is, GPU-accelerated compute-optimized instance family

Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakan keluarga instans ini, hubungi perwakilan penjualan Alibaba Cloud Anda.

Pengantar: gn8is adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang untuk memenuhi permintaan yang terus berkembang dari konten yang dihasilkan AI (AIGC). Didukung oleh GPU NVIDIA L20 generasi terbaru, keluarga ini menawarkan tipe instans dengan satu, dua, empat, atau delapan GPU, serta berbagai rasio CPU-ke-GPU untuk memenuhi kebutuhan aplikasi yang beragam.
Fitur:
- Pemrosesan grafis: Didukung oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi ke-4, instans ini menyediakan daya komputasi CPU yang kuat untuk skenario pemodelan 3D, memastikan rendering grafis dan alur kerja desain yang lebih lancar.
- Tugas inferensi: Dilengkapi dengan GPU NVIDIA L20 baru, masing-masing dengan memori GPU 48 GB, instans ini mempercepat tugas inferensi. Mereka mendukung format floating-point FP8 dan dapat dipasangkan dengan Container Service for Kubernetes (ACK) untuk menjalankan inferensi secara fleksibel untuk berbagai model AIGC. Mereka sangat cocok untuk tugas inferensi pada model bahasa besar (LLM) dengan kurang dari 70 miliar parameter.
Kasus penggunaan:
- Gunakan driver GRID dengan gambar dari Alibaba Cloud Marketplace untuk mengaktifkan kemampuan OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk workload seperti animasi, efek khusus film dan televisi, dan rendering.
- Gunakan kemampuan manajemen kontainer Container Service for Kubernetes (ACK) untuk menghasilkan gambar AIGC dan inferensi LLM yang lebih efisien dan hemat biaya.
- Aplikasi AI tujuan umum lainnya, seperti pengenalan gambar dan pengenalan suara.

Komputasi:

Didukung oleh GPU NVIDIA L20 tingkat enterprise baru.
- Mendukung fitur akselerasi umum seperti TensorRT dan format floating-point FP8 untuk meningkatkan performa inferensi model.
- Hingga 48 GB memori GPU per GPU. Dengan beberapa GPU, instans dalam keluarga ini mendukung inferensi single-instance untuk model dengan 70 miliar atau lebih parameter.
- Kemampuan pemrosesan grafis yang ditingkatkan. Setelah Anda menginstal driver GRID menggunakan Cloud Assistant atau gambar dari Alibaba Cloud Marketplace, performa pemrosesan grafis menjadi dua kali lipat dari platform generasi ke-7.

Parameter utama GPU NVIDIA L20:

Arsitektur GPU	Memori GPU	Performa komputasi	Enkode/dekode video	Konektivitas antar-GPU
NVIDIA Ada Lovelace	Kapasitas: 48 GB Bandwidth: 864 GB/s	FP64: N/A FP32: 59,3 TFLOPS FP16/BF16: 119 TFLOPS FP8/INT8: 237 TFLOPS	3 × Enkoder Video (+AV1) 3 × Dekoder Video 4 × Dekoder JPEG	Antarmuka PCIe: PCIe Gen4 x16 Bandwidth: 64 GB/s

Prosesor: Didukung oleh prosesor Intel^® Xeon^® frekuensi tinggi terbaru dengan frekuensi turbo semua-core hingga 3,9 GHz untuk menangani permintaan pemodelan 3D yang kompleks.

Penyimpanan:
- Semua instans dalam keluarga ini adalah instans Optimasi I/O.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL disk, dan ESSD Regional. Untuk informasi selengkapnya tentang disk cloud, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Mendukung Elastic RDMA Interface (ERI).
  
  Catatan
  Untuk detail penggunaan ERI, lihat Aktifkan eRDMA untuk instans enterprise-level.
Keamanan: Instans ini mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar komputasi tepercaya.

Tabel berikut menjelaskan tipe dan spesifikasi instans untuk keluarga gn8is.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	ENI	Antrian ENI primer	Alamat IPv4 privat	Alamat IPv6	Disk cloud maks	IOPS disk	Bandwidth disk (GB/s)
ecs.gn8is.2xlarge	8	64	L20 × 1	48 GB × 1	8	4	8	15	15	17	60.000	0,75
ecs.gn8is.4xlarge	16	128	L20 × 1	48 GB × 1	16	8	16	30	30	17	120.000	1,25
ecs.gn8is-2x.8xlarge	32	256	L20 × 2	48 GB × 2	32	8	32	30	30	33	250.000	2
ecs.gn8is-4x.16xlarge	64	512	L20 × 4	48 GB × 4	64	8	64	30	30	33	450.000	4
ecs.gn8is-8x.32xlarge	128	1024	L20 × 8	48 GB × 8	100	15	64	50	50	65	900.000	8

gn7e, GPU-accelerated compute-optimized instance family

Fitur keluarga instans gn7e meliputi:

Ikhtisar:
- keluarga instans ini memungkinkan Anda memilih tipe instans dengan jumlah GPU dan sumber daya CPU yang berbeda untuk memenuhi berbagai kebutuhan bisnis AI Anda.
- Dibangun di atas arsitektur X-Dragon generasi ketiga, instans gn7e memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan dengan generasi sebelumnya.
Kasus penggunaan:
- Workload pelatihan AI skala kecil dan menengah.
- Workload komputasi berkinerja tinggi (HPC) yang dipercepat menggunakan CUDA.
- Workload inferensi AI yang memerlukan performa komputasi GPU tinggi atau memori GPU besar.
- Pembelajaran mendalam, seperti pelatihan algoritma AI untuk klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
- Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Penting
Saat menjalankan workload pelatihan AI dengan beban komunikasi tinggi, seperti model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi antar-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin tentang topologi tautan komunikasi untuk workload pelatihan Anda, kirimkan tiket untuk mendapatkan dukungan dari pakar teknis Alibaba Cloud.
Penyimpanan:
- Semua instans dalam keluarga ini adalah Optimasi I/O.
- Jenis disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Intra-city Redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans gn7e mencakup tipe dan spesifikasi instans yang dijelaskan dalam tabel berikut.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth dasar (Gbit/s)	Laju pengalihan (pps)	Antrian	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.gn7e-c16g1.4xlarge	16	125	80 GB × 1	8	3.000.000	8	8	10	1
ecs.gn7e-c16g1.8xlarge	32	250	80 GB × 2	16	6.000.000	16	8	10	1
ecs.gn7e-c16g1.16xlarge	64	500	80 GB × 4	32	12.000.000	32	8	10	1
ecs.gn7e-c16g1.32xlarge	128	1000	80 GB × 8	64	24.000.000	32	16	15	1

gn7i, GPU-accelerated compute-optimized instance family

Ikhtisar: Didukung oleh arsitektur SHENLONG generasi ketiga, instans gn7i memberikan performa tinggi yang stabil dan dapat diprediksi. Mereka menggunakan akselerasi jalur cepat berbasis chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran.
Kasus penggunaan:
- Dilengkapi CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk tugas inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.
- Instans ini mendukung fitur RTX dan menggunakan CPU frekuensi tinggi untuk memberikan virtualisasi grafis 3D berperforma tinggi. Mereka cocok untuk workload intensif grafis, seperti desain grafis jarak jauh dan cloud gaming.
Komputasi:
- Dilengkapi akselerator GPU NVIDIA A10 yang memiliki:
  - Arsitektur inovatif NVIDIA Ampere.
  - Dukungan untuk fitur akselerasi umum seperti RTX dan TensorRT.
- Prosesor: Prosesor Intel ^® Xeon ^® Scalable 2,9 GHz (Ice Lake) dengan frekuensi turbo semua-core 3,5 GHz.
- Keluarga instans ini menyediakan hingga 752 GiB memori, peningkatan signifikan dibandingkan keluarga instans gn6i.
Penyimpanan:
- Semua instans dalam keluarga ini adalah Optimasi I/O.
- Jenis disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans gn7i mencakup tipe dan spesifikasi instans berikut.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	Laju paket (PPS)	Antrian NIC	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.gn7i-c8g1.2xlarge	8	30	NVIDIA A10 * 1	24 GB * 1	16	1.600.000	8	4	15	15
ecs.gn7i-c16g1.4xlarge	16	60	NVIDIA A10 * 1	24 GB * 1	16	3.000.000	8	8	30	30
ecs.gn7i-c32g1.8xlarge	32	188	NVIDIA A10 * 1	24 GB * 1	16	6.000.000	12	8	30	30
ecs.gn7i-c32g1.16xlarge	64	376	NVIDIA A10 * 2	24 GB * 2	32	12.000.000	16	15	30	30
ecs.gn7i-c32g1.32xlarge	128	752	NVIDIA A10 * 4	24 GB * 4	64	24.000.000	32	15	30	30
ecs.gn7i-c48g1.12xlarge	48	310	NVIDIA A10 * 1	24 GB * 1	16	9.000.000	16	8	30	30
ecs.gn7i-c56g1.14xlarge	56	346	NVIDIA A10 * 1	24 GB * 1	16	10.000.000	16	8	30	30
ecs.gn7i-2x.8xlarge	32	128	NVIDIA A10 * 2	24 GB * 2	16	6.000.000	16	8	30	30
ecs.gn7i-4x.8xlarge	32	128	NVIDIA A10 * 4	24 GB * 4	32	6.000.000	16	8	30	30
ecs.gn7i-4x.16xlarge	64	256	NVIDIA A10 * 4	24 GB * 4	64	12.000.000	32	8	30	30
ecs.gn7i-8x.32xlarge	128	512	NVIDIA A10 * 8	24 GB * 8	64	24.000.000	32	16	30	30
ecs.gn7i-8x.16xlarge	64	256	NVIDIA A10 * 8	24 GB * 8	32	12.000.000	32	8	30	30

Penting

Anda dapat mengubah instans tipe ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge menjadi ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge. Namun, Anda tidak dapat mengubahnya menjadi tipe instans lain seperti ecs.gn7i-c32g1.8xlarge.

gn7s, GPU-accelerated compute-optimized instance family

Untuk menggunakan keluarga instans gn7s, kirimkan tiket.

Pengantar:
- Keluarga instans ini didukung oleh prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Keluarga ini menawarkan berbagai tipe instans dengan konfigurasi GPU dan CPU yang berbeda untuk memenuhi kebutuhan AI spesifik Anda.
- Dibangun di atas arsitektur SHENLONG generasi ketiga Alibaba Cloud, instans gn7s memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan dengan generasi sebelumnya.
Kasus penggunaan: Menampilkan CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk workload inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
Komputasi:
- Menampilkan GPU NVIDIA A30, yang mencakup:
  - Arsitektur inovatif NVIDIA Ampere.
  - Dukungan untuk fitur Multi-Instance GPU (MIG) dan akselerasi berbasis Tensor Core generasi kedua untuk berbagai workload.
- Prosesor: Prosesor Intel ^® Xeon ^® Scalable 2,9 GHz (Ice Lake) dengan frekuensi turbo semua-core 3,5 GHz.
- Menawarkan memori yang jauh lebih banyak dibandingkan keluarga instans generasi sebelumnya.
Penyimpanan:
- Semua instans dalam keluarga ini adalah Optimasi I/O.
- Jenis disk cloud yang didukung: ESSD, ESSD AutoPL, dan ESSD redundansi zona. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn7s mencakup tipe dan spesifikasi instans berikut:

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	Laju paket (pps)	IPv4 privat per ENI	IPv6 per ENI	Multi-antrian	ENI
ecs.gn7s-c8g1.2xlarge	8	60	NVIDIA A30 * 1	24GB * 1	16	1.600.000	5	1	8	4
ecs.gn7s-c16g1.4xlarge	16	120	NVIDIA A30 * 1	24GB * 1	16	3.000.000	5	1	8	8
ecs.gn7s-c32g1.8xlarge	32	250	NVIDIA A30 * 1	24GB * 1	16	6.000.000	5	1	12	8
ecs.gn7s-c32g1.16xlarge	64	500	NVIDIA A30 * 2	24GB * 2	32	12.000.000	5	1	16	15
ecs.gn7s-c32g1.32xlarge	128	1000	NVIDIA A30 * 4	24GB * 4	64	24.000.000	10	1	32	15
ecs.gn7s-c48g1.12xlarge	48	380	NVIDIA A30 * 1	24GB * 1	16	9.000.000	8	1	16	8
ecs.gn7s-c56g1.14xlarge	56	440	NVIDIA A30 * 1	24GB * 1	16	10.000.000	8	1	16	8

gn7, GPU-accelerated compute-optimized instance family

Skenario:
- Pembelajaran mendalam, seperti pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
- Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

Penyimpanan:
- Instans adalah Optimasi I/O.
- Mendukung ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga gn7.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan (Gbit/s)	Laju paket (pps)	Antrian NIC	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.gn7-c12g1.3xlarge	12	94	40 GB × 1	4	2.500.000	4	8	10	1
ecs.gn7-c13g1.13xlarge	52	378	40 GB × 4	16	9.000.000	16	8	30	30
ecs.gn7-c13g1.26xlarge	104	756	40 GB × 8	30	18.000.000	16	15	10	1

gn6i, GPU-accelerated compute-optimized instance family

Kasus penggunaan:
- Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk aplikasi seperti visi komputer, pengenalan suara, sintesis suara, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem rekomendasi.
- Rendering real-time untuk cloud gaming.
- Rendering real-time berbasis cloud untuk augmented reality (AR) dan virtual reality (VR).
- Komputasi atau workstation grafis yang intensif grafis.
- Database yang dipercepat GPU.
- Komputasi berkinerja tinggi (HPC).
Komputasi:
- Dilengkapi akselerator GPU NVIDIA T4, yang memiliki:
  - Arsitektur inovatif NVIDIA Turing.
  - 16 GB memori per GPU dengan bandwidth memori 320 GB/s.
  - 2.560 core CUDA per GPU.
  - Hingga 320 Tensor Core Turing per GPU.
  - Tensor Core presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4.
- Rasio vCPU-ke-memori sekitar 1:4.
- Prosesor: Intel^® Xeon^® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
- Instans Optimasi I/O.
- Jenis disk yang didukung: ESSD, ESSD AutoPL disk, disk SSD, dan disk ultra. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk detailnya, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn6i mencakup tipe instans berikut.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	Laju paket (pps)	IOPS disk	Multi-antrian	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.gn6i-c4g1.xlarge	4	15	NVIDIA T4 × 1	16 GB × 1	4	2.500.000	N/A	2	2	10	1
ecs.gn6i-c8g1.2xlarge	8	31	NVIDIA T4 × 1	16 GB × 1	5	2.500.000	N/A	2	2	10	1
ecs.gn6i-c16g1.4xlarge	16	62	NVIDIA T4 × 1	16 GB × 1	6	2.500.000	N/A	4	3	10	1
ecs.gn6i-c24g1.6xlarge	24	93	NVIDIA T4 × 1	16 GB × 1	7,5	2.500.000	N/A	6	4	10	1
ecs.gn6i-c40g1.10xlarge	40	155	NVIDIA T4 × 1	16 GB × 1	10	2.500.000	N/A	16	10	10	1
ecs.gn6i-c24g1.12xlarge	48	186	NVIDIA T4 × 2	16 GB × 2	15	4.500.000	N/A	12	6	10	1
ecs.gn6i-c24g1.24xlarge	96	372	NVIDIA T4 × 4	16 GB × 4	30	4.500.000	250.000	24	8	10	1

gn6e, GPU-accelerated compute-optimized instance family

Kasus penggunaan:
- Aplikasi pembelajaran mendalam, seperti pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
- Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Komputasi:
- Menampilkan kartu GPU NVIDIA V100 (32 GB NVLink).
- Akselerator GPU: V100 (paket SXM2).
  - Arsitektur inovatif NVIDIA Volta.
  - 32 GB memori HBM2 per GPU dengan bandwidth memori GPU 900 GB/s.
  - 5.120 Core CUDA per GPU.
  - 640 Tensor Core per GPU.
  - Setiap GPU mendukung enam koneksi NVLink dua arah, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah untuk total 300 Gbit/s.
- Menampilkan rasio vCPU-ke-memori sekitar 1:8.
- Prosesor: Intel ^® Xeon ^® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
- Instans Optimasi I/O.
- Jenis disk cloud yang didukung: ESSD, ESSD AutoPL disk, ESSD Regional, SSD standar, dan disk ultra. Untuk informasi selengkapnya, lihat Elastic Block Storage.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

gn6e mencakup tipe dan spesifikasi instans yang tercantum dalam tabel di bawah ini.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth dasar (Gbit/s)	Laju paket (PPS)	Antrian NIC	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.gn6e-c12g1.3xlarge	12	92	1 × NVIDIA V100	1 × 32 GB	5	800.000	8	6	10	1
ecs.gn6e-c12g1.6xlarge	24	184	2 × NVIDIA V100	2 × 32 GB	8	1.200.000	8	8	20	1
ecs.gn6e-c12g1.12xlarge	48	368	4 × NVIDIA V100	4 × 32 GB	16	2.400.000	8	8	20	1
ecs.gn6e-c12g1.24xlarge	96	736	8 × NVIDIA V100	8 × 32 GB	32	4.500.000	16	8	20	1

gn6v, GPU-accelerated compute-optimized instance family

Kasus penggunaan:
- Aplikasi pembelajaran mendalam, seperti pelatihan dan inferensi untuk algoritma AI dalam klasifikasi gambar, pengemudi otonom, dan pengenalan suara.
- Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Komputasi:
- Dilengkapi GPU NVIDIA V100.
- Akselerator GPU: V100 (paket SXM2).
  - Arsitektur inovatif NVIDIA Volta.
  - 16 GB memori HBM2 GPU per GPU dengan bandwidth memori 900 GB/s.
  - 5.120 Core CUDA per GPU.
  - 640 Tensor Core per GPU.
  - Hingga enam koneksi NVLink dua arah per GPU. Setiap koneksi menyediakan bandwidth 25 Gbit/s di setiap arah, untuk total bandwidth 300 Gbit/s.
- Menampilkan rasio vCPU-ke-memori sekitar 1:4.
- Prosesor: Intel^® Xeon^® Platinum 8163 (Skylake) 2,5 GHz.
Penyimpanan:
- Semua instans dalam keluarga ini adalah Optimasi I/O.
- Jenis disk yang didukung: ESSD, ESSD AutoPL, SSD Cloud Disk, dan Ultra Disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn6v mencakup tipe dan spesifikasi instans yang tercantum di bawah ini.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	Laju paket (pps)	IOPS baseline disk	Multi-antrian	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.gn6v-c8g1.2xlarge	8	32	1 × NVIDIA V100	1 × 16 GB	2,5	800.000	N/A	4	4	10	1
ecs.gn6v-c8g1.4xlarge	16	64	2 × NVIDIA V100	2 × 16 GB	5	1.000.000	N/A	4	8	20	1
ecs.gn6v-c8g1.8xlarge	32	128	4 × NVIDIA V100	4 × 16 GB	10	2.000.000	N/A	8	8	20	1
ecs.gn6v-c8g1.16xlarge	64	256	8 × NVIDIA V100	8 × 16 GB	20	2.500.000	N/A	16	8	20	1
ecs.gn6v-c10g1.20xlarge	82	336	8 × NVIDIA V100	8 × 16 GB	35	4.500.000	250.000	16	8	20	1

GPU elastic bare metal server instance family ebmgn9g

Penting

Keluarga instans ebmgn9g hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.

Pengantar keluarga instans: Keluarga instans ebmgn9g adalah lini instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, kapasitas memori besar, dan GPU profesional berarsitektur Blackwell terbaru. Mereka memberikan layanan cloud GPU berperforma tinggi dan hemat biaya untuk berbagai workload akselerasi, seperti pelatihan untuk pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan untuk metaverse dan cloud gaming.
Kasus penggunaan dan fitur:
- Pengemudi otonom/kecerdasan terwujud:
  Dengan 256 vCPU yang berjalan pada frekuensi semua-core hingga 4,2 GHz dan memori 2.304 GiB, instans ini menangani kebutuhan pemrosesan data yang menuntut untuk pelatihan pengemudi otonom dan kecerdasan terwujud.
- Pencarian dan rekomendasi:
  GPU Blackwell menyediakan daya komputasi TF32 sebesar 123 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, menjadikannya konfigurasi optimal untuk layanan pencarian dan periklanan.
- Inferensi model besar:
  GPU generasi baru menawarkan lompatan performa signifikan dibandingkan pendahulunya, dengan bandwidth memori video meningkat menjadi 1.344 GB/s. Dukungan untuk daya komputasi FP4 secara signifikan meningkatkan performa dan efektivitas biaya inferensi. Delapan GPU saling terhubung melalui PCIe Gen5 dengan bandwidth 128 GB/s. Koneksi ini secara dramatis meningkatkan efisiensi inferensi paralel multi-kartu.
- Cloud gaming/rendering/metaverse:
  Dengan frekuensi CPU hingga 5 GHz, instans ini merupakan pilihan unggul untuk pemodelan 3D. GPU menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikan instans ini pilihan optimal untuk pengembangan film dan animasi high-end serta desain CAD.
Didukung oleh CIPU 2.0 terbaru:

CIPU generasi kedua menawarkan daya pemrosesan yang lebih tinggi, meningkatkan performa komponen eRDMA, VPC, dan disk cloud. Instans bare metal ideal untuk workload yang memerlukan akses langsung ke sumber daya fisik atau memiliki persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, termasuk namun tidak terbatas pada Docker, Clear Containers, dan PouchContainer.

Komputasi:

Didukung oleh GPU profesional berarsitektur Blackwell terbaru:
- Mendukung pemrosesan grafis OpenGL tingkat profesional.
- Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dengan dukungan tambahan untuk FP4 dan interkoneksi PCIe Gen5.
- Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-kartu.

Spesifikasi utama GPU:

Arsitektur GPU

Memori video

Performa komputasi

Enjin enkode/dekode

Interkoneksi antar-GPU

API akselerasi

Blackwell

Kapasitas: 48 GB
Bandwidth: 1.344 GB/s

TF32: 123 TFLOPS
FP32: 52 TFLOPS
FP16/BF16: 261 TFLOPS
FP8/INT8: 533 TFLOPS
FP4: 970 TFLOPS
Inti RT: 196 TFLOPS

3 × Enkoder Video
3 × Dekoder Video

PCIe Gen5 x16: 128 GB/s
Mendukung P2P

Mendukung DX12,

OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5 GHz dan turbo semua-core hingga 4,2 GHz.

Penyimpanan:
- Instans Optimasi I/O.
- Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Jenis disk cloud yang didukung: disk sementara elastis, ESSD, ESSD AutoPL, dan ESSD dengan redundansi zona. Untuk informasi selengkapnya tentang penyimpanan blok, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Memberikan performa jaringan hingga 30 juta PPS Jaringan.
- Mendukung eRDMA, yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. eRDMA meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.
  
  Catatan
  Untuk petunjuk cara menggunakan eRDMA, lihat Aktifkan eRDMA untuk instans enterprise-level.

Tabel berikut mencantumkan spesifikasi untuk keluarga instans ebmgn9g.

Tipe instans	vCPU	Memori (GiB)	Memori video	Bandwidth jaringan (Gbit/s)	PPS Jaringan	Alamat IPv4 privat	Alamat IPv6	Antrian (primer/sekunder)	ENI	Disk data maks	Bandwidth disk cloud (GB/s)
ecs.ebmgn9g.64xlarge	256	2304	48 GB × 8	360 (180 × 2)	30 juta	30	30	64/16	38	33	8

Catatan

Instans ebmgn9g memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU elastic bare metal server instance family ebmgn9ge

Penting

Keluarga instans ebmgn9ge hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.

Pengantar: Keluarga instans ebmgn9ge adalah instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, kapasitas memori besar, dan GPU profesional berarsitektur Blackwell terbaru. Mereka memberikan layanan cloud GPU berperforma tinggi dan hemat biaya untuk berbagai workload akselerasi, termasuk pelatihan pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan metaverse dan cloud gaming.
Kasus penggunaan dan fitur:
- Pengemudi otonom dan kecerdasan terwujud:
  Dengan 256 vCPU yang berjalan pada frekuensi semua-core lebih dari 4,2 GHz dan memori 2,3 TB, instans ini memenuhi kebutuhan pemrosesan data yang menuntut untuk pelatihan pengemudi otonom dan kecerdasan terwujud.
- Pencarian dan rekomendasi:
  GPU Blackwell menyediakan daya komputasi TF32 sebesar 126 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk layanan pencarian dan periklanan.
- Inferensi model besar:
  
  Keluarga instans ebmgn9ge dirancang khusus untuk model bahasa besar, menawarkan memori GPU 72 GB per GPU. Bandwidth memori GPU mencapai 1.344 GB/s, memberikan inferensi berperforma tinggi untuk skenario LLM. Dikombinasikan dengan arsitektur komputasi FP4 baru dan bandwidth PCIe Gen5 128 GB/s, satu instans dapat mendukung inferensi paralel untuk model dengan lebih dari 671 miliar parameter di 8 GPU.
- Cloud gaming, rendering, dan metaverse:
  Dengan frekuensi CPU hingga 5 GHz, instans ini sangat cocok untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikannya ideal untuk pengembangan film dan animasi high-end serta desain CAD.
Didukung oleh CIPU 2.0 terbaru:

CIPU generasi ke-2 memberikan daya pemrosesan cloud yang lebih besar, meningkatkan performa untuk komponen eRDMA, VPC, dan EBS. Instans bare metal memungkinkan workload mengakses sumber daya fisik secara langsung atau memenuhi persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, seperti Docker, Clear Containers, dan Pouch.

Komputasi:

Didukung oleh GPU profesional berarsitektur Blackwell terbaru:
- Mendukung pemrosesan grafis OpenGL tingkat profesional.
- Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dan menambahkan dukungan untuk komputasi FP4 dan interkoneksi PCIe Gen5.
- Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-GPU.

Spesifikasi utama GPU:

Arsitektur GPU

Memori GPU

Performa komputasi

Enjin enkode/dekode video

Interkoneksi antar-GPU

API dipercepat

Blackwell

Kapasitas: 72 GB
Bandwidth: 1.344 GB/s

TF32: 126 TFLOPS
FP32: 52 TFLOPS
FP16/BF16: 266 TFLOPS
FP8/INT8: 530 TFLOPS
FP4: 971 TFLOPS
Inti RT: 196 TFLOPS

3 × Enkoder Video
3 × Dekoder Video

PCIe Gen5 x16: 128 GB/s
Mendukung P2P

Mendukung DX12,

OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5 GHz dan turbo semua-core hingga 4,2 GHz.

Penyimpanan:
- Instans Optimasi I/O.
- Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar Protokol NVMe.
- Jenis disk cloud yang didukung: disk sementara elastis, ESSD, ESSD AutoPL disk, dan ESSD Zone-Redundant Disk. Untuk informasi selengkapnya tentang penyimpanan blok, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Memberikan performa jaringan hingga 30 juta paket jaringan per detik (PPS).
- Mendukung ERI (Elastic RDMA Interface), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.
  
  Catatan
  Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn9ge.

Catatan

Untuk versi dengan memori lebih rendah, Anda dapat memilih ebmgn9gc.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan dasar (Gbit/s)	PPS Jaringan	Alamat IPv4 privat per ENI	Alamat IPv6 per ENI	Pasangan antrian (ENI primer/sekunder)	ENI	Disk data yang dapat dilampirkan maks	Bandwidth disk cloud maks (GB/s)
ecs.ebmgn9ge.64xlarge	256	2.304	72 GB × 8	360 (180 × 2)	30 juta	30	30	64/16	38	33	8

Catatan

Instans dari keluarga instans ebmgn9ge memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan bahwa gambar tersebut mendukung mode boot UEFI dan bahwa properti mode boot-nya disetel ke UEFI. Untuk informasi selengkapnya, lihat Mode Boot Instans.

GPU-accelerated elastic bare metal instance family ebmgn9gc

Penting

Keluarga instans ebmgn9gc hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.

Pengantar: Keluarga instans ebmgn9gc adalah instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, memori kapasitas besar, dan GPU profesional berarsitektur Blackwell terbaru untuk memberikan layanan cloud GPU hemat biaya untuk berbagai workload akselerasi, termasuk pelatihan pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan metaverse dan cloud gaming.
Kasus penggunaan dan fitur:
- Pengemudi otonom dan kecerdasan terwujud:
  Menawarkan 256 vCPU dengan rentang frekuensi 3,3 GHz hingga 5,0 GHz dan turbo semua-core hingga 4,2 GHz. Dipasangkan dengan memori 1,5 TB, instans ini memenuhi permintaan pemrosesan data untuk pelatihan pengemudi otonom dan kecerdasan terwujud.
- Pencarian dan rekomendasi:
  GPU Blackwell yang dilengkapi menyediakan komputasi TF32 berperforma tinggi sebesar 126 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk layanan pencarian dan periklanan.
- Inferensi model besar:
  
  Instans ebmgn9gc dirancang untuk model bahasa besar. Dengan memori GPU 72 GB dan bandwidth memori 1.344 GB/s per GPU, mereka memberikan inferensi berperforma tinggi untuk skenario LLM. Dikombinasikan dengan arsitektur komputasi FP4 baru dan bandwidth PCIe Gen5 128 GB/s, instans 8-kartu dapat mendukung inferensi paralel untuk model dengan lebih dari 671 miliar parameter.
- Cloud gaming, rendering, dan metaverse:
  Dengan frekuensi CPU hingga 5,0 GHz, instans ini sangat cocok untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikannya pilihan yang baik untuk pengembangan film dan animasi high-end serta desain CAD.
Didukung oleh CIPU 2.0 terbaru:

CIPU generasi ke-2 menawarkan daya pemrosesan cloud yang lebih tinggi dan kemampuan komputasi yang ditingkatkan untuk eRDMA, VPC, dan penyimpanan blok. Instans bare metal memungkinkan workload mengakses sumber daya fisik secara langsung atau memenuhi persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, seperti Docker, Clear Container, dan Pouch.

Komputasi:

Didukung oleh GPU profesional berarsitektur Blackwell terbaru:
- Mendukung fitur pemrosesan grafis tingkat profesional.
- Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dan menambahkan dukungan untuk FP4 dan interkoneksi PCIe Gen5.
- Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-kartu.

Parameter utama GPU:

Arsitektur GPU

Memori GPU

Performa komputasi

Enkode/dekode video

Interkoneksi GPU-ke-GPU

API akselerasi

Blackwell

Kapasitas: 72 GB
Bandwidth: 1.344 GB/s

TF32: 126 TFLOPS
FP32: 52 TFLOPS
FP16/BF16: 266 TFLOPS
FP8/INT8: 530 TFLOPS
FP4: 971 TFLOPS
Inti RT: 196 TFLOPS

3 × Enkoder Video
3 × Dekoder Video

PCIe Gen5 x16: 128 GB/s
Mendukung P2P

Mendukung DX12,

OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5,0 GHz dan turbo semua-core hingga 4,2 GHz.

Penyimpanan:
- Instans Optimasi I/O.
- Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Jenis disk cloud yang didukung: Disk Sementara Elastis, ESSD, ESSD AutoPL, dan Disk ESSD Redundansi Zona. Untuk informasi selengkapnya tentang penyimpanan blok, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
- Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Memberikan performa jaringan hingga 30 juta paket per detik (PPS).
- Mendukung RDMA elastis (eRDMA), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. eRDMA meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.
  
  Catatan
  Untuk petunjuk cara menggunakan eRDMA, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn9gc.

Catatan

Untuk versi dengan memori lebih banyak, Anda dapat memilih ebmgn9ge.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan (Gbit/s)	PPS Jaringan	Alamat IPv4 privat	Alamat IPv6	Multi-antrian (primer/sekunder)	Antarmuka jaringan elastis	Disk data maksimum	Bandwidth disk cloud (GB/s)
ecs.ebmgn9gc.64xlarge	256	1536	72 GB × 8	360 (180 × 2)	30.000.000	30	30	64/16	38	33	8

Catatan

Instans dalam keluarga ebmgn9gc harus diluncurkan dari gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU compute-optimized elastic bare metal server instance family ebmgn8v

Keluarga instans ini saat ini hanya tersedia di wilayah tertentu. Untuk meminta akses, hubungi perwakilan penjualan Alibaba Cloud Anda.

Ikhtisar keluarga instans: ebmgn8v adalah keluarga instans komputasi akselerasi generasi kedelapan Alibaba Cloud (keluarga instans Elastic Bare Metal Server), dirancang untuk pelatihan model AI dan model parameter ultra-besar. Setiap instans adalah host bare metal yang dilengkapi delapan kartu GPU.
Kasus penggunaan:
- Hemat biaya untuk inferensi paralel multi-GPU pada model bahasa besar (LLM) dengan lebih dari 70 miliar parameter.
- Setiap GPU memberikan daya komputasi FP32 sebesar 39,5 TFLOPS, menjadikannya ideal untuk pelatihan model AI tradisional dan workload pengemudi otonom.
- Konektivitas NVLINK di antara delapan GPU mendukung skenario pelatihan model skala kecil dan menengah.
Fitur utama dan posisi:
- Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU memiliki memori HBM3 96 GB, memberikan bandwidth memori 4 TB/s. Hal ini secara signifikan mempercepat pelatihan dan inferensi model.
- Bandwidth antar-GPU tinggi: GPU saling terhubung melalui NVLINK 900 GB/s, memberikan efisiensi yang jauh lebih tinggi untuk pelatihan dan inferensi multi-GPU dibandingkan generasi GPU sebelumnya.
- Teknologi kuantisasi model besar: Mendukung komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi dengan parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi dan mengurangi penggunaan memori GPU.
Komputasi:
- Didukung oleh CIPU (Cloud Processing Unit) 1.0 terbaru:
  - Memisahkan komputasi dan penyimpanan, memungkinkan pemilihan sumber daya penyimpanan secara fleksibel. Dibandingkan dengan instans GPU generasi ke-7, bandwidth antar-host ditingkatkan menjadi 160 Gbit/s untuk transfer dan pemrosesan data yang lebih cepat.
  - Tidak seperti instans virtualisasi tradisional, CIPU menyediakan kemampuan bare metal yang mendukung komunikasi P2P antar instans GPU.
- Didukung oleh prosesor Intel® Xeon® Scalable generasi ke-4, menyediakan 192 vCPU dengan frekuensi turbo semua-core hingga 3,1 GHz.
Penyimpanan:
- Ini adalah instans Optimasi I/O.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Jenis disk cloud yang didukung: disk sementara elastis, ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD cloud disk redundansi zona. Untuk informasi selengkapnya tentang disk cloud, lihat Ikhtisar Penyimpanan Blok.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Memberikan performa jaringan ultra-tinggi hingga 30 juta PPS.
- Mendukung Elastic RDMA Interface (ERI), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk workload pelatihan visi komputer (CV) dan model tradisional.
  
  Catatan
  Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga instans ebmgn8v.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan dasar (Gbit/s)	Laju pengalihan paket (PPS)	IPv4 privat per ENI	IPv6 per ENI	Multi-antrian	ENI	Disk data maks	Bandwidth disk cloud maks (GB/s)
ecs.ebmgn8v.48xlarge	192	1.024	96 GB × 8	170 (85 × 2)	30 juta	30	30	64	32	31	6

Catatan

Mode boot untuk gambar yang digunakan oleh instans ebmgn8v harus UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan atribut mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU-accelerated ebmgn8ia instance family

Keluarga instans ini saat ini hanya tersedia di wilayah tertentu. Untuk meminta akses, hubungi perwakilan penjualan Alibaba Cloud Anda.

Pengantar: ebmgn8ia, keluarga instans bare metal elastis, adalah keluarga instans komputasi akselerasi generasi kedelapan Alibaba Cloud. Dirancang untuk pencarian dan rekomendasi, simulasi, dan workload intensif GPU lainnya yang memerlukan rasio vCPU-ke-GPU tinggi. Didukung oleh GPU NVIDIA L20 terbaru, setiap instans adalah server bare metal yang dilengkapi dua prosesor frekuensi tinggi dan empat GPU.
Fitur dan kasus penggunaan:
- Frekuensi tinggi: Instans ini dilengkapi dua prosesor AMD EPYC™ Genoa 9T34. Setiap prosesor memiliki 64 core fisik, menyediakan total 256 vCPU per instans, dengan rentang frekuensi 3,4 GHz hingga 3,75 GHz. Hal ini secara signifikan meningkatkan performa CPU single-core, menjadikannya ideal untuk pemodelan CAD dan mempercepat pra-pemrosesan untuk simulasi CAE.
- Rasio sumber daya jarang: Setiap GPU dipasangkan dengan 64 vCPU dan memori 384 GiB, memberikan bandwidth memori rata-rata 230 GB/s per GPU. Konfigurasi ini cocok untuk skenario komputasi GPU yang memerlukan throughput I/O tinggi, seperti periklanan, pencarian, rekomendasi, simulasi CAE tradisional, dan tugas rendering berbasis CPU tertentu dalam produksi film.
Didukung oleh CIPU 1.0 terbaru:
- Memisahkan komputasi dan penyimpanan, memungkinkan Anda secara fleksibel memilih sumber daya penyimpanan. Dibandingkan dengan generasi sebelumnya, bandwidth antar-mesin tipe instans ini ditingkatkan menjadi 160 Gbit/s untuk transfer dan pemrosesan data yang lebih cepat.
- CIPU menyediakan kemampuan bare metal, memungkinkan komunikasi PCIe P2P antar instans GPU, peningkatan dibandingkan instans virtualisasi tradisional.

Komputasi:

Didukung oleh GPU NVIDIA L20 kelas enterprise baru:
- Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
- Mendukung presisi FP8 untuk meningkatkan efisiensi komputasi.

Spesifikasi utama NVIDIA L20:

Arsitektur GPU	Memori GPU	Performa komputasi	Enjin enkode/dekode video	Interkoneksi GPU
NVIDIA Ada Lovelace	Kapasitas: 48 GB Bandwidth: 864 GB/s	FP64: N/A FP32: 59,3 TFLOPS FP16/BF16: 119 TFLOPS FP8/INT8: 237 TFLOPS	3 × Enkoder Video (+AV1) 3 × Dekoder Video 4 × Dekoder JPEG	Antarmuka PCIe: PCIe Gen4 x16 Bandwidth: 64 GB/s

Prosesor: Prosesor AMD EPYC™ Genoa 9T34 dengan rentang frekuensi 3,4 GHz hingga 3,75 GHz.

Penyimpanan:
- Ini adalah instans Optimasi I/O.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Disk cloud yang didukung: disk sementara elastis, ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi selengkapnya, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Memberikan performa jaringan ultra-tinggi hingga 30.000.000 PPS.
- Mendukung Elastic RDMA Interface (ERI), yang memungkinkan passthrough RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk melatih model visi komputer (CV) dan model tradisional.
  
  Catatan
  Untuk petunjuk penggunaan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn8ia.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

PPS Jaringan

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Jumlah antrian (ENI Primer/Sekunder)

Antarmuka jaringan elastis

Disk data maks

Bandwidth disk cloud maks (GB/s)

ecs.ebmgn8ia.64xlarge

256

1536

L20 × 4

48 GB × 4

160 (80 × 2)

30.000.000

64/16

Catatan

Instans keluarga ebmgn8ia memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, gambar tersebut harus mendukung boot UEFI, dan properti mode boot-nya harus diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU compute-optimized elastic bare metal family ebmgn8is

Keluarga instans ini saat ini hanya tersedia di wilayah tertentu di luar Tiongkok daratan. Untuk pertanyaan, hubungi perwakilan penjualan Alibaba Cloud Anda.

Ikhtisar keluarga instans: ebmgn8is adalah keluarga instans komputasi akselerasi generasi kedelapan dari Alibaba Cloud. Sebagai keluarga instans bare metal elastis, keluarga ini dibangun untuk permintaan yang terus berkembang dalam workload yang dihasilkan AI. Didukung oleh GPU NVIDIA L20 terbaru, setiap instans adalah host bare metal dengan delapan kartu GPU.
Fitur dan posisi:
- Pemrosesan grafis: Instans ini didukung oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi ke-4. Mereka menyediakan daya komputasi CPU yang cukup untuk pemodelan 3D, memastikan rendering dan desain grafis yang lebih lancar.
- Tugas inferensi: Didukung oleh GPU NVIDIA L20 baru, di mana setiap kartu menyediakan memori 48 GB untuk mempercepat tugas inferensi. Instans ini mendukung format floating-point FP8. Dikombinasikan dengan Container Service for Kubernetes (ACK) Alibaba Cloud, mereka secara fleksibel mendukung inferensi pada berbagai model AIGC dan sangat cocok untuk tugas inferensi pada model bahasa besar (LLM) dengan hingga 70 miliar parameter.
- Tugas pelatihan: Instans ini menawarkan daya komputasi hemat biaya, memberikan performa komputasi FP32 dua kali lipat dibandingkan instans inferensi generasi ke-7. Mereka sangat cocok untuk melatih model visi komputer (CV) yang menggunakan FP32, dan untuk melatih model skala kecil hingga menengah lainnya.
Kasus penggunaan:
- Gunakan gambar GRID dengan driver grafis GRID dari Cloud Marketplace untuk mengaktifkan kemampuan grafis OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk workload seperti animasi, efek khusus film dan televisi, dan rendering.
- Dikombinasikan dengan kemampuan manajemen kontainer ACK, Anda dapat lebih efisien dan hemat biaya mendukung generasi grafis AIGC dan inferensi model bahasa besar (LLM) (hingga 130 miliar parameter).
- Skenario AI umum lainnya, seperti pengenalan gambar dan pengenalan suara.
Didukung oleh CIPU 1.0 terbaru:
- Menampilkan komputasi dan penyimpanan yang terpisah, yang memungkinkan Anda secara fleksibel memilih sumber daya penyimpanan yang diperlukan. Dibandingkan dengan generasi sebelumnya, bandwidth antar-instans keluarga instans ini ditingkatkan menjadi 160 Gbit/s untuk memungkinkan transfer dan pemrosesan data yang lebih cepat.
- CIPU menyediakan kemampuan bare metal yang memungkinkan komunikasi PCIe P2P antar GPU, yang tidak didukung oleh instans virtualisasi tradisional.

Komputasi:

Didukung oleh GPU NVIDIA L20 kelas enterprise baru:
- Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
- Menggunakan switch PCIe untuk interkoneksi. Dibandingkan dengan koneksi langsung ke CPU, desain ini meningkatkan performa NCCL sebesar 36% dan dapat meningkatkan performa inferensi hingga 9% ketika Anda menjalankan inferensi terbagi untuk model besar di beberapa kartu.

Parameter utama NVIDIA L20:

Arsitektur GPU	Memori GPU	Performa komputasi	Enkode/dekode video	Interkoneksi antar-GPU
NVIDIA Ada Lovelace	Kapasitas: 48 GB Bandwidth: 864 GB/s	FP64: N/A FP32: 59,3 TFLOPS FP16/BF16: 119 TFLOPS FP8/INT8: 237 TFLOPS	3 × Enkoder Video (+AV1) 3 × Dekoder Video 4 × Dekoder JPEG	Antarmuka PCIe: PCIe Gen4 x16 Bandwidth: 64 GB/s

Prosesor: Prosesor Intel^® Xeon^® Scalable (SPR) dengan frekuensi dasar 3,4 GHz dan frekuensi turbo semua-core hingga 3,9 GHz.

Penyimpanan:
- Ini adalah instans Optimasi I/O.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Ikhtisar protokol NVMe.
- Jenis disk cloud yang didukung: disk elastis sementara, ESSD, ESSD AutoPL, dan ESSD redundansi zona. Untuk informasi selengkapnya tentang disk cloud, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket 30 juta PPS.
- Mendukung ERI (Elastic RDMA Interface), yang memungkinkan akselerasi passthrough RDMA dalam jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk workload pelatihan CV dan model tradisional.
  
  Catatan
  Untuk menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga instans ebmgn8is.

Instance type

vCPUs

Memory (GiB)

GPU

GPU memory

Base bandwidth (Gbit/s)

Packet forwarding rate (PPS)

Private IPv4 addresses

IPv6 addresses

Queue pairs (primary/secondary ENI)

ENIs

Attachable data disks

Cloud disk bandwidth (GB/s)

ecs.ebmgn8is.32xlarge

128

1024

L20 × 8

48 GB × 8

160 (80 × 2)

30.000.000

64/16

Catatan

Mode boot image untuk tipe instans ebmgn8is harus UEFI. Jika Anda menggunakan custom image, pastikan bahwa custom image tersebut mendukung UEFI dan atribut mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Instance boot modes.

Keluarga instans ebmgn7e

Deskripsi keluarga instans: ebmgn7e adalah keluarga instans yang dibangun di atas arsitektur X-Dragon. Keluarga ini menggabungkan performa perangkat keras yang andal dengan fleksibilitas dan elastisitas berbasis software-defined.
Kasus penggunaan:
- Pelatihan dan pengembangan deep learning.
- Komputasi akselerasi HPC dan simulasi.
Penting
Saat menjalankan workload pelatihan AI dengan beban komunikasi tinggi, seperti yang melibatkan model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi antar-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin mengenai topologi tautan komunikasi untuk workload pelatihan Anda, submit a ticket untuk mendapatkan dukungan dari pakar teknis Alibaba Cloud.
Komputasi:
- Prosesor: Menggunakan prosesor Intel^® Xeon^® Scalable dengan frekuensi dasar 2,9 GHz, frekuensi turbo semua core 3,5 GHz, dan dukungan PCIe 4.0.
Penyimpanan:
- Instans ini merupakan Instans I/O teroptimasi.
- Tipe disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan ESSD Zone-redundant cloud disk. Untuk informasi lebih lanjut mengenai disk cloud, lihat Block storage overview.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat IPv6 communication.
- Mencapai laju pengalihan paket hingga 24 juta PPS.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn7e.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth jaringan (Gbit/s)	PPS jaringan	Multi-queue (primary/secondary)	ENIs	Alamat IPv4 privat	Alamat IPv6
ecs.ebmgn7e.32xlarge	128	1024	80 GB × 8	64	24 juta	32/12	32	10	1

Setelah menjalankan instans ebmgn7e, Anda harus memeriksa apakah fitur Multi-Instance GPU (MIG) dalam keadaan aktif atau nonaktif karena status default-nya tidak dijamin. Untuk informasi lebih lanjut mengenai MIG, lihat NVIDIA Multi-Instance GPU User Guide.

Tabel berikut menjelaskan apakah instans ebmgn7e mendukung fitur MIG.

Tipe instans	Dukungan fitur MIG	Deskripsi
ecs.ebmgn7e.32xlarge	Yes	Anda dapat mengaktifkan fitur MIG pada instans bare metal ebmgn7e.

Keluarga instans ebmgn7i yang dipercepat GPU

Pendahuluan: ebmgn7i adalah keluarga instans yang dibangun di atas arsitektur X-Dragon. Instans-instans ini menyediakan komputasi perangkat keras berbasis software-defined, menghadirkan elastisitas sekaligus kinerja tinggi.
Kasus penggunaan:
- Dilengkapi CPU, memori, dan GPU berkinerja-tinggi, instans ini mampu menangani beban kerja inferensi AI konkuren dalam volume tinggi, sehingga ideal untuk pengenalan gambar, suara, dan perilaku.
- Dukungan RTX, dikombinasikan dengan CPU berfrekuensi tinggi, menghadirkan virtualisasi grafis 3D berkinerja-tinggi yang ideal untuk beban kerja pemrosesan grafis intensif seperti desain grafis remote dan cloud gaming.
- Dukungan RTX, dikombinasikan dengan bandwidth jaringan dan disk cloud yang tinggi, menjadikan instans ini ideal untuk membangun rendering farm berkinerja-tinggi.
- Dengan multiple GPU dan bandwidth jaringan tinggi, instans ini mendukung beban kerja pelatihan pembelajaran mendalam skala kecil.
Komputasi:
- Ditenagai oleh GPU NVIDIA A10:
  - Arsitektur Ampere inovatif.
  - Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
- Prosesor: Prosesor Intel^® Xeon^® Scalable (Ice Lake) dengan frekuensi dasar 2,9 GHz dan frekuensi turbo semua-core 3,5 GHz.
Penyimpanan:
- Instans ini merupakan instans I/O teroptimasi.
- Tipe disk cloud yang didukung: ESSD, ESSD AutoPL, dan ESSD Zone-redundant. Untuk informasi lebih lanjut mengenai penyimpanan blok, lihat Ikhtisar penyimpanan blok.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
- Menghadirkan kinerja jaringan ultra-tinggi dengan PPS jaringan hingga 24 juta.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn7i.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	PPS jaringan	Multi-queue	Antarmuka jaringan elastis	Alamat IPv4 privat	Alamat IPv6
ecs.ebmgn7i.32xlarge	128	768	NVIDIA A10 × 4	24 GB × 4	64	24 juta	32	32	10	1

Keluarga instans ebmgn7 yang dipercepat GPU

Pendahuluan: Berdasarkan Arsitektur X-Dragon, keluarga tipe instans ebmgn7 menampilkan perangkat keras yang didefinisikan oleh perangkat lunak, menawarkan fleksibilitas sekaligus kinerja komputasi yang andal.
Kasus penggunaan:
- Beban kerja pelatihan deep learning, seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
- Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi (CFD), keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Komputasi:
- Prosesor: Prosesor Intel^® Xeon^® Platinum 8269CY (Cascade Lake) berkecepatan 2,5 GHz.
Penyimpanan:
- Instans ini merupakan instans I/O teroptimasi.
- Tipe disk cloud yang didukung: ESSD, ESSD AutoPL, dan ESSD Zone-redundant. Untuk informasi lebih lanjut mengenai disk cloud, lihat Ikhtisar Block Storage.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
- Kinerja jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga tipe instans ebmgn7.

Tipe instans	vCPU	Memori (GiB)	Memori GPU	Bandwidth dasar (Gbit/s)	PPS	Multi-queue	ENI	IPv4 per ENI	IPv6 per ENI
ecs.ebmgn7.26xlarge	104	768	40 GB × 8	30	18.000.000	16	15	10	1

Fitur Multi-Instance GPU (MIG) mungkin diaktifkan atau dinonaktifkan secara default saat instans ebmgn7 dimulai. Anda harus memeriksa statusnya dan mengaktifkan atau menonaktifkannya sesuai kebutuhan. Untuk informasi lebih lanjut mengenai MIG, lihat NVIDIA Multi-Instance GPU User Guide.

Tabel berikut menjelaskan dukungan MIG untuk instans ebmgn7.

Tipe instans	MIG didukung	Deskripsi
ecs.ebmgn7.26xlarge	Ya	Instans ini mendukung fitur MIG.

Keluarga instans GPU-accelerated ebmgn6e

Pengenalan:
- Keluarga instans ebmgn6e, yang dibangun di atas arsitektur X-Dragon, menghadirkan komputasi perangkat keras berbasis software-defined yang menggabungkan fleksibilitas, elastisitas, dan performa tinggi.
- Instans ini didukung oleh kartu komputasi GPU NVIDIA V100 (32 GB NVLink).
- Akselerator GPU-nya adalah V100 (paket SXM2), yang memiliki fitur-fitur berikut:
  - Arsitektur Volta yang inovatif.
  - 32 GB memori HBM2 per GPU (dengan bandwidth memori GPU sebesar 900 GB/s).
  - 5.120 CUDA Core per GPU.
  - 640 Tensor Core per GPU.
  - Setiap GPU mendukung enam tautan NVLink dua arah. Setiap tautan satu arah menyediakan bandwidth 25 GB/s, sehingga total mencapai 300 GB/s (6 × 25 × 2).
Kasus penggunaan:
- Deep learning, seperti pelatihan dan inferensi untuk algoritma AI seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara.
- Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Komputasi:
- Rasio vCPU-memori 1:8.
- Prosesor: Intel^® Xeon^® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.
Penyimpanan:
- Instans ini merupakan Instans I/O teroptimasi.
- Tipe disk cloud yang didukung: ESSDs, ESSD AutoPLs, Zone-redundant ESSDs, SSD cloud disks, dan ultra disks. Untuk informasi selengkapnya, lihat Ikhtisar block storage.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn6e.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth dasar (Gbit/s)	PPS	Multi-queue	ENIs	Alamat IPv4 privat	Alamat IPv6
ecs.ebmgn6e.24xlarge	96	768	NVIDIA V100 × 8	32 GB × 8	32	4.800.000	16	15	10	1

Keluarga instans ebmgn6v

Deskripsi keluarga instans:
- Keluarga instans ebmgn6v dibangun di atas arsitektur X-Dragon. Instans ini menawarkan komputasi perangkat keras berdefinisi-perangkat lunak berkinerja-tinggi dengan elastisitas cloud.
- Ditenagai oleh GPU NVIDIA V100.
- Akselerator GPU V100 (paket SXM2) memiliki fitur-fitur berikut:
  - Arsitektur Volta yang inovatif
  - Memori GPU HBM2 sebesar 16 GB per GPU, dengan bandwidth memori 900 GB/s
  - 5.120 CUDA Core per GPU
  - 640 Tensor Core per GPU
  - Tiap GPU mendukung enam tautan NVLink dua arah, dengan bandwidth satu arah sebesar 25 GB/s per tautan, sehingga total bandwidth mencapai 300 GB/s (6 × 25 × 2 = 300 GB/s)
Kasus penggunaan:
- Beban kerja pelatihan dan inferensi deep learning, seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara
- Beban kerja komputasi ilmiah, seperti dinamika fluida komputasional, keuangan komputasional, dinamika molekuler, dan analisis lingkungan
Komputasi:
- Rasio vCPU-memori sebesar 1:4.
- Prosesor: Intel^® Xeon^® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.
Penyimpanan:
- Instans ini merupakan instans I/O teroptimasi.
- Tipe disk cloud yang didukung: ESSD, ESSD AutoPL, Zone-redundant ESSD, SSD standar, dan Ultra Disk. Untuk informasi selengkapnya, lihat Ikhtisar Block Storage.
Jaringan:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
- Kinerja jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn6v.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	PPS jaringan	Multi-queue	ENI	IPv4 per ENI	IPv6 per ENI
ecs.ebmgn6v.24xlarge	96	384	NVIDIA V100 × 8	16 GB × 8	30	4.500.000	8	32	10	1

Keluarga instans komputasi GPU ebmgn6i

Pengantar
- ebmgn6i adalah keluarga tipe instans yang dibangun di atas Arsitektur X-Dragon, menghadirkan komputasi perangkat keras berbasis software-defined, serta menggabungkan elastisitas fleksibel dengan performa tinggi.
- Instans-Instans ini didukung oleh akselerator GPU NVIDIA T4 dengan fitur-fitur berikut:
  - Arsitektur Turing inovatif
  - 16 GB memori GPU per GPU dengan bandwidth memori 320 GB/s
  - 2.560 CUDA Core per GPU
  - Hingga 320 Turing Tensor Core per GPU
  - Tensor Core presisi variabel menghadirkan performa FP16 sebesar 65 TFLOPS, 130 INT8 TOPS, dan 260 INT4 TOPS.
Kasus penggunaan
- Inferensi AI (DL/ML), termasuk aplikasi seperti computer vision, pengenalan suara, speech synthesis, NLP, machine translation, dan sistem rekomendasi.
- Rendering cloud real-time untuk cloud gaming.
- Rendering cloud real-time untuk AR/VR.
- Beban kerja grafis intensif komputasi atau workstation grafis.
- Database yang dipercepat GPU.
- Komputasi berkinerja tinggi (high-performance computing).
Komputasi
- Rasio vCPU terhadap memori sebesar 1:4.
- Prosesor: Intel^® Xeon^® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.
Penyimpanan
- Instans ini merupakan instans I/O teroptimasi.
- Tipe disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, ESSD Zone-redundant cloud disk, SSD cloud disk, dan Ultra Disk. Untuk informasi selengkapnya, lihat Ikhtisar Block Storage.
Jaringan
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.
- Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn6i.

Tipe instans	vCPU	Memori (GiB)	GPU	Memori GPU	Bandwidth jaringan (Gbit/s)	Laju forwarding (PPS)	Multiqueue	ENI	Alamat IPv4 privat	Alamat IPv6
ecs.ebmgn6i.24xlarge	96	384	NVIDIA T4 × 4	16 GB × 4	30	4,5 juta	8	32	10	1