Alibaba Cloud GPU ECS instances (gn/vgn/sgn series) - Elastic Compute Service

Elastic GPU Service menyediakan komputasi berakselerasi GPU yang on-demand dan auto-scaling. Sebagai bagian dari keluarga Elastic Computing Alibaba Cloud, layanan ini menggabungkan daya komputasi GPU dan CPU untuk kasus penggunaan seperti artificial intelligence (AI), high-performance computing (HPC), serta pemrosesan grafis dan gambar profesional.

Catatan

Lihat ketersediaan instans berdasarkan wilayah: Tipe instans dapat bervariasi tergantung wilayah. Kami menyarankan Anda memeriksa ketersediaan pembelian di setiap wilayah.
Lihat panduan pemilihan tipe instans: Pertama, tentukan keluarga instans yang sesuai dengan skenario bisnis Anda. Kemudian, gunakan topik ini untuk memilih tipe instans tertentu.
Lihat deskripsi metrik instans: Baca topik ini untuk memahami metrik tipe instans.
Gunakan Kalkulator Harga ECS: Anda dapat menggunakan kalkulator harga untuk memperkirakan biaya instans.

GPU virtualization	GPU compute	Not recommended
sgn8ia sgn7i-vws (shared CPU) vgn7i-vws vgn6i-vws	gn9gc, GPU-accelerated compute-optimized instance family gn8v/gn8v-tee gn8is gn7e gn7i gn7 gn6i gn6e gn6v	gn7s, GPU-accelerated compute-optimized instance family

sgn8ia vGPU-accelerated instance family

Overview:
- Ditenagai oleh arsitektur SHENLONG generasi ketiga, instans sgn8ia memberikan performa ultra-tinggi yang stabil dan dapat diprediksi. Akselerasi tingkat chip meningkatkan signifikan performa penyimpanan, jaringan, dan komputasi, membantu Anda menyimpan data dan memuat model lebih cepat.
- Instans ini mencakup lisensi perangkat lunak NVIDIA GRID Virtual Workstation (vWS) yang menyediakan akselerasi grafis bersertifikasi untuk berbagai aplikasi desain berbantuan komputer (CAD) profesional. Instans ini juga dapat berfungsi sebagai instans berakselerasi GPU hemat biaya dan ringan untuk beban kerja inferensi AI skala kecil.
Use cases:
- Beban kerja inferensi AI konkuren yang memerlukan CPU frekuensi tinggi, memori besar, dan GPU kuat, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
- Aplikasi intensif grafis yang memerlukan virtualisasi grafis 3D berkinerja tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans ini mendukung fitur RTX dan dipasangkan dengan CPU frekuensi tinggi.
- Pemodelan 3D untuk produksi film dan animasi, cloud gaming, dan desain mekanik. Prosesor AMD Genoa frekuensi tinggi dengan kecepatan clock hingga 3,75 GHz memberikan performa unggul untuk tugas-tugas ini.
Compute:
- Dilengkapi GPU berarsitektur NVIDIA Lovelace yang memiliki:
  - Memori GPU besar dan berbagai opsi slicing GPU.
  - Dukungan untuk fitur akselerasi umum seperti vGPU, RTX, dan TensorRT untuk berbagai beban kerja.
- Processor: Prosesor AMD Genoa frekuensi tinggi dengan kecepatan clock 3,4 GHz hingga 3,75 GHz, memberikan daya komputasi lebih tinggi untuk pemodelan 3D.
Storage:
- Semua instans dalam keluarga ini adalah I/O optimized.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Overview of the NVMe protocol.
- Jenis disk cloud yang didukung: ESSD cloud disks, ESSD AutoPL cloud disks, dan regional ESSD cloud disks. Untuk informasi selengkapnya tentang disk cloud, lihat Block storage overview.
Network:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans karena instans yang lebih besar menawarkan performa lebih baik.

Tabel berikut mencantumkan tipe instans dan spesifikasi untuk keluarga sgn8ia.

Instance type	vCPUs	Memory (GiB)	GPU memory	Network bandwidth (Gbit/s)	Packet rate (pps)	NIC queues	ENIs	Private IPs per ENI	Maximum cloud disks	Baseline IOPS	Baseline throughput (MB/s)
ecs.sgn8ia-m2.xlarge	4	16	2 GB	2,5	1.000.000	4	4	15/15	9	30.000	244
ecs.sgn8ia-m4.2xlarge	8	32	4 GB	4	1.600.000	8	4	15/15	9	45.000	305
ecs.sgn8ia-m8.4xlarge	16	64	8 GB	7	2.000.000	16	8	30/30	17	60.000	427
ecs.sgn8ia-m16.8xlarge	32	128	16 GB	10	3.000.000	32	8	30/30	33	80.000	610
ecs.sgn8ia-m24.12xlarge	48	192	24 GB	16	4.500.000	48	8	30/30	33	120.000	1.000
ecs.sgn8ia-m48.24xlarge	96	384	48 GB	32	9.000.000	64	15	30/30	33	240.000	2.000

Catatan

Spesifikasi GPU dalam tabel mengacu pada slice vGPU yang dibuat menggunakan teknologi vGPU.
Untuk instans sgn8ia, memori dan memori GPU merupakan resource dedicated. vCPU merupakan resource shared dengan rasio oversubscription sekitar 1:1,5. Jika beban kerja Anda memerlukan daya komputasi CPU dedicated, gunakan instans dedicated dengan GPU passthrough, seperti instans dari keluarga gn7i GPU-accelerated compute-optimized.

sgn7i-vws, vGPU-accelerated instance family with shared CPUs

Overview:
- Ditenagai oleh arsitektur SHENLONG generasi ketiga, instans sgn7i-vws memberikan performa tinggi yang stabil dan dapat diprediksi. Instans ini menggunakan akselerasi fast path tingkat chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, membantu Anda menyimpan data dan memuat model lebih cepat.
- Instans dalam keluarga ini berbagi resource CPU dan jaringan untuk memaksimalkan pemanfaatan resource dasar. Memori dan memori GPU didedikasikan untuk setiap instans, memastikan isolasi data dan performa konsisten.
  
  Catatan
  Jika Anda memerlukan resource CPU dedicated, pilih keluarga instans vgn7i-vws.
- Instans ini mencakup lisensi perangkat lunak NVIDIA GRID Virtual Workstation (vWS), yang menyediakan driver akselerasi grafis bersertifikasi untuk berbagai aplikasi CAD profesional. Instans ini juga dapat digunakan sebagai instans komputasi GPU ringan dan hemat biaya untuk beban kerja inferensi AI skala kecil.
Use cases:
- Dilengkapi CPU, memori, dan GPU berperforma tinggi, instans ini cocok untuk tugas inferensi AI konkuren seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.
- Mendukung fitur RTX dan CPU frekuensi tinggi, instans ini menyediakan virtualisasi grafis 3D berperforma tinggi, ideal untuk beban kerja intensif grafis seperti desain grafis jarak jauh dan cloud gaming.
- Ditenagai oleh prosesor Intel Ice Lake, instans ini memberikan performa luar biasa untuk pemodelan 3D di bidang seperti produksi film dan animasi, cloud gaming, dan desain mekanik.
Compute:
- Dilengkapi GPU NVIDIA A10.
  - Arsitektur NVIDIA Ampere inovatif.
  - Dukungan untuk fitur akselerasi umum seperti vGPU, RTX, dan TensorRT untuk berbagai beban kerja.
- Processor: Prosesor Intel^® Xeon^® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo all-core 3,5 GHz.
Storage:
- Instans I/O optimized.
- Jenis disk cloud yang didukung: ESSD cloud disk, ESSD AutoPL cloud disk, dan Zone-redundant ESSD cloud disk. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans; tipe yang lebih besar menawarkan performa lebih tinggi.

Keluarga instans sgn7i-vws mencakup tipe instans dan spesifikasi yang tercantum dalam tabel berikut:

Instance type	vCPU	Memory (GiB)	GPU	GPU memory	Network bandwidth (Gbit/s)	Packet rate (PPS)	NIC queues	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.sgn7i-vws-m2.xlarge	4	15,5	NVIDIA A10 * 1/12	24 GB * 1/12	1,5/5	500.000	4	2	2	1
ecs.sgn7i-vws-m4.2xlarge	8	31	NVIDIA A10 * 1/6	24 GB * 1/6	2,6/10	1.000.000	4	4	6	1
ecs.sgn7i-vws-m8.4xlarge	16	62	NVIDIA A10 * 1/3	24 GB * 1/3	5/20	2.000.000	8	4	10	1
ecs.sgn7i-vws-m2s.xlarge	4	8	NVIDIA A10 * 1/12	24 GB * 1/12	1,5/5	500.000	4	2	2	1
ecs.sgn7i-vws-m4s.2xlarge	8	16	NVIDIA A10 * 1/6	24 GB * 1/6	2,6/10	1.000.000	4	4	6	1
ecs.sgn7i-vws-m8s.4xlarge	16	32	NVIDIA A10 * 1/3	24 GB * 1/3	5/20	2.000.000	8	4	10	1

Catatan

Kolom GPU menunjukkan model GPU dan informasi slicing GPU. Slicing GPU membagi GPU fisik menjadi beberapa slice dan mengalokasikan satu slice ke setiap instans.

Sebagai contoh, dalam NVIDIA A10 * 1/12, NVIDIA A10 adalah model GPU, dan 1/12 berarti satu GPU fisik dibagi menjadi 12 slice, dengan satu slice dialokasikan ke instans tersebut.

vgn7i-vws, vGPU-accelerated instance family

Overview
- Dibangun di atas arsitektur Shenlong generasi ketiga, instans ini memberikan performa tinggi yang stabil dan dapat diprediksi. Instans ini menggunakan akselerasi fast path tingkat chip untuk secara signifikan meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, memungkinkan Anda menyimpan data dan memuat model lebih cepat.
- Instans ini mencakup lisensi perangkat lunak NVIDIA GRID vWS, menyediakan driver akselerasi grafis bersertifikasi untuk aplikasi CAD profesional dan beban kerja desain grafis. Instans ini juga dapat digunakan sebagai instans komputasi hemat biaya dan ringan untuk inferensi AI skala kecil.
Use cases
- Dengan CPU, memori, dan GPU berperforma tinggi, instans ini dapat menangani volume tinggi tugas inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.
- Instans ini mendukung fitur RTX dan dipasangkan dengan CPU frekuensi tinggi untuk menyediakan virtualisasi grafis 3D berperforma tinggi, menjadikannya ideal untuk desain grafis jarak jauh, cloud gaming, dan beban kerja pemrosesan grafis menuntut lainnya.
- Ditenagai oleh prosesor Intel Ice Lake, instans ini memberikan performa luar biasa untuk pemodelan 3D di bidang seperti produksi film dan animasi, cloud gaming, dan desain mekanik.
Compute
- Instans ini dilengkapi GPU NVIDIA A10.
  - Berdasarkan arsitektur NVIDIA Ampere inovatif.
  - Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.
- Processor: Prosesor Intel^® Xeon^® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo all-core 3,5 GHz.
Storage
- Ini adalah instans I/O optimized.
- Jenis disk cloud yang didukung: ESSD cloud disks, ESSD AutoPL cloud disks, dan ESSD Intra-city Redundant cloud disks. Untuk informasi selengkapnya tentang disk cloud, lihat Block storage overview.
Network
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans vgn7i-vws mencakup tipe instans dan spesifikasi berikut.

Instance type	vCPUs	Memory (GiB)	GPU	GPU memory	Baseline bandwidth (Gbit/s)	Forwarding rate (pps)	NIC queues	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.vgn7i-vws-m4.xlarge	4	30	NVIDIA A10 * 1/6	24GB * 1/6	3	1.000.000	4	4	10	1
ecs.vgn7i-vws-m8.2xlarge	10	62	NVIDIA A10 * 1/3	24GB * 1/3	5	2.000.000	8	6	10	1
ecs.vgn7i-vws-m12.3xlarge	14	93	NVIDIA A10 * 1/2	24GB * 1/2	8	3.000.000	8	6	15	1
ecs.vgn7i-vws-m24.7xlarge	30	186	NVIDIA A10 * 1	24GB * 1	16	6.000.000	12	8	30	1

Catatan

Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi slicing GPU. Slicing GPU membagi GPU fisik menjadi beberapa slice, memungkinkan setiap instans menggunakan satu slice. Sebagai contoh:

Dalam NVIDIA A10 * 1/6, NVIDIA A10 adalah model GPU, dan 1/6 menunjukkan bahwa GPU fisik dibagi menjadi enam slice dan instans menggunakan salah satunya.

vgn6i-vws, vGPU-accelerated instance family

Penting

Alibaba Cloud telah meningkatkan keluarga instans vgn6i menjadi vgn6i-vws. Keluarga instans baru ini menggunakan driver NVIDIA GRID terbaru dan mencakup lisensi GRID vWS gratis. Untuk meminta image gratis dengan driver GRID yang telah dipra-instal, submit a ticket.
Jika Anda perlu menggunakan public image atau custom image yang tidak mencakup driver GRID, submit a ticket untuk meminta paket driver GRID untuk instalasi terpisah. Alibaba Cloud tidak membebankan biaya lisensi tambahan untuk driver GRID.

Use cases:
- Real-time rendering untuk cloud gaming.
- Real-time rendering untuk aplikasi augmented reality (AR) dan virtual reality (VR).
- Inferensi AI (DL dan ML) untuk layanan internet yang dideploy secara elastis.
- Lingkungan pelatihan langsung untuk deep learning.
- Lingkungan eksperimen model untuk deep learning.
Compute:
- Dilengkapi akselerator GPU NVIDIA T4.
- Instans ini menggunakan vGPU yang dibuat oleh slicing GPU.
  - Menyediakan 1/4 atau 1/2 kemampuan komputasi dari GPU NVIDIA Tesla T4 penuh.
  - Menawarkan memori GPU 4 GB atau 8 GB.
- Memiliki rasio vCPU-ke-memori sekitar 1:5.
- Processor: Intel ^® Xeon ^® Platinum 8163 (Skylake) 2,5 GHz.
Storage:
- Semua instans dalam keluarga ini adalah I/O optimized.
- Jenis disk cloud yang didukung: ESSDs, ESSD AutoPL cloud disks, Regional ESSDs, SSD standar, dan ultra disk. Untuk informasi selengkapnya tentang disk cloud, lihat Elastic Block Storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasi untuk keluarga instans vgn6i-vws .

Instance type	vCPUs	Memory (GiB)	GPU	GPU memory	Baseline bandwidth (Gbit/s)	Forwarding rate (pps)	NIC queues	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.vgn6i-m4-vws.xlarge	4	23	NVIDIA T4 * 1/4	16 GB * 1/4	2	500.000	4/2	3	10	1
ecs.vgn6i-m8-vws.2xlarge	10	46	NVIDIA T4 * 1/2	16 GB * 1/2	4	800.000	8/2	4	10	1
ecs.vgn6i-m16-vws.5xlarge	20	92	NVIDIA T4 * 1	16 GB * 1	7,5	1.200.000	6	4	10	1

Catatan

Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi slicing GPU. Slicing GPU membagi GPU fisik menjadi beberapa slice, dan setiap instans menggunakan satu slice.

Dalam NVIDIA T4 * 1/4, NVIDIA T4 adalah model GPU, dan 1/4 menunjukkan bahwa satu GPU dibagi menjadi empat slice, dengan setiap instans menggunakan satu.

gn9gc, GPU-accelerated compute-optimized instance family

Catatan

gn9gc berada dalam invitational preview. Untuk menggunakan gn9gc, submit a ticket.

Overview: gn9gc adalah keluarga instans server cloud GPU generasi kesembilan Alibaba Cloud yang hemat biaya. Instans ini menggunakan CIPU 2.0 generasi terbaru untuk memberikan kemampuan layanan cloud, memiliki prosesor kecepatan clock tinggi, dan dikonfigurasi dengan kapasitas memori yang sesuai. Keluarga instans ini menyediakan instans hemat biaya untuk skenario generasi large language model (LLM) dan skenario generasi video/gambar. GPU juga dapat langsung menyediakan kemampuan pemrosesan grafis untuk mendukung berbagai beban kerja rendering.
Use cases:
- Inferensi LLM: GPU generasi baru memberikan daya komputasi yang melampaui generasi kedelapan dengan bandwidth memori yang ditingkatkan secara signifikan. Dukungan FP4 compute yang baru secara komprehensif meningkatkan performa dan efisiensi biaya inferensi. Efisiensi inferensi paralel multi-GPU sangat ditingkatkan.

Compute:

Menggunakan cloud processor CIPU 2.0 terbaru.
- CIPU generasi kedua menyediakan daya pemrosesan cloud yang lebih tinggi dengan peningkatan kemampuan komponen eRDMA, VPC, dan EBS. Mendukung container (termasuk namun tidak terbatas pada Docker, Clear Container, dan Pouch).
Menggunakan kartu grafis profesional berarsitektur Blackwell terbaru:
- Mendukung pemrosesan grafis profesional OpenGL.
- Mendukung fitur akselerasi umum seperti RTX, TensorRT, dengan dukungan FP4 yang ditingkatkan dan interkoneksi PCIe Gen5.

Spesifikasi GPU utama:

GPU architecture	GPU memory	Computing performance	Video encoding/decoding	Inter-GPU interconnect	Acceleration APIs
NVIDIA Blackwell	Capacity: 72 GB Bandwidth: 1.344 GB/s	TF32: 126 TFLOPS FP32: 52 TFLOPS FP16/BF16: 266 TFLOPS FP8/INT8: 530 TFLOPS FP4: 970 TFLOPS RT Core: 196 TFLOPS	3 x Video Encoder 3 x Video Decoder	PCIe interface: PCIe Gen5 x16 Bandwidth: 128 GB/s, P2P supported	DX12, OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, DirectCompute

Storage:
- I/O optimized.
- Mendukung protokol NVMe. Untuk informasi selengkapnya, lihat NVMe protocol.
- Jenis disk cloud yang didukung: elastic ephemeral disks, ESSDs, ESSD AutoPL disks, dan regional ESSDs. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat IPv6.
- Performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta PPS (instans 8-GPU).
- Mendukung ERI (Elastic RDMA Interface) untuk akselerasi langsung RDMA melalui jaringan VPC, dengan bandwidth hingga 360 Gbit/s. Cocok untuk beban kerja pelatihan model tradisional, visi komputer, embodied intelligence, dan autonomous driving.
- Catatan
  Untuk informasi selengkapnya tentang ERI, lihat Enable eRDMA on an enterprise-level instance.

Tabel berikut menjelaskan tipe instans dalam keluarga instans gn9gc.

Instance type	vCPUs	Memory (GiB)	GPU memory	Baseline/burst bandwidth (Gbit/s)	Packet forwarding rate (pps)	IPv4 addresses per ENI	IPv6 addresses per ENI	NIC queues (primary/secondary)	ENIs	Max data disks	Max disk bandwidth (GB/s)
ecs.gn9gc.4xlarge	16	128	72 GB × 1	16	3,6 juta	30	30	8/32	8	1	1
ecs.gn9gc.8xlarge	32	192	72 GB × 1	32	7,5 juta	30	30	16/64	8	1	1
ecs.gn9gc-2x.16xlarge	64	384	72 GB × 2	65	15 juta	30	30	32/64	15	2	2
ecs.gn9gc-4x.32xlarge	128	768	72 GB × 4	131	30 juta	50	50	64/64	15	4	4
ecs.gn9gc-8x.64xlarge	256	1.536	72 GB × 8	204	30 juta	50	50	128/64	15	6	6

Catatan

Image yang digunakan untuk instans gn9gc harus dalam mode boot UEFI. Jika Anda ingin menggunakan custom image, pastikan custom image tersebut mendukung mode boot UEFI dan atribut mode boot image diatur ke UEFI. Untuk informasi selengkapnya, lihat Set the boot mode of a custom image to UEFI by calling API operations.

gn8v and gn8v-tee, GPU-accelerated compute-optimized instance family

Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakannya, hubungi perwakilan penjualan Alibaba Cloud Anda.

Introduction:
- gn8v: Keluarga instans compute-optimized berakselerasi GPU generasi kedelapan Alibaba Cloud untuk pelatihan dan inferensi model AI pada large language models (LLMs) ultra-besar. Keluarga ini menyediakan tipe instans dengan satu, dua, empat, atau delapan GPU untuk berbagai kebutuhan aplikasi.
- gn8v-tee: Untuk meningkatkan keamanan pelatihan dan inferensi model besar, Alibaba Cloud menawarkan gn8v-tee, keluarga instans generasi kedelapan berbasis gn8v dengan fitur confidential computing. Instans ini mengenkripsi data selama komputasi GPU untuk melindungi data Anda.
Use cases:
- Hemat biaya untuk inferensi paralel multi-GPU pada LLM dengan lebih dari 70 miliar parameter.
- Setiap GPU menyediakan daya komputasi FP32 39,5 TFLOPS dan memberikan performa luar biasa untuk beban kerja pelatihan model AI tradisional dan pelatihan autonomous driving.
- Delapan GPU mendukung interkoneksi NVLink dan cocok untuk pelatihan model skala kecil hingga menengah.
Features:
- High-speed, large-capacity GPU memory: Setiap GPU dilengkapi memori GPU HBM3 96 GB dan menyediakan bandwidth memori hingga 4 TB/s, secara signifikan mempercepat pelatihan dan inferensi model.
- High inter-GPU bandwidth: Beberapa GPU saling terhubung dengan NVLink pada 900 GB/s. Ini memungkinkan efisiensi jauh lebih tinggi untuk pelatihan dan inferensi multi-GPU dibandingkan instans GPU generasi sebelumnya.
- LLM quantization: Mendukung daya komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi parameter skala besar. Ini secara signifikan meningkatkan kecepatan pelatihan dan inferensi serta mengurangi penggunaan memori GPU.
- (Hanya untuk instans gn8v-tee) High security: Mendukung confidential computing CPU dengan Intel® Trust Domain Extensions (TDX) dan confidential computing GPU dengan NVIDIA Confidential Computing (CC). Ini menyediakan confidential computing end-to-end untuk seluruh pipeline inferensi model, melindungi data inferensi dan model perusahaan Anda selama pelatihan dan inferensi model.
Compute:
- Ditenagai oleh CIPU 1.0 terbaru.
  - Memisahkan komputasi dari penyimpanan, memungkinkan Anda memilih fleksibel resource penyimpanan yang Anda butuhkan.
  - Menyediakan kemampuan bare metal, yang mendukung komunikasi peer-to-peer (P2P) antar instans GPU, berbeda dengan instans virtualisasi tradisional.
- Ditenagai oleh prosesor Intel® Xeon® Scalable generasi keempat dengan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo all-core hingga 3,1 GHz.
Storage:
- Instans I/O-optimized.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Overview of the NVMe protocol.
- Jenis disk cloud yang didukung: elastic ephemeral disk, ESSD, ESSD AutoPL disks, dan Regional ESSD. Untuk informasi selengkapnya tentang disk cloud, lihat block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat IPv6 communication.
- Instans ini mendukung jumbo frames. Untuk informasi selengkapnya, lihat Jumbo frames.
- Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta pps (pada instans 8-GPU).
- Mendukung elastic RDMA interface (ERI).
- Catatan
  Untuk informasi tentang cara menggunakan ERI, lihat Mengaktifkan pada instans tingkat perusahaan.
Security: Mendukung fitur trusted computing (vTPM). Fitur ini tersedia pada instans gn8v tetapi tidak pada instans gn8v-tee. Untuk informasi selengkapnya, lihat Overview of trusted computing capabilities.

Tabel berikut menjelaskan tipe instans dalam keluarga gn8v.

Instance type	vCPUs	Memory (GiB)	GPU memory	Network bandwidth (Gbit/s)	ENIs	Primary ENI queues	IPv4 addresses per ENI	IPv6 addresses per ENI	Max cloud disks	Baseline IOPS	Baseline bandwidth (GB/s)
ecs.gn8v.4xlarge	16	96	96 GB × 1	12	8	16	30	30	17	100.000	0,75
ecs.gn8v.6xlarge	24	128	96 GB × 1	15	8	24	30	30	17	120.000	0,937
ecs.gn8v-2x.8xlarge	32	192	96 GB × 2	20	8	32	30	30	25	200.000	1,25
ecs.gn8v-4x.8xlarge	32	384	96 GB × 4	20	8	32	30	30	25	200.000	1,25
ecs.gn8v-2x.12xlarge	48	256	96 GB × 2	25	8	48	30	30	33	300.000	1,50
ecs.gn8v-8x.16xlarge	64	768	96 GB × 8	32	8	64	30	30	33	360.000	2,5
ecs.gn8v-4x.24xlarge	96	512	96 GB × 4	50	15	64	30	30	49	500.000	3
ecs.gn8v-8x.48xlarge	192	1.024	96 GB × 8	100	15	64	50	50	65	1.000.000	6

Tabel berikut menjelaskan tipe instans dalam keluarga gn8v-tee .

Instance type	vCPUs	Memory (GiB)	GPU memory	Network bandwidth (Gbit/s)	ENIs	Primary ENI queues	IPv4 addresses per ENI	IPv6 addresses per ENI	Max cloud disks	Baseline IOPS	Baseline bandwidth (GB/s)
ecs.gn8v-tee.4xlarge	16	96	96 GB × 1	12	8	16	30	30	17	100.000	0,75
ecs.gn8v-tee.6xlarge	24	128	96 GB × 1	15	8	24	30	30	17	120.000	0,937
ecs.gn8v-tee-8x.16xlarge	64	768	96 GB × 8	32	8	64	30	30	33	360.000	2,5
ecs.gn8v-tee-8x.48xlarge	192	1.024	96 GB × 8	100	15	64	50	50	65	1.000.000	6

Catatan

Keluarga instans gn8v-tee hanya mendukung image Alibaba Cloud Linux 3. Jika Anda menggunakan custom image yang dibangun di atas Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernel adalah 5.10.134-18 atau yang lebih baru.

gn8is, GPU-accelerated compute-optimized instance family

Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakan keluarga instans ini, hubungi perwakilan penjualan Alibaba Cloud Anda.

Introduction: gn8is adalah keluarga instans compute-optimized berakselerasi GPU generasi kedelapan Alibaba Cloud, dirancang untuk memenuhi permintaan yang terus berkembang dari konten yang dihasilkan AI (AIGC). Ditenagai oleh GPU NVIDIA L20 terbaru, keluarga ini menawarkan tipe instans dengan satu, dua, empat, atau delapan GPU, dan berbagai rasio CPU-ke-GPU untuk memenuhi kebutuhan aplikasi yang beragam.
Features:
- Graphics processing: Ditenagai oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi keempat, instans ini menyediakan daya komputasi CPU yang kuat untuk skenario pemodelan 3D, memastikan rendering grafis dan alur kerja desain yang lebih lancar.
- Inference tasks: Dilengkapi GPU NVIDIA L20 baru, masing-masing dengan memori GPU 48 GB, instans ini mempercepat tugas inferensi. Instans ini mendukung format floating-point FP8 dan dapat dipasangkan dengan Container Service for Kubernetes (ACK) untuk menjalankan inferensi berbagai model AIGC secara fleksibel. Instans ini sangat cocok untuk tugas inferensi pada large language models (LLMs) dengan kurang dari 70 miliar parameter.
Use cases:
- Gunakan driver GRID dengan image dari Alibaba Cloud Marketplace untuk mengaktifkan kemampuan OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk beban kerja seperti animasi, efek khusus film dan televisi, dan rendering.
- Gunakan kemampuan manajemen container dari Container Service for Kubernetes (ACK) untuk generasi gambar AIGC dan inferensi LLM yang lebih efisien dan hemat biaya.
- Aplikasi AI umum lainnya, seperti pengenalan gambar dan pengenalan suara.

Compute:

Ditenagai oleh GPU enterprise-grade NVIDIA L20 terbaru.
- Mendukung fitur akselerasi umum seperti TensorRT dan format floating-point FP8 untuk meningkatkan performa inferensi model.
- Hingga 48 GB memori GPU per GPU. Dengan beberapa GPU, instans dalam keluarga ini mendukung inferensi single-instance untuk model dengan 70 miliar parameter atau lebih.
- Kemampuan pemrosesan grafis yang ditingkatkan. Setelah Anda menginstal driver GRID menggunakan Cloud Assistant atau image dari Alibaba Cloud Marketplace, performa pemrosesan grafis dua kali lipat dari platform generasi ketujuh.

Parameter utama GPU NVIDIA L20:

GPU architecture	Memori GPU	Compute performance	Video encoding/decoding	Inter-GPU connectivity
NVIDIA Ada Lovelace	Capacity: 48 GB Bandwidth: 864 GB/s	FP64: N/A FP32: 59,3 TFLOPS FP16/BF16: 119 TFLOPS FP8/INT8: 237 TFLOPS	3 × Video Encoders (+AV1) 3 × Video Decoders 4 × JPEG Decoders	PCIe interface: PCIe Gen4 x16 Bandwidth: 64 GB/s

Processor: Ditenagai oleh prosesor Intel^® Xeon^® frekuensi tinggi terbaru dengan frekuensi turbo all-core hingga 3,9 GHz untuk menangani permintaan pemodelan 3D yang kompleks.

Storage:
- Semua instans dalam keluarga ini adalah instans I/O-optimized.
- Instans ini mendukung protokol NVMe. Untuk informasi selengkapnya, lihat Overview of the NVMe protocol.
- Jenis disk cloud yang didukung: elastic ephemeral disks, ESSDs, ESSD AutoPL disks, dan Regional ESSDs. Untuk informasi selengkapnya tentang disk cloud, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat IPv6 communication.
- Mendukung Elastic RDMA Interface (ERI).
  
  Catatan
  Untuk detail penggunaan ERI, lihat Enable eRDMA for enterprise-level instances.
Security: Instans ini mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Overview of trusted computing.

Tabel berikut menjelaskan tipe instans dan spesifikasi untuk keluarga gn8is.

Instance type	vCPUs	Memory (GiB)	GPU	GPU memory	Network bandwidth (Gbit/s)	ENIs	Primary ENI queues	Private IPv4 addresses	IPv6 addresses	Max cloud disks	Disk IOPS	Disk bandwidth (GB/s)
ecs.gn8is.2xlarge	8	64	L20 × 1	48 GB × 1	8	4	8	15	15	17	60.000	0,75
ecs.gn8is.4xlarge	16	128	L20 × 1	48 GB × 1	16	8	16	30	30	17	120.000	1,25
ecs.gn8is-2x.8xlarge	32	256	L20 × 2	48 GB × 2	32	8	32	30	30	33	250.000	2
ecs.gn8is-4x.16xlarge	64	512	L20 × 4	48 GB × 4	64	8	64	30	30	33	450.000	4
ecs.gn8is-8x.32xlarge	128	1.024	L20 × 8	48 GB × 8	100	15	64	50	50	65	900.000	8

gn7e, GPU-accelerated compute-optimized instance family

Fitur keluarga instans gn7e meliputi:

Overview:
- keluarga instans ini memungkinkan Anda memilih tipe instans dengan jumlah GPU dan resource CPU yang berbeda untuk memenuhi berbagai kebutuhan bisnis AI Anda.
- Dibangun di atas arsitektur X-Dragon generasi ketiga, instans gn7e memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan generasi sebelumnya.
Use cases:
- Beban kerja pelatihan AI skala kecil dan menengah.
- Beban kerja high-performance computing (HPC) yang dipercepat menggunakan CUDA.
- Beban kerja inferensi AI yang memerlukan performa komputasi GPU tinggi atau memori GPU besar.
- Deep learning, seperti pelatihan algoritma AI untuk klasifikasi gambar, autonomous driving, dan pengenalan suara.
- Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Penting
Saat menjalankan beban kerja pelatihan AI dengan beban komunikasi tinggi, seperti model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin tentang topologi tautan komunikasi untuk beban kerja pelatihan Anda, submit a ticket untuk dukungan dari pakar teknis Alibaba Cloud.
Storage:
- Semua instans dalam keluarga ini adalah I/O optimized.
- Jenis disk cloud yang didukung: ESSD cloud disks, ESSD AutoPL cloud disks, dan ESSD Intra-city Redundant cloud disks. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans gn7e mencakup tipe instans dan spesifikasi yang dijelaskan dalam tabel berikut.

Instance type	vCPUs	Memory (GiB)	GPU memory	Baseline bandwidth (Gbit/s)	Forwarding rate (pps)	Queues	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.gn7e-c16g1.4xlarge	16	125	80 GB × 1	8	3.000.000	8	8	10	1
ecs.gn7e-c16g1.8xlarge	32	250	80 GB × 2	16	6.000.000	16	8	10	1
ecs.gn7e-c16g1.16xlarge	64	500	80 GB × 4	32	12.000.000	32	8	10	1
ecs.gn7e-c16g1.32xlarge	128	1.000	80 GB × 8	64	24.000.000	32	16	15	1

gn7i, GPU-accelerated compute-optimized instance family

Overview: Ditenagai oleh arsitektur SHENLONG generasi ketiga, instans gn7i memberikan performa tinggi yang stabil dan dapat diprediksi. Instans ini menggunakan akselerasi fast path tingkat chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran.
Use cases:
- Dilengkapi CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk tugas inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.
- Instans ini mendukung fitur RTX dan menggunakan CPU frekuensi tinggi untuk memberikan virtualisasi grafis 3D berperforma tinggi. Instans ini cocok untuk beban kerja intensif grafis, seperti desain grafis jarak jauh dan cloud gaming.
Compute:
- Dilengkapi GPU NVIDIA A10 yang memiliki:
  - Arsitektur NVIDIA Ampere inovatif.
  - Dukungan untuk fitur akselerasi umum seperti RTX dan TensorRT.
- Processor: Prosesor Intel ^® Xeon ^® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo all-core 3,5 GHz.
- Keluarga instans ini menyediakan hingga 752 GiB memori, peningkatan signifikan dibandingkan keluarga instans gn6i.
Storage:
- Semua instans dalam keluarga ini adalah I/O optimized.
- Jenis disk cloud yang didukung: ESSD cloud disks, ESSD AutoPL cloud disks, dan ESSD Zone-redundant cloud disks. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans gn7i mencakup tipe instans dan spesifikasi berikut.

Instance type	vCPUs	Memory (GiB)	GPU	GPU memory	Network bandwidth (Gbit/s)	Packet rate (PPS)	NIC queues	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.gn7i-c8g1.2xlarge	8	30	NVIDIA A10 * 1	24 GB * 1	16	1.600.000	8	4	15	15
ecs.gn7i-c16g1.4xlarge	16	60	NVIDIA A10 * 1	24 GB * 1	16	3.000.000	8	8	30	30
ecs.gn7i-c32g1.8xlarge	32	188	NVIDIA A10 * 1	24 GB * 1	16	6.000.000	12	8	30	30
ecs.gn7i-c32g1.16xlarge	64	376	NVIDIA A10 * 2	24 GB * 2	32	12.000.000	16	15	30	30
ecs.gn7i-c32g1.32xlarge	128	752	NVIDIA A10 * 4	24 GB * 4	64	24.000.000	32	15	30	30
ecs.gn7i-c48g1.12xlarge	48	310	NVIDIA A10 * 1	24 GB * 1	16	9.000.000	16	8	30	30
ecs.gn7i-c56g1.14xlarge	56	346	NVIDIA A10 * 1	24 GB * 1	16	10.000.000	16	8	30	30
ecs.gn7i-2x.8xlarge	32	128	NVIDIA A10 * 2	24 GB * 2	16	6.000.000	16	8	30	30
ecs.gn7i-4x.8xlarge	32	128	NVIDIA A10 * 4	24 GB * 4	32	6.000.000	16	8	30	30
ecs.gn7i-4x.16xlarge	64	256	NVIDIA A10 * 4	24 GB * 4	64	12.000.000	32	8	30	30
ecs.gn7i-8x.32xlarge	128	512	NVIDIA A10 * 8	24 GB * 8	64	24.000.000	32	16	30	30
ecs.gn7i-8x.16xlarge	64	256	NVIDIA A10 * 8	24 GB * 8	32	12.000.000	32	8	30	30

Penting

Anda dapat mengubah instans tipe ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge menjadi ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge. Namun, Anda tidak dapat mengubahnya menjadi tipe instans lain seperti ecs.gn7i-c32g1.8xlarge.

gn7s, GPU-accelerated compute-optimized instance family

Untuk menggunakan keluarga instans gn7s, atau ajukan Tiket.

Introduction:
- Keluarga instans ini ditenagai oleh prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Keluarga ini menawarkan berbagai tipe instans dengan konfigurasi GPU dan CPU yang berbeda untuk memenuhi kebutuhan AI spesifik Anda.
- Dibangun di atas arsitektur SHENLONG generasi ketiga Alibaba Cloud, instans gn7s memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan generasi sebelumnya.
Use cases: Menampilkan CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk beban kerja inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.
Compute:
- Menampilkan GPU NVIDIA A30, yang mencakup:
  - Arsitektur NVIDIA Ampere inovatif.
  - Dukungan untuk fitur Multi-Instance GPU (MIG) dan akselerasi berbasis Tensor Core generasi kedua untuk berbagai beban kerja.
- Processor: Prosesor Intel ^® Xeon ^® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo all-core 3,5 GHz.
- Menawarkan memori yang jauh lebih banyak dibandingkan keluarga instans generasi sebelumnya.
Storage:
- Semua instans dalam keluarga ini adalah I/O optimized.
- Jenis disk cloud yang didukung: ESSD, ESSD AutoPL, dan Zone-redundant ESSD. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn7s mencakup tipe instans dan spesifikasi berikut:

Instance type	vCPUs	Memory (GiB)	GPUs	GPU memory	Network bandwidth (Gbit/s)	Packet rate (pps)	Private IPv4s per ENI	IPv6s per ENI	Multi-queue	ENIs
ecs.gn7s-c8g1.2xlarge	8	60	NVIDIA A30 * 1	24GB * 1	16	1.600.000	5	1	8	4
ecs.gn7s-c16g1.4xlarge	16	120	NVIDIA A30 * 1	24GB * 1	16	3.000.000	5	1	8	8
ecs.gn7s-c32g1.8xlarge	32	250	NVIDIA A30 * 1	24GB * 1	16	6.000.000	5	1	12	8
ecs.gn7s-c32g1.16xlarge	64	500	NVIDIA A30 * 2	24GB * 2	32	12.000.000	5	1	16	15
ecs.gn7s-c32g1.32xlarge	128	1.000	NVIDIA A30 * 4	24GB * 4	64	24.000.000	10	1	32	15
ecs.gn7s-c48g1.12xlarge	48	380	NVIDIA A30 * 1	24GB * 1	16	9.000.000	8	1	16	8
ecs.gn7s-c56g1.14xlarge	56	440	NVIDIA A30 * 1	24GB * 1	16	10.000.000	8	1	16	8

gn7, GPU-accelerated compute-optimized instance family

Scenarios:
- Deep learning, seperti pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, autonomous driving, dan pengenalan suara.
- Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

Storage:
- Instans adalah I/O optimized.
- Mendukung ESSD cloud disks, ESSD AutoPL cloud disks, dan ESSD Zone-redundant cloud disks. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut menjelaskan tipe instans dan spesifikasi keluarga instans gn7.

Instance type	vCPUs	Memory (GiB)	GPU memory	Network bandwidth (Gbit/s)	Packet rate (pps)	NIC queues	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.gn7-c12g1.3xlarge	12	94	40 GB × 1	4	2.500.000	4	8	10	1
ecs.gn7-c13g1.13xlarge	52	378	40 GB × 4	16	9.000.000	16	8	30	30
ecs.gn7-c13g1.26xlarge	104	756	40 GB × 8	30	18.000.000	16	15	10	1

gn6i, GPU-accelerated compute-optimized instance family

Use cases:
- Inferensi AI (deep learning dan machine learning) untuk aplikasi seperti visi komputer, pengenalan suara, sintesis suara, natural language processing (NLP), penerjemahan mesin, dan sistem rekomendasi.
- Rendering real-time untuk cloud gaming.
- Rendering real-time berbasis cloud untuk augmented reality (AR) dan virtual reality (VR).
- Komputasi atau workstation grafis yang intensif grafis.
- Database berakselerasi GPU.
- High-performance computing (HPC).
Compute:
- Dilengkapi akselerator GPU NVIDIA T4, yang memiliki:
  - Arsitektur NVIDIA Turing inovatif.
  - 16 GB memori per GPU dengan bandwidth memori 320 GB/s.
  - 2.560 core CUDA per GPU.
  - Hingga 320 Tensor Core Turing per GPU.
  - Tensor Core presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4.
- Rasio vCPU-ke-memori sekitar 1:4.
- Processor: Intel^® Xeon^® Platinum 8163 (Skylake) 2,5 GHz.
Storage:
- Instans I/O-optimized.
- Jenis disk yang didukung: ESSD, ESSD AutoPL disks, SSD disk, dan ultra disk. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk detailnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn6i mencakup tipe instans berikut.

Instance type	vCPUs	Memory (GiB)	GPUs	GPU memory	Network bandwidth (Gbit/s)	Packet rate (pps)	Disk IOPS	Multi-queue	ENIs	Private IPv4 addresses	IPv6 addresses
ecs.gn6i-c4g1.xlarge	4	15	NVIDIA T4 × 1	16 GB × 1	4	2.500.000	N/A	2	2	10	1
ecs.gn6i-c8g1.2xlarge	8	31	NVIDIA T4 × 1	16 GB × 1	5	2.500.000	N/A	2	2	10	1
ecs.gn6i-c16g1.4xlarge	16	62	NVIDIA T4 × 1	16 GB × 1	6	2.500.000	N/A	4	3	10	1
ecs.gn6i-c24g1.6xlarge	24	93	NVIDIA T4 × 1	16 GB × 1	7,5	2.500.000	N/A	6	4	10	1
ecs.gn6i-c40g1.10xlarge	40	155	NVIDIA T4 × 1	16 GB × 1	10	2.500.000	N/A	16	10	10	1
ecs.gn6i-c24g1.12xlarge	48	186	NVIDIA T4 × 2	16 GB × 2	15	4.500.000	N/A	12	6	10	1
ecs.gn6i-c24g1.24xlarge	96	372	NVIDIA T4 × 4	16 GB × 4	30	4.500.000	250.000	24	8	10	1

gn6e, GPU-accelerated compute-optimized instance family

Use cases:
- Aplikasi deep learning, seperti pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, autonomous driving, dan pengenalan suara.
- Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Compute:
- Menampilkan kartu GPU NVIDIA V100 (32 GB NVLink).
- Akselerator GPU: V100 (paket SXM2).
  - Arsitektur NVIDIA Volta inovatif.
  - 32 GB memori HBM2 per GPU dengan bandwidth memori GPU 900 GB/s.
  - 5.120 CUDA Cores per GPU.
  - 640 Tensor Cores per GPU.
  - Setiap GPU mendukung enam koneksi NVLink dua arah, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah untuk total 300 Gbit/s.
- Memiliki rasio vCPU-ke-memori sekitar 1:8.
- Processor: Intel ^® Xeon ^® Platinum 8163 (Skylake) 2,5 GHz.
Storage:
- Instans I/O optimized.
- Jenis disk cloud yang didukung: ESSDs, ESSD AutoPL disks, Regional ESSDs, SSD standar, dan ultra disk. Untuk informasi selengkapnya, lihat Elastic Block Storage.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans.

gn6e mencakup tipe instans dan spesifikasi yang tercantum dalam tabel di bawah ini.

Instance type	vCPU	Memory (GiB)	GPU	GPU memory	Baseline bandwidth (Gbit/s)	Packet rate (PPS)	NIC queues	ENI	Private IPv4 addresses	IPv6 addresses
ecs.gn6e-c12g1.3xlarge	12	92	1 × NVIDIA V100	1 × 32 GB	5	800.000	8	6	10	1
ecs.gn6e-c12g1.6xlarge	24	184	2 × NVIDIA V100	2 × 32 GB	8	1.200.000	8	8	20	1
ecs.gn6e-c12g1.12xlarge	48	368	4 × NVIDIA V100	4 × 32 GB	16	2.400.000	8	8	20	1
ecs.gn6e-c12g1.24xlarge	96	736	8 × NVIDIA V100	8 × 32 GB	32	4.500.000	16	8	20	1

gn6v, GPU-accelerated compute-optimized instance family

Use cases:
- Aplikasi deep learning, seperti pelatihan dan inferensi untuk algoritma AI dalam klasifikasi gambar, autonomous driving, dan pengenalan suara.
- Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.
Compute:
- Dilengkapi GPU NVIDIA V100.
- Akselerator GPU: V100 (paket SXM2).
  - Arsitektur NVIDIA Volta inovatif.
  - 16 GB memori GPU HBM2 per GPU dengan bandwidth memori 900 GB/s.
  - 5.120 CUDA Cores per GPU.
  - 640 Tensor Cores per GPU.
  - Hingga enam koneksi NVLink dua arah per GPU. Setiap koneksi menyediakan bandwidth 25 Gbit/s di setiap arah, untuk bandwidth total 300 Gbit/s.
- Memiliki rasio vCPU-ke-memori sekitar 1:4.
- Processor: Intel^® Xeon^® Platinum 8163 (Skylake) 2,5 GHz.
Storage:
- Semua instans dalam keluarga ini adalah I/O optimized.
- Jenis disk yang didukung: ESSD, ESSD AutoPL, SSD Cloud Disk, dan Ultra Disk. Untuk informasi selengkapnya, lihat Block storage overview.
Network:
- Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat IPv6 communication.
- Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn6v mencakup tipe instans dan spesifikasi yang tercantum di bawah ini.

Instance type	vCPU	Memory (GiB)	GPU	GPU memory	Network bandwidth (Gbit/s)	Packet rate (pps)	Disk baseline IOPS	Multi-queue	ENI	Private IPv4 addresses	IPv6 addresses
ecs.gn6v-c8g1.2xlarge	8	32	1 × NVIDIA V100	1 × 16 GB	2,5	800.000	N/A	4	4	10	1
ecs.gn6v-c8g1.4xlarge	16	64	2 × NVIDIA V100	2 × 16 GB	5	1.000.000	N/A	4	8	20	1
ecs.gn6v-c8g1.8xlarge	32	128	4 × NVIDIA V100	4 × 16 GB	10	2.000.000	N/A	8	8	20	1
ecs.gn6v-c8g1.16xlarge	64	256	8 × NVIDIA V100	8 × 16 GB	20	2.500.000	N/A	16	8	20	1
ecs.gn6v-c10g1.20xlarge	82	336	8 × NVIDIA V100	8 × 16 GB	35	4.500.000	250.000	16	8	20	1