All Products
Search
Document Center

Elastic Compute Service:Keluarga instans Layanan GPU Elastis (seri gn, vgn, dan sgn)

Last Updated:Dec 26, 2025

Layanan GPU Elastis menyediakan kemampuan komputasi yang dipercepat GPU secara on-demand dengan Auto Scaling. Sebagai bagian dari keluarga komputasi elastis Alibaba Cloud, layanan ini menggabungkan daya komputasi GPU dan CPU untuk memenuhi kebutuhan Anda dalam skenario seperti artificial intelligence (AI), high-performance computing (HPC), serta pemrosesan grafis dan gambar profesional.

Catatan

vGPU-dipercepat

Komputasi dioptimalkan dengan akselerasi GPU

Tidak direkomendasikan (Jika keluarga instans berikut habis terjual, gunakan keluarga instans pada kolom sebelumnya sebagai gantinya)

sgn8ia, keluarga instans vGPU-dipercepat

  • Pengantar:

    • Ditenagai oleh arsitektur SHENLONG generasi ketiga untuk memberikan performa tinggi yang stabil dan dapat diprediksi. Akselerasi berbasis chip secara signifikan meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, sehingga memungkinkan Anda menyimpan data dan memuat model lebih cepat.

    • Mencakup lisensi perangkat lunak NVIDIA GRID Virtual Workstation (vWS). Ini menyediakan akselerasi grafis bersertifikasi untuk berbagai aplikasi desain berbantuan komputer (CAD) profesional guna memenuhi kebutuhan desain grafis profesional. Instans ini juga dapat digunakan sebagai instans komputasi dioptimalkan dengan akselerasi GPU ringan untuk mengurangi biaya inferensi AI skala kecil.

  • Skenario:

    • CPU berkecepatan clock tinggi, memori, dan GPU memungkinkannya memproses banyak tugas inferensi AI konkuren, menjadikannya ideal untuk aplikasi seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.

    • Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berkinerja tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans ini mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.

    • Dengan kecepatan clock hingga 3,75 GHz, prosesor AMD Genoa memberikan performa unggul untuk pemodelan 3D di bidang seperti produksi film dan animasi, cloud gaming, dan desain mekanik.

  • Komputasi:

    • Menggunakan GPU NVIDIA Lovelace, yang memiliki fitur-fitur berikut:

      • Memori GPU besar dan berbagai solusi slicing GPU.

      • Dukungan fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk memberikan dukungan bisnis yang terdiversifikasi.

    • Prosesor: Prosesor AMD Genoa berfrekuensi tinggi yang memberikan kecepatan clock 3,4 GHz hingga 3,75 GHz untuk menyediakan daya komputasi tinggi bagi pemodelan 3D.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

sgn8ia mencakup tipe instans dan data metrik berikut:

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Multi-Queue

ENI

Alamat IPv4/IPv6 privat per ENI

Jumlah maksimum disk

Baseline Disk IOPS

BPS baseline disk (MB/s)

ecs.sgn8ia-m2.xlarge

4

16

2 GB

2,5

1.000.000

4

4

15/15

9

30.000

244

ecs.sgn8ia-m4.2xlarge

8

32

4 GB

4

1.600.000

8

4

15/15

9

45.000

305

ecs.sgn8ia-m8.4xlarge

16

64

8 GB

7

2.000.000

16

8

30/30

17

60.000

427

ecs.sgn8ia-m16.8xlarge

32

128

16 GB

10

3.000.000

32

8

30/30

33

80.000

610

ecs.sgn8ia-m24.12xlarge

48

192

24 GB

16

4.500.000

48

8

30/30

33

120.000

1000

ecs.sgn8ia-m48.24xlarge

96

384

48 GB

32

9.000.000

64

15

30/30

33

240.000

2000

Catatan
  • GPU dalam tabel di atas adalah shard vGPU yang dibuat menggunakan teknologi vGPU.

  • Memori dan memori GPU instans sgn8ia bersifat eksklusif untuk instans tersebut. CPU instans merupakan resource yang dibagikan dengan rasio overcommit sekitar 1:1,5. Jika Anda memiliki persyaratan khusus terhadap daya komputasi CPU, Anda dapat membeli instans khusus dengan GPU passthrough, seperti instans komputasi dioptimalkan dengan akselerasi GPU gn7i.

sgn7i-vws, keluarga instans vGPU-dipercepat dengan CPU bersama

  • Ikhtisar keluarga:

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga instans ini menggunakan akselerasi fast path pada chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran. Hal ini memungkinkan penyimpanan data dan pemuatan model dilakukan lebih cepat.

    • Instans dari keluarga instans ini berbagi resource CPU dan jaringan untuk memaksimalkan pemanfaatan resource dasar. Setiap instans memiliki akses eksklusif ke memori dan memori GPU-nya untuk memberikan isolasi data dan jaminan performa.

      Catatan

      Jika Anda ingin menggunakan resource CPU eksklusif, Anda dapat memilih keluarga instans vgn7i-vws.

    • Keluarga instans ini dilengkapi lisensi NVIDIA GRID vWS dan menyediakan kemampuan akselerasi grafis bersertifikasi untuk perangkat lunak CAD guna memenuhi persyaratan desain grafis profesional. Instans dari keluarga instans ini dapat berfungsi sebagai instans komputasi dioptimalkan dengan akselerasi GPU ringan untuk mengurangi biaya tugas inferensi AI skala kecil.

  • Skenario:

    • Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.

    • Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.

    • Pemodelan 3D di bidang yang memerlukan penggunaan prosesor Ice Lake, seperti produksi animasi dan film, cloud gaming, dan desain mekanik.

  • Komputasi:

    • Dilengkapi GPU NVIDIA A10.

      • Arsitektur Ampere inovatif.

      • Dukungan fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk memberikan dukungan bisnis yang terdiversifikasi.

    • Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

sgn7i-vws mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline/burst jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Multi-Queue

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.sgn7i-vws-m2.xlarge

4

15,5

NVIDIA A10 × 1/12

24 GB × 1/12

1,5/5

500.000

4

2

2

1

ecs.sgn7i-vws-m4.2xlarge

8

31

NVIDIA A10 × 1/6

24 GB × 1/6

2,6/10

1.000.000

4

4

6

1

ecs.sgn7i-vws-m8.4xlarge

16

62

NVIDIA A10 × 1/3

24 GB × 1/3

5/20

2.000.000

8

4

10

1

ecs.sgn7i-vws-m2s.xlarge

4

8

NVIDIA A10 × 1/12

24 GB × 1/12

1,5/5

500.000

4

2

2

1

ecs.sgn7i-vws-m4s.2xlarge

8

16

NVIDIA A10 × 1/6

24 GB × 1/6

2,6/10

1.000.000

4

4

6

1

ecs.sgn7i-vws-m8s.4xlarge

16

32

NVIDIA A10 × 1/3

24 GB × 1/3

5/20

2.000.000

8

4

10

1

Catatan

Kolom GPU dalam tabel di atas mencakup model kartu GPU dan informasi slicing GPU. Setiap GPU dapat diiris menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke suatu instans. Misalnya:

Dalam NVIDIA A10 * 1/12, NVIDIA A10 menunjukkan model kartu GPU dan 1/12 menunjukkan bahwa satu kartu GPU diiris menjadi 12 shard, dan setiap instans menggunakan satu shard.

vgn7i-vws, keluarga instans vGPU-dipercepat

  • Ikhtisar keluarga:

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga instans ini menggunakan akselerasi fast path pada chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran. Hal ini memungkinkan penyimpanan data dan pemuatan model dilakukan lebih cepat.

    • Keluarga instans ini dilengkapi lisensi NVIDIA GRID vWS dan menyediakan kemampuan akselerasi grafis bersertifikasi untuk perangkat lunak CAD guna memenuhi persyaratan desain grafis profesional. Instans dari keluarga instans ini dapat berfungsi sebagai instans komputasi dioptimalkan dengan akselerasi GPU ringan untuk mengurangi biaya tugas inferensi AI skala kecil.

  • Skenario:

    • Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.

    • Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.

    • Prosesor Ice Lake memberikan performa yang ditingkatkan untuk pemodelan 3D di bidang seperti produksi film dan animasi, cloud gaming, dan desain mekanik.

  • Komputasi:

    • Dilengkapi GPU NVIDIA A10.

      • Arsitektur Ampere inovatif.

      • Dukungan fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk memberikan dukungan bisnis yang terdiversifikasi.

    • Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

vgn7i-vws mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Queues

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.vgn7i-vws-m4.xlarge

4

30

NVIDIA A10 × 1/6

24 GB × 1/6

3

1.000.000

4

4

10

1

ecs.vgn7i-vws-m8.2xlarge

10

62

NVIDIA A10 × 1/3

24 GB × 1/3

5

2.000.000

8

6

10

1

ecs.vgn7i-vws-m12.3xlarge

14

93

NVIDIA A10 × 1/2

24 GB × 1/2

8

3.000.000

8

6

15

1

ecs.vgn7i-vws-m24.7xlarge

30

186

NVIDIA A10 × 1

24 GB × 1

16

6.000.000

12

8

30

1

Catatan

Dalam tabel di atas, kolom GPU menentukan model kartu GPU dan informasi slicing GPU. Setiap GPU dapat diiris menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke suatu instans. Misalnya:

Dalam NVIDIA A10 * 1/6, NVIDIA A10 menunjukkan model kartu GPU dan 1/6 menunjukkan bahwa satu kartu GPU diiris menjadi enam shard, dan setiap instans menggunakan satu shard.

vgn6i-vws, keluarga instans vGPU-dipercepat

Penting
  • Alibaba Cloud telah meningkatkan keluarga instans vgn6i menjadi vgn6i-vws untuk mendukung peningkatan driver GRID. Keluarga baru ini menggunakan driver GRID terbaru dan mencakup lisensi GRID vWS gratis. Untuk meminta image gratis dengan driver GRID yang telah dipra-instal, Anda dapat membuat tiket.

  • Untuk menggunakan image publik atau kustom lain yang tidak mengandung driver GRID, Anda dapat membuat tiket untuk meminta file driver GRID guna instalasi terpisah. Alibaba Cloud tidak membebankan biaya lisensi untuk driver GRID.

  • Skenario:

    • Rendering real-time untuk cloud gaming.

    • Rendering real-time untuk aplikasi Augmented Reality (AR) dan Virtual Reality (VR).

    • Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk penerapan elastis layanan internet yang mengandung aplikasi inferensi AI.

    • Lingkungan pendidikan untuk pembelajaran mendalam.

    • Lingkungan eksperimen pemodelan untuk pembelajaran mendalam.

  • Komputasi:

    • Menggunakan akselerator GPU NVIDIA T4.

    • Menggunakan vGPU yang diiris dan divirtualisasi.

      • Mendukung 1/4 dan 1/2 daya komputasi GPU NVIDIA Tesla T4.

      • Mendukung memori GPU 4 GB dan 8 GB.

    • Menawarkan rasio CPU-memori sekitar 1:5.

    • Prosesor: Prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

vgn6i-vws mencakup tipe instans dan data metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Queues

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.vgn6i-m4-vws.xlarge

4

23

NVIDIA T4 × 1/4

16 GB × 1/4

2

500.000

4/2

3

10

1

ecs.vgn6i-m8-vws.2xlarge

10

46

NVIDIA T4 × 1/2

16 GB × 1/2

4

800.000

8/2

4

10

1

ecs.vgn6i-m16-vws.5xlarge

20

92

NVIDIA T4 × 1

16 GB × 1

7,5

1.200.000

6

4

10

1

Catatan

Dalam tabel di atas, kolom GPU berisi model kartu GPU dan informasi slicing GPU. Slicing GPU berarti GPU diiris menjadi beberapa partisi, dan setiap partisi dialokasikan ke suatu instans. Misalnya:

Dalam NVIDIA T4 * 1/4, NVIDIA T4 menunjukkan model kartu GPU dan 1/4 menunjukkan bahwa satu kartu GPU diiris menjadi empat shard, dan setiap instans menggunakan satu shard.

gn8v/gn8v-tee, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

Instans ini saat ini hanya tersedia di wilayah tertentu, termasuk di luar Tiongkok. Untuk meminta layanan ini, silakan hubungi perwakilan penjualan Alibaba Cloud.

  • Pengantar:

    • gn8v: Keluarga instans ini adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan yang disediakan oleh Alibaba Cloud untuk pelatihan model AI dan tugas inferensi model bahasa besar (LLM) ultra-besar. Keluarga instans ini terdiri dari berbagai tipe instans yang menyediakan satu, dua, empat, atau delapan GPU per instans.

    • gn8v-tee: Untuk memenuhi persyaratan keamanan dalam pelatihan dan inferensi model bahasa besar, Alibaba Cloud menyediakan keluarga instans generasi kedelapan berbasis gn8v yang mencakup fitur komputasi rahasia. Tipe instans ini mengenkripsi data selama komputasi GPU untuk memastikan keamanan data pengguna.

  • Skenario:

    • Komputasi inferensi paralel multi-GPU hemat biaya untuk LLM dengan lebih dari 70 miliar parameter.

    • Satu GPU menyediakan daya komputasi FP32 sebesar 39,5 TFLOPS dan memberikan performa luar biasa untuk beban kerja pelatihan dalam AI tradisional dan kendaraan otonom.

    • Skenario pelatihan model skala kecil dan menengah yang memanfaatkan koneksi NVLink di antara delapan GPU.

  • Fitur dan posisi:

    • Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU dilengkapi memori HBM3 96 GB dan memberikan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.

    • Bandwidth antar-GPU tinggi: Beberapa GPU saling terhubung menggunakan koneksi NVLink 900 GB/s. Efisiensi pelatihan dan inferensi multi-GPU jauh lebih tinggi dibandingkan instans berakselerasi GPU generasi sebelumnya.

    • Kuantisasi model bahasa besar: Keluarga instans ini mendukung daya komputasi dalam format titik mengambang 8-bit (FP8) dan mengoptimalkan daya komputasi untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi pelatihan dan inferensi serta mengurangi penggunaan memori GPU.

    • (Hanya untuk gn8v-tee) Keamanan tinggi: Keluarga instans gn8v-tee mendukung fitur komputasi rahasia berbasis CPU (Intel TDX) dan komputasi rahasia berbasis GPU (NVIDIA CC), yang menyediakan kemampuan komputasi rahasia end-to-end untuk inferensi model. Kemampuan komputasi rahasia ini memastikan keamanan data inferensi pengguna dan model perusahaan dalam inferensi dan pelatihan model.

  • Komputasi:

    • Menggunakan prosesor Cloud Infrastructure Processing Unit (CIPU) 1.0 terbaru.

      • Memisahkan kemampuan komputasi dari kemampuan penyimpanan, sehingga memungkinkan Anda memilih resource penyimpanan secara fleksibel sesuai kebutuhan.

      • Menyediakan kemampuan bare metal untuk mendukung komunikasi peer-to-peer (P2P) antar instans berakselerasi GPU, yang merupakan peningkatan dibandingkan instans virtualisasi tradisional.

    • Prosesor: Prosesor Intel Xeon Scalable generasi keempat yang memberikan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua-core hingga 3,1 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Mendukung fitur Jumbo Frames. Untuk informasi selengkapnya, lihat Jumbo Frames.

    • Menyediakan performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30.000.000 PPS (untuk instans yang dilengkapi delapan GPU).

    • Elastic RDMA Interface (ERI) didukung.

    • Catatan

      Untuk informasi selengkapnya tentang cara menggunakan ERIs, lihat Enable eRDMA on an enterprise-level instance.

  • Keamanan: Mendukung fitur Trusted Platform Module (vTPM). Fitur ini didukung oleh gn8v tetapi tidak oleh gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.

gn8v mencakup tipe instans dan metrik yang tercantum dalam tabel berikut:

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

ENIs

Queues (primary)

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Jumlah maksimum disk

IOPS baseline disk

Bandwidth baseline disk (GB/s)

ecs.gn8v.4xlarge

16

96

96 GB × 1

12

8

16

30

30

17

100.000

0,75

ecs.gn8v.6xlarge

24

128

96 GB × 1

15

8

24

30

30

17

120.000

0,937

ecs.gn8v-2x.8xlarge

32

192

96 GB × 2

20

8

32

30

30

25

200.000

1,25

ecs.gn8v-4x.8xlarge

32

384

96 GB × 4

20

8

32

30

30

25

200.000

1,25

ecs.gn8v-2x.12xlarge

48

256

96 GB × 2

25

8

48

30

30

33

300.000

1,50

ecs.gn8v-8x.16xlarge

64

768

96 GB × 8

32

8

64

30

30

33

360.000

2,5

ecs.gn8v-4x.24xlarge

96

512

96 GB × 4

50

15

64

30

30

49

500.000

3

ecs.gn8v-8x.48xlarge

192

1024

96 GB × 8

100

15

64

50

50

65

1.000.000

6

gn8v-tee mencakup tipe instans dan data metrik berikut:

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

ENIs

Queues (primary)

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Jumlah maksimum disk

Baseline Disk IOPS

Bandwidth baseline disk (GB/s)

ecs.gn8v-tee.4xlarge

16

96

96 GB × 1

12

8

16

30

30

17

100.000

0,75

ecs.gn8v-tee.6xlarge

24

128

96 GB × 1

15

8

24

30

30

17

120.000

0,937

ecs.gn8v-tee-8x.16xlarge

64

768

96 GB × 8

32

8

64

30

30

33

360.000

2,5

ecs.gn8v-tee-8x.48xlarge

192

1024

96 GB × 8

100

15

64

50

50

65

1.000.000

6

Catatan

Keluarga instans gn8v-tee hanya mendukung image Alibaba Cloud Linux 3. Jika Anda menggunakan image kustom yang dibuat berdasarkan Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernel-nya adalah 5.10.134-18 atau yang lebih baru.

gn8is, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk di luar Tiongkok. Untuk menggunakan keluarga instans ini, Anda dapat menghubungi staf penjualan Alibaba Cloud.

  • Pengantar: gn8is adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, yang dikembangkan sebagai respons terhadap pertumbuhan layanan konten yang dihasilkan AI (AIGC). Instans ini menggunakan GPU NVIDIA L20 terbaru dan menyediakan tipe instans dengan 1-GPU, 2-GPU, 4-GPU, dan 8-GPU, serta tipe instans dengan rasio CPU-GPU yang berbeda, untuk memenuhi berbagai kebutuhan aplikasi.

  • Fitur dan posisi:

    • Pemrosesan grafis: Keluarga instans ini menggunakan prosesor Intel Xeon Scalable frekuensi tinggi generasi keempat untuk menyediakan daya komputasi CPU yang cukup bagi skenario pemodelan 3D, sehingga membuat rendering dan desain grafis lebih lancar.

    • Tugas inferensi: Menggunakan GPU NVIDIA L20 baru dan menyediakan memori GPU 48 GB per GPU untuk mempercepat tugas inferensi. Instans ini mendukung format bilangan titik mengambang FP8 dan dapat digunakan dengan kontainer ACK untuk secara fleksibel mendukung inferensi berbagai model AIGC. Instans ini sangat cocok untuk tugas inferensi pada model LLM dengan kurang dari 70 miliar parameter.

  • Skenario:

    • Animasi, efek khusus untuk film dan televisi, serta rendering. Instans ini menyediakan kemampuan pemrosesan grafis setingkat workstation menggunakan driver GRID dari image Alibaba Cloud Marketplace untuk mengaktifkan kemampuan grafis OpenGL dan Direct3D.

    • Dukungan yang lebih efisien dan hemat biaya untuk pembuatan gambar AIGC dan inferensi LLM menggunakan manajemen kontainerisasi ACK.

    • Skenario pengenalan AI umum lainnya, seperti pengenalan gambar dan pengenalan suara.

  • Komputasi:

    • Menggunakan GPU enterprise-grade NVIDIA L20 terbaru.

      • Dukungan fitur akselerasi seperti TensorRT dan format bilangan titik mengambang FP8 untuk meningkatkan performa inferensi model.

      • Hingga 48 GB memori per GPU dan mendukung inferensi model 70B atau lebih besar pada satu instans dengan beberapa GPU.

      • Kemampuan pemrosesan grafis yang ditingkatkan. Misalnya, setelah Anda menginstal driver GRID pada instans gn8is menggunakan Asisten Cloud atau image Alibaba Cloud Marketplace, instans tersebut dapat memberikan performa pemrosesan grafis dua kali lipat dari platform generasi ketujuh.

    • Parameter utama NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Kemampuan enkode/dekode video

      Koneksi antar-kartu

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: N/A

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 × Video Encoder (+AV1)

      • 3 × Video Decoder

      • 4 × JPEG Decoder

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Prosesor: Prosesor Intel® Xeon® frekuensi tinggi terbaru yang memberikan frekuensi turbo semua-core sebesar 3,9 GHz untuk memenuhi persyaratan pemodelan 3D yang kompleks.

  • Penyimpanan:

  • Jaringan:

  • Keamanan: mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar.

gn8is mencakup tipe instans dan metrik yang tercantum dalam tabel berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

ENIs

Queues (primary)

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Jumlah maksimum disk

Baseline Disk IOPS

Bandwidth garis dasar disk (GB/s)

ecs.gn8is.2xlarge

8

64

L20 × 1

48 GB × 1

8

4

8

15

15

17

60.000

0,75

ecs.gn8is.4xlarge

16

128

L20 × 1

48 GB × 1

16

8

16

30

30

17

120.000

1,25

ecs.gn8is-2x.8xlarge

32

256

L20 × 2

48 GB × 2

32

8

32

30

30

33

250.000

2

ecs.gn8is-4x.16xlarge

64

512

L20 × 4

48 GB × 4

64

8

64

30

30

33

450.000

4

ecs.gn8is-8x.32xlarge

128

1024

L20 × 8

48 GB × 8

100

15

64

50

50

65

900.000

8

gn7e, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

Daftar berikut menjelaskan fitur-fitur gn7e:

  • Ikhtisar keluarga

    • Anda dapat memilih tipe instans yang menyediakan jumlah GPU dan CPU yang berbeda untuk memenuhi kebutuhan bisnis Anda dalam kasus penggunaan AI.

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata virtual private cloud (VPC), jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.

  • Skenario:

    • Pelatihan AI skala kecil dan menengah.

    • Beban kerja HPC yang dipercepat menggunakan Compute Unified Device Architecture (CUDA).

    • Tugas inferensi AI yang memerlukan kemampuan pemrosesan GPU tinggi atau jumlah memori GPU yang besar.

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, kendaraan otonom, dan pengenalan suara.

    • Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU yang kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan.

    Penting

    Saat menggunakan layanan pelatihan AI yang memiliki beban komunikasi tinggi, seperti model transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, data dapat rusak akibat kegagalan tak terduga yang disebabkan oleh transmisi data skala besar melalui tautan Peripheral Component Interconnect Express (PCIe). Jika Anda tidak memahami topologi tautan komunikasi yang digunakan untuk layanan pelatihan AI, Anda dapat membuat tiket untuk mendapatkan dukungan teknis.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

gn7e mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Multi-Queue

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn7e-c16g1.4xlarge

16

125

80 GB × 1

8

3.000.000

8

8

10

1

ecs.gn7e-c16g1.8xlarge

32

250

80 GB × 2

16

6.000.000

16

8

10

1

ecs.gn7e-c16g1.16xlarge

64

500

80 GB × 4

32

12.000.000

32

8

10

1

ecs.gn7e-c16g1.32xlarge

128

1000

80 GB × 8

64

24.000.000

32

16

15

1

gn7i, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Pengantar: Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga instans ini menggunakan akselerasi fast path pada chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran.

  • Skenario:

    • Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.

    • Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming. Instans mendukung RTX dan dilengkapi CPU berfrekuensi tinggi.

  • Komputasi:

    • Dilengkapi GPU NVIDIA A10.

      • Arsitektur Ampere inovatif.

      • Dukungan fitur akselerasi seperti RTX dan TensorRT.

    • Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.

    • Menyediakan memori hingga 752 GiB, yang jauh lebih besar dibandingkan ukuran memori keluarga instans gn6i.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

gn7i mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Multi-queue

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn7i-c8g1.2xlarge

8

30

NVIDIA A10 × 1

24 GB × 1

16

1.600.000

8

4

15

15

ecs.gn7i-c16g1.4xlarge

16

60

NVIDIA A10 × 1

24 GB × 1

16

3.000.000

8

8

30

30

ecs.gn7i-c32g1.8xlarge

32

188

NVIDIA A10 × 1

24 GB × 1

16

6.000.000

12

8

30

30

ecs.gn7i-c32g1.16xlarge

64

376

NVIDIA A10 × 2

24 GB × 2

32

12.000.000

16

15

30

30

ecs.gn7i-c32g1.32xlarge

128

752

NVIDIA A10 × 4

24 GB × 4

64

24.000.000

32

15

30

30

ecs.gn7i-c48g1.12xlarge

48

310

NVIDIA A10 × 1

24 GB × 1

16

9.000.000

16

8

30

30

ecs.gn7i-c56g1.14xlarge

56

346

NVIDIA A10 × 1

24 GB × 1

16

10.000.000

16

8

30

30

ecs.gn7i-2x.8xlarge

32

128

NVIDIA A10 × 2

24 GB × 2

16

6.000.000

16

8

30

30

ecs.gn7i-4x.8xlarge

32

128

NVIDIA A10 × 4

24 GB × 4

32

6.000.000

16

8

30

30

ecs.gn7i-4x.16xlarge

64

256

NVIDIA A10 × 4

24 GB × 4

64

12.000.000

32

8

30

30

ecs.gn7i-8x.32xlarge

128

512

NVIDIA A10 × 8

24 GB × 8

64

24.000.000

32

16

30

30

ecs.gn7i-8x.16xlarge

64

256

NVIDIA A10 × 8

24 GB × 8

32

12.000.000

32

8

30

30

Penting

Anda dapat mengubah tipe instans ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge menjadi ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge, tetapi tidak ke tipe instans lain seperti ecs.gn7i-c32g1.8xlarge.

gn7s, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

Untuk menggunakan keluarga instans gn7s, Anda dapat membuat tiket untuk mengajukan permohonan.

  • Pengantar keluarga spesifikasi:

    • Keluarga instans ini menggunakan prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Anda dapat memilih tipe instans yang terdiri dari kombinasi GPU dan vCPU yang sesuai untuk memenuhi kebutuhan bisnis Anda dalam skenario AI.

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata VPC, jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.

  • Skenario: Tugas inferensi AI konkuren yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.

  • Komputasi:

    • Dilengkapi GPU NVIDIA A30.

      • Arsitektur NVIDIA Ampere inovatif.

      • Dukungan fitur multi-instance GPU (MIG) dan fitur akselerasi (berbasis Tensor core generasi kedua) untuk memberikan dukungan bisnis yang terdiversifikasi.

    • Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua-core sebesar 3,5 GHz.

    • Menyediakan ukuran memori yang jauh lebih besar dibandingkan keluarga instans generasi sebelumnya.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

gn7s mencakup tipe instans dan data metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Multi-queue

ENI

ecs.gn7s-c8g1.2xlarge

8

60

NVIDIA A30 × 1

24 GB × 1

16

1.600.000

5

1

8

4

ecs.gn7s-c16g1.4xlarge

16

120

NVIDIA A30 × 1

24 GB × 1

16

3.000.000

5

1

8

8

ecs.gn7s-c32g1.8xlarge

32

250

NVIDIA A30 × 1

24 GB × 1

16

6.000.000

5

1

12

8

ecs.gn7s-c32g1.16xlarge

64

500

NVIDIA A30 × 2

24 GB × 2

32

12.000.000

5

1

16

15

ecs.gn7s-c32g1.32xlarge

128

1000

NVIDIA A30 × 4

24 GB × 4

64

24.000.000

10

1

32

15

ecs.gn7s-c48g1.12xlarge

48

380

NVIDIA A30 × 1

24 GB × 1

16

9.000.000

8

1

16

8

ecs.gn7s-c56g1.14xlarge

56

440

NVIDIA A30 × 1

24 GB × 1

16

10.000.000

8

1

16

8

gn7, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Skenario:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, kendaraan otonom, dan pengenalan suara.

    • Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU yang kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan.

gn7 mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Multi-queue

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn7-c12g1.3xlarge

12

94

40 GB × 1

4

2.500.000

4

8

10

1

ecs.gn7-c13g1.13xlarge

52

378

40 GB × 4

16

9.000.000

16

8

30

30

ecs.gn7-c13g1.26xlarge

104

756

40 GB × 8

30

18.000.000

16

15

10

1

gn6i, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Skenario:

    • Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk visi komputer, pengenalan suara, sintesis suara, NLP, penerjemahan mesin, dan sistem rekomendasi.

    • Rendering real-time untuk cloud gaming.

    • Rendering real-time untuk aplikasi AR dan VR.

    • Komputasi grafis beban berat atau workstation grafis.

    • Database yang dipercepat GPU.

    • Komputasi kinerja tinggi.

  • Komputasi:

    • Akselerator GPU: T4.

      • Arsitektur mikro Turing inovatif.

      • 16 GB memori GPU per GPU (bandwidth memori GPU 320 GB/s).

      • 2.560 CUDA Core per GPU.

      • Hingga 320 Tensor Core Turing per GPU.

      • Tensor Core presisi variabel mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4.

    • Rasio prosesor-memori sekitar 1:4.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

gn6i mencakup tipe instans dan data metrik yang dijelaskan dalam tabel berikut:

Instance Type

vCPUs

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Disk garis dasar IOPS

Multi-Queue

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn6i-c4g1.xlarge

4

15

NVIDIA T4 × 1

16 GB × 1

4

2.500.000

N/A

2

2

10

1

ecs.gn6i-c8g1.2xlarge

8

31

NVIDIA T4 × 1

16 GB × 1

5

2.500.000

N/A

2

2

10

1

ecs.gn6i-c16g1.4xlarge

16

62

NVIDIA T4 × 1

16 GB × 1

6

2.500.000

N/A

4

3

10

1

ecs.gn6i-c24g1.6xlarge

24

93

NVIDIA T4 × 1

16 GB × 1

7,5

2.500.000

N/A

6

4

10

1

ecs.gn6i-c40g1.10xlarge

40

155

NVIDIA T4 × 1

16 GB × 1

10

1.600.000

N/A

16

10

10

1

ecs.gn6i-c24g1.12xlarge

48

186

NVIDIA T4 × 2

16 GB × 2

15

4.500.000

N/A

12

6

10

1

ecs.gn6i-c24g1.24xlarge

96

372

NVIDIA T4 × 4

16 GB × 4

30

4.500.000

250.000

24

8

10

1

gn6e, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Skenario:

    • Pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan suara.

    • Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

  • Komputasi:

    • Menggunakan GPU NVIDIA V100 (32 GB NVLink).

    • Akselerator GPU: V100 (paket SXM2).

      • Arsitektur Volta inovatif.

      • 32 GB memori HBM2 per GPU (bandwidth memori GPU 900 GB/s).

      • 5.120 CUDA Cores per GPU.

      • 640 Tensor Core per GPU.

      • Setiap GPU mendukung enam tautan NVLink. NVLink adalah tautan dua arah. Bandwidth tautan satu arah adalah 25 Gbit/s, dan bandwidth total adalah 300 Gbit/s (6 × 25 × 2).

    • Rasio prosesor-memori sekitar 1:8.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

gn6e mencakup tipe instans dan spesifikasi yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Queues

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn6e-c12g1.3xlarge

12

92

NVIDIA V100 × 1

32 GB × 1

5

800.000

8

6

10

1

ecs.gn6e-c12g1.6xlarge

24

184

NVIDIA V100 × 2

32 GB × 2

8

1.200.000

8

8

20

1

ecs.gn6e-c12g1.12xlarge

48

368

NVIDIA V100 × 4

32 GB × 4

16

2.400.000

8

8

20

1

ecs.gn6e-c12g1.24xlarge

96

736

NVIDIA V100 × 8

32 GB × 8

32

4.500.000

16

8

20

1

gn6v, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Skenario:

    • Pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan suara.

    • Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

  • Komputasi:

    • Menggunakan GPU NVIDIA V100.

    • Akselerator GPU: V100 (paket SXM2).

      • Arsitektur Volta inovatif.

      • 16 GB memori HBM2 per GPU (bandwidth memori GPU 900 GB/s).

      • 5.120 CUDA Core per GPU.

      • 640 Tensor Core per GPU.

      • Setiap GPU mendukung enam tautan NVLink. NVLink adalah tautan dua arah. Bandwidth tautan satu arah adalah 25 Gbit/s, dan bandwidth total adalah 300 Gbit/s (6 × 25 × 2).

    • Rasio prosesor-memori sekitar 1:4.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

Keluarga instans gn6v mencakup tipe instans dan metrik yang tercantum dalam tabel berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

IOPS garis dasar disk

Queues

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn6v-c8g1.2xlarge

8

32

NVIDIA V100 × 1

16 GB × 1

2,5

800.000

N/A

4

4

10

1

ecs.gn6v-c8g1.4xlarge

16

64

NVIDIA V100 × 2

16 GB × 2

5

1.000.000

N/A

4

8

20

1

ecs.gn6v-c8g1.8xlarge

32

128

NVIDIA V100 × 4

16 GB × 4

10

2.000.000

N/A

8

8

20

1

ecs.gn6v-c8g1.16xlarge

64

256

NVIDIA V100 × 8

16 GB × 8

20

2.500.000

N/A

16

8

20

1

ecs.gn6v-c10g1.20xlarge

82

336

NVIDIA V100 × 8

16 GB × 8

35

4.500.000

250.000

16

8

20

1

gn5, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Skenario:

    • Pembelajaran mendalam.

    • Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, penelitian genomik, dan analisis lingkungan.

    • Beban kerja komputasi GPU sisi server, seperti komputasi kinerja tinggi, rendering, dan enkode/dekode multimedia.

  • Komputasi:

    • Menggunakan GPU NVIDIA P100.

    • Beberapa rasio prosesor-memori.

    • Prosesor: Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.

  • Penyimpanan:

    • Dilengkapi disk lokal SSD NVMe berperforma tinggi.

    • Instans I/O teroptimasi.

    • Kategori disk yang didukung: SSD standar dan disk ultra.

  • Jaringan:

    • Hanya mendukung IPv4.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

gn5 mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Penyimpanan lokal (GiB)

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Queues

ENI

Alamat IPv4 privat per ENI

ecs.gn5-c4g1.xlarge

4

30

NVIDIA P100 × 1

16 GB × 1

440

3

300.000

1

3

10

ecs.gn5-c8g1.2xlarge

8

60

NVIDIA P100 × 1

16 GB × 1

440

3

400.000

1

4

10

ecs.gn5-c4g1.2xlarge

8

60

NVIDIA P100 × 2

16 GB × 2

880

5

1.000.000

4

4

10

ecs.gn5-c8g1.4xlarge

16

120

NVIDIA P100 × 2

16 GB × 2

880

5

1.000.000

4

8

20

ecs.gn5-c28g1.7xlarge

28

112

NVIDIA P100 × 1

16 GB × 1

440

5

2.250.000

7

8

10

ecs.gn5-c8g1.8xlarge

32

240

NVIDIA P100 × 4

16 GB × 4

1760

10

2.000.000

8

8

20

ecs.gn5-c28g1.14xlarge

56

224

NVIDIA P100 × 2

16 GB × 2

880

10

4.500.000

14

8

20

ecs.gn5-c8g1.14xlarge

54

480

NVIDIA P100 × 8

16 GB × 8

3520

25

4.000.000

14

8

10

gn5i, keluarga instans komputasi dioptimalkan dengan akselerasi GPU

  • Skenario: Beban kerja komputasi GPU sisi server seperti inferensi pembelajaran mendalam dan enkode/dekode multimedia.

  • Komputasi:

    • Menggunakan GPU NVIDIA P4.

    • Rasio prosesor-memori 1:4.

    • Prosesor: Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.

  • Penyimpanan:

    • Instans I/O teroptimasi.

    • Kategori disk yang didukung: SSD standar dan disk ultra.

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan suatu instans sebanding dengan tipe instansnya.

Keluarga instans gn5i mencakup tipe instans dan metrik berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth baseline jaringan (Gbit/s)

Laju pengalihan paket (PPS)

Queues

ENI

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

ecs.gn5i-c2g1.large

2

8

NVIDIA P4 × 1

8 GB × 1

1

100.000

2

2

6

1

ecs.gn5i-c4g1.xlarge

4

16

NVIDIA P4 × 1

8 GB × 1

1,5

200.000

2

3

10

1

ecs.gn5i-c8g1.2xlarge

8

32

NVIDIA P4 × 1

8 GB × 1

2

400.000

4

4

10

1

ecs.gn5i-c16g1.4xlarge

16

64

NVIDIA P4 × 1

8 GB × 1

3

800.000

4

8

20

1

ecs.gn5i-c16g1.8xlarge

32

128

NVIDIA P4 × 2

8 GB × 2

6

1.200.000

8

8

20

1

ecs.gn5i-c28g1.14xlarge

56

224

NVIDIA P4 × 2

8 GB × 2

10

2.000.000

14

8

20

1