全部产品
Search
文档中心

Elastic GPU Service:Keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU (seri gn, ebm, dan scc)

更新时间:Mar 06, 2026

Instans yang dioptimalkan untuk komputasi dengan akselerasi GPU menawarkan komputasi paralel berkinerja-tinggi. Instans ini ideal untuk skenario komputasi paralel berskala besar dan dapat meningkatkan kinerja serta efisiensi bisnis Anda. Topik ini menjelaskan fitur dan spesifikasi keluarga instans ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU.

Jenis

Tautan terkait

Keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU (seri gn)

Instans Mesin Fisik ECS

Tidak direkomendasikan (Jika tipe instans ini kehabisan stok, gunakan tipe instans di atas.)

gn8v dan gn8v-tee, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

Keluarga instans gn8v dan gn8v-tee hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakan keluarga instans ini, hubungi tenaga penjualan Alibaba Cloud.

  • Pengenalan:

    • gn8v: Keluarga instans ini merupakan keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang khusus untuk pelatihan model AI dan tugas inferensi model bahasa besar (LLM) ultra besar. Keluarga instans ini terdiri dari beberapa tipe instans yang menyediakan satu, dua, empat, atau delapan GPU per instans.

    • gn8v-tee: Untuk memenuhi persyaratan keamanan dalam pelatihan dan inferensi model bahasa besar, Alibaba Cloud menyediakan keluarga instans generasi kedelapan berbasis gn8v yang mencakup fitur komputasi rahasia. Tipe instans ini mengenkripsi data selama komputasi GPU guna memastikan keamanan data pengguna.

  • Skema penggunaan:

    • Komputasi inferensi paralel multi-GPU untuk LLM dengan lebih dari 70 miliar parameter

    • Pelatihan model AI tradisional dan pelatihan mengemudi otonom, di mana setiap GPU memberikan daya komputasi hingga 39,5 TFLOPS dalam format titik mengambang presisi tunggal (FP32)

    • Skema pelatihan model berukuran kecil dan menengah yang memanfaatkan koneksi NVLink antar-delapan GPU

  • Manfaat dan posisi pasar:

    • Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU dilengkapi memori HBM3 sebesar 96 GB dan memberikan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.

    • Bandwidth tinggi antar-GPU: Beberapa GPU saling terhubung melalui koneksi NVLink 900 GB/s. Efisiensi pelatihan dan inferensi multi-GPU jauh lebih tinggi dibandingkan generasi instans yang dioptimalkan untuk komputasi dengan akselerasi GPU sebelumnya.

    • Kuantisasi LLM: Keluarga instans ini mendukung daya komputasi dalam format titik mengambang 8-bit (FP8) dan mengoptimalkan daya komputasi untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi pelatihan dan inferensi serta mengurangi penggunaan memori.

    • (Hanya untuk keluarga instans gn8v-tee) Keamanan tinggi: Keluarga instans gn8v-tee mendukung kemampuan komputasi rahasia yang mencakup seluruh rantai tugas inferensi model. Kemampuan tersebut mencakup komputasi rahasia berbasis CPU Intel Trust Domain Extensions (TDX) dan komputasi rahasia berbasis GPU NVIDIA Confidential Computing (CC). Kemampuan komputasi rahasia ini menjamin keamanan data inferensi pengguna dan model perusahaan dalam tugas inferensi dan pelatihan model.

  • Komputasi:

    • Menggunakan prosesor Cloud Infrastructure Processing Unit (CIPU) 1.0 terbaru.

      • Mendekouple kemampuan komputasi dari kemampuan penyimpanan, sehingga Anda dapat memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda.

      • Menyediakan kemampuan mesin fisik untuk mendukung komunikasi peer-to-peer (P2P) antar-instans yang dipercepat GPU.

    • Menggunakan prosesor Intel Xeon Scalable generasi keempat dengan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua inti hingga 3,1 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Instans ini mendukung frame jumbo. Untuk informasi selengkapnya, lihat Frame jumbo.

    • Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket hingga 30.000.000 pps (untuk instans yang dilengkapi delapan GPU).

    • Mendukung antarmuka RDMA elastis (ERI).

    • Catatan

      Untuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.

  • Keamanan: Mendukung fitur Modul Platform Tepercaya (vTPM). Fitur ini didukung oleh gn8v tetapi tidak didukung oleh gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.

gn8v mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

ENI

Antrian NIC per ENI primer

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Maksimum disk cloud

IOPS dasar disk

Bandwidth dasar disk (GB/s)

ecs.gn8v.4xlarge

16

96

96 GB × 1

12

8

16

30

30

17

100.000

0,75

ecs.gn8v.6xlarge

24

128

96 GB × 1

15

8

24

30

30

17

120.000

0,937

ecs.gn8v-2x.8xlarge

32

192

96 GB × 2

20

8

32

30

30

25

200.000

1,25

ecs.gn8v-4x.8xlarge

32

384

96 GB × 4

20

8

32

30

30

25

200.000

1,25

ecs.gn8v-2x.12xlarge

48

256

96 GB × 2

25

8

48

30

30

33

300.000

1,50

ecs.gn8v-8x.16xlarge

64

768

96 GB × 8

32

8

64

30

30

33

360.000

2,5

ecs.gn8v-4x.24xlarge

96

512

96 GB × 4

50

15

64

30

30

49

500.000

3

ecs.gn8v-8x.48xlarge

192

1024

96 GB × 8

100

15

64

50

50

65

1.000.000

6

gn8v-tee mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

ENI

Antrian NIC per ENI primer

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Maksimum disk cloud

IOPS dasar disk

Bandwidth dasar disk (GB/s)

ecs.gn8v-tee.4xlarge

16

96

96 GB × 1

12

8

16

30

30

17

100.000

0,75

ecs.gn8v-tee.6xlarge

24

128

96 GB × 1

15

8

24

30

30

17

120.000

0,937

ecs.gn8v-tee-8x.16xlarge

64

768

96 GB × 8

32

8

64

30

30

33

360.000

2,5

ecs.gn8v-tee-8x.48xlarge

192

1024

96 GB × 8

100

15

64

50

50

65

1.000.000

6

Catatan

Keluarga instans gn8v-tee hanya mendukung gambar Alibaba Cloud Linux 3. Jika Anda menggunakan gambar kustom yang dibuat dari Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernel minimal adalah 5.10.134-18.

gn8is, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.

  • Pengenalan: gn8is adalah keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dikembangkan sebagai respons terhadap pertumbuhan layanan konten yang dihasilkan AI (AIGC). Keluarga ini menggunakan GPU NVIDIA L20 terbaru dan menyediakan tipe instans dengan satu GPU, dua GPU, empat GPU, dan delapan GPU, serta tipe instans dengan rasio CPU-ke-GPU berbeda untuk memenuhi berbagai kebutuhan aplikasi.

  • Manfaat dan posisi pasar:

    • Pemrosesan grafis: Keluarga instans ini menggunakan prosesor Intel Xeon Scalable generasi keempat berfrekuensi tinggi untuk menyediakan daya komputasi CPU yang cukup bagi skenario pemodelan 3D, sehingga rendering dan desain grafis menjadi lebih lancar.

    • Tugas inferensi: Menggunakan GPU NVIDIA L20 baru dan menyediakan memori video 48 GB per GPU untuk mempercepat tugas inferensi. Keluarga ini mendukung format angka titik mengambang FP8 dan dapat digunakan bersama wadah ACK untuk mendukung inferensi berbagai model AIGC secara fleksibel. Keluarga ini sangat cocok untuk tugas inferensi model LLM dengan kurang dari 70 miliar parameter.

  • Skema penggunaan:

    • Animasi, efek khusus untuk film dan televisi, serta rendering

    • Generasi gambar AIGC dan inferensi LLM

    • Skema pengenalan AI umum lainnya, seperti pengenalan gambar dan pengenalan ucapan

  • Komputasi:

    • Menggunakan GPU enterprise-grade NVIDIA L20 baru.

      • Dukungan fitur percepatan seperti TensorRT dan format angka titik mengambang FP8 untuk meningkatkan kinerja inferensi LLM.

      • Hingga 48 GB memori per GPU dan dukungan inferensi LLM 70B atau lebih besar pada satu instans dengan banyak GPU.

      • Peningkatan kemampuan pemrosesan grafis. Misalnya, setelah Anda menginstal driver GRID pada instans gn8is menggunakan Asisten Cloud atau gambar Marketplace Alibaba Cloud, instans ini dapat memberikan kinerja pemrosesan grafis dua kali lipat dibandingkan instans generasi ketujuh.

    • Parameter utama NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Kinerja komputasi

      Kemampuan enkode/diodek video

      Konektivitas antarkartu

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: Tidak tersedia

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 × Encoder Video (+AV1)

      • 3 × Decoder Video

      • 4 × Decoder JPEG

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Menggunakan prosesor Intel® Xeon® berfrekuensi tinggi terbaru yang memberikan frekuensi turbo semua inti 3,9 GHz untuk memenuhi kebutuhan pemodelan 3D kompleks.

  • Penyimpanan:

  • Jaringan:

  • Keamanan: Instans ini mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar komputasi tepercaya.

gn8is mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

ENI

Antrian NIC per ENI primer

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Maksimum disk cloud

IOPS dasar disk

Bandwidth dasar disk (GB/s)

ecs.gn8is.2xlarge

8

64

L20 × 1

48 GB × 1

8

4

8

15

15

17

60.000

0,75

ecs.gn8is.4xlarge

16

128

L20 × 1

48 GB × 1

16

8

16

30

30

17

120.000

1,25

ecs.gn8is-2x.8xlarge

32

256

L20 × 2

48 GB × 2

32

8

32

30

30

33

250.000

2

ecs.gn8is-4x.16xlarge

64

512

L20 × 4

48 GB × 4

64

8

64

30

30

33

450.000

4

ecs.gn8is-8x.32xlarge

128

1024

L20 × 8

48 GB × 8

100

15

64

50

50

65

900.000

8

gn7e, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

Ciri khas

  • Pengenalan:

    • Keluarga instans ini memungkinkan Anda memilih tipe instans dengan jumlah GPU dan CPU berbeda untuk memenuhi kebutuhan bisnis Anda dalam skenario AI.

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata virtual private cloud (VPC), jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.

  • Skema penggunaan:

    • Pelatihan AI skala kecil dan menengah

    • Bisnis komputasi berkinerja-tinggi (HPC) yang dipercepat menggunakan Compute Unified Device Architecture (CUDA)

    • Tugas inferensi AI yang memerlukan kemampuan pemrosesan GPU tinggi atau jumlah memori GPU besar

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

    Penting

    Saat Anda menggunakan layanan pelatihan AI dengan beban komunikasi tinggi, seperti model transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, data dapat rusak akibat kegagalan tak terduga yang disebabkan oleh transmisi data skala besar melalui tautan Peripheral Component Interconnect Express (PCIe). Jika Anda tidak memahami topologi tautan komunikasi yang digunakan untuk layanan pelatihan AI, ajukan tiket untuk mendapatkan dukungan teknis.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn7e mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.gn7e-c16g1.4xlarge

16

125

80 GB × 1

8

3.000.000

8

8

10

1

ecs.gn7e-c16g1.8xlarge

32

250

80 GB × 2

16

6.000.000

16

8

10

1

ecs.gn7e-c16g1.16xlarge

64

500

80 GB × 4

32

12.000.000

32

8

10

1

ecs.gn7e-c16g1.32xlarge

128

1000

80 GB × 8

64

24.000.000

32

16

15

1

gn7i, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk menyediakan kinerja ultra-tinggi yang dapat diprediksi dan konsisten. Keluarga ini memanfaatkan percepatan jalur cepat pada chip untuk meningkatkan kinerja penyimpanan, kinerja jaringan, dan stabilitas komputasi hingga sepuluh kali lipat.

  • Skema penggunaan:

    • Tugas inferensi AI bersamaan yang memerlukan CPU, memori, dan GPU berkinerja-tinggi, seperti pengenalan gambar, pengenalan ucapan, dan identifikasi perilaku

    • Tugas pemrosesan grafisyang membutuhkan kemampuan virtualisasi grafis 3D berkinerja-tinggi, seperti desain grafis jarak jauh dan cloud gaming

  • Komputasi:

    • Menggunakan GPU NVIDIA A10 dengan fitur berikut:

      • Arsitektur NVIDIA Ampere inovatif

      • Dukungan fitur percepatan seperti RTX dan TensorRT

    • Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz.

    • Menyediakan memori hingga 752 GiB, jauh lebih besar dibandingkan keluarga instans gn6i.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn7i mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.gn7i-c8g1.2xlarge

8

30

NVIDIA A10 × 1

24 GB × 1

16

1.600.000

8

4

15

15

ecs.gn7i-c16g1.4xlarge

16

60

NVIDIA A10 × 1

24 GB × 1

16

3.000.000

8

8

30

30

ecs.gn7i-c32g1.8xlarge

32

188

NVIDIA A10 × 1

24 GB × 1

16

6.000.000

12

8

30

30

ecs.gn7i-c32g1.16xlarge

64

376

NVIDIA A10 × 2

24 GB × 2

32

12.000.000

16

15

30

30

ecs.gn7i-c32g1.32xlarge

128

752

NVIDIA A10 × 4

24 GB × 4

64

24.000.000

32

15

30

30

ecs.gn7i-c48g1.12xlarge

48

310

NVIDIA A10 × 1

24 GB × 1

16

9.000.000

16

8

30

30

ecs.gn7i-c56g1.14xlarge

56

346

NVIDIA A10 × 1

24 GB × 1

16

10.000.000

16

8

30

30

ecs.gn7i-2x.8xlarge

32

128

NVIDIA A10 × 2

24 GB × 2

16

6.000.000

16

8

30

30

ecs.gn7i-4x.8xlarge

32

128

NVIDIA A10 × 4

24 GB × 4

32

6.000.000

16

8

30

30

ecs.gn7i-4x.16xlarge

64

256

NVIDIA A10 × 4

24 GB × 4

64

12.000.000

32

8

30

30

ecs.gn7i-8x.32xlarge

128

512

NVIDIA A10 × 8

24 GB × 8

64

24.000.000

32

16

30

30

ecs.gn7i-8x.16xlarge

64

256

NVIDIA A10 × 8

24 GB × 8

32

12.000.000

32

8

30

30

Penting

Anda hanya dapat mengubah tipe instans berikut ke ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge: ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge.

gn7s, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

Untuk menggunakan keluarga instans gn7s, ajukan tiket untuk mengajukan permohonan.

  • Pengenalan:

    • Keluarga instans ini menggunakan prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Anda dapat memilih tipe instans yang terdiri dari kombinasi GPU dan vCPU yang sesuai untuk memenuhi kebutuhan bisnis Anda dalam skenario AI.

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga dan menggandakan bandwidth rata-rata VPC, jaringan, dan disk dibandingkan keluarga instans generasi sebelumnya.

  • Skema penggunaan: tugas inferensi AI bersamaan yang memerlukan CPU, memori, dan GPU berkinerja-tinggi, seperti pengenalan gambar, pengenalan ucapan, dan identifikasi perilaku.

  • Komputasi:

    • Menggunakan GPU NVIDIA A30 dengan fitur berikut:

      • Arsitektur NVIDIA Ampere inovatif

      • Dukungan fitur multi-instance GPU (MIG) dan fitur percepatan (berbasis Tensor core generasi kedua) untuk menyediakan dukungan bisnis yang beragam

    • Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz.

    • Ukuran memori meningkat secara signifikan dibandingkan keluarga instans generasi sebelumnya.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn7s mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Antrian NIC

ENI

ecs.gn7s-c8g1.2xlarge

8

60

NVIDIA A30 × 1

24 GB × 1

16

1.600.000

5

1

8

4

ecs.gn7s-c16g1.4xlarge

16

120

NVIDIA A30 × 1

24 GB × 1

16

3.000.000

5

1

8

8

ecs.gn7s-c32g1.8xlarge

32

250

NVIDIA A30 × 1

24 GB × 1

16

6.000.000

5

1

12

8

ecs.gn7s-c32g1.16xlarge

64

500

NVIDIA A30 × 2

24 GB × 2

32

12.000.000

5

1

16

15

ecs.gn7s-c32g1.32xlarge

128

1000

NVIDIA A30 × 4

24 GB × 4

64

24.000.000

10

1

32

15

ecs.gn7s-c48g1.12xlarge

48

380

NVIDIA A30 × 1

24 GB × 1

16

9.000.000

8

1

16

8

ecs.gn7s-c56g1.14xlarge

56

440

NVIDIA A30 × 1

24 GB × 1

16

10.000.000

8

1

16

8

gn7, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Skema penggunaan:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

gn7 mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.gn7-c12g1.3xlarge

12

94

40 GB × 1

4

2.500.000

4

8

10

1

ecs.gn7-c13g1.13xlarge

52

378

40 GB × 4

16

9.000.000

16

8

30

30

ecs.gn7-c13g1.26xlarge

104

756

40 GB × 8

30

18.000.000

16

15

10

1

gn6i, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Skema penggunaan:

    • Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk visi komputer, pengenalan ucapan, sintesis ucapan, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem rekomendasi

    • Rendering real-time untuk cloud gaming

    • Rendering real-time untuk aplikasi AR dan VR

    • Workstation grafis atau komputasi berat grafis

    • Database yang dipercepat GPU

    • Komputasi berkinerja-tinggi

  • Komputasi:

    • Menggunakan GPU NVIDIA T4 dengan fitur berikut:

      • Arsitektur NVIDIA Turing inovatif

      • 16 GB memori (bandwidth 320 GB/s) per GPU

      • 2.560 core CUDA per GPU

      • Hingga 320 core Tensor Turing per GPU

      • Core Tensor presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4

    • Menawarkan rasio CPU-ke-memori 1:4.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn6i mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

IOPS dasar disk

Multi-antrian

ENI

Jumlah alamat IPv4 pribadi per ENI

Jumlah alamat IPv6 per ENI

ecs.gn6i-c4g1.xlarge

4

15

NVIDIA T4 × 1

16 GB × 1

4

2.500.000

Tidak tersedia

2

2

10

1

ecs.gn6i-c8g1.2xlarge

8

31

NVIDIA T4 × 1

16 GB × 1

5

2.500.000

Tidak tersedia

2

2

10

1

ecs.gn6i-c16g1.4xlarge

16

62

NVIDIA T4 × 1

16 GB × 1

6

2.500.000

Tidak tersedia

4

3

10

1

ecs.gn6i-c24g1.6xlarge

24

93

NVIDIA T4 × 1

16 GB × 1

7,5

2.500.000

Tidak tersedia

6

4

10

1

ecs.gn6i-c40g1.10xlarge

40

155

NVIDIA T4 × 1

16 GB × 1

10

1.600.000

Tidak tersedia

16

10

10

1

ecs.gn6i-c24g1.12xlarge

48

186

NVIDIA T4 × 2

16 GB × 2

15

4.500.000

Tidak tersedia

12

6

10

1

ecs.gn6i-c24g1.24xlarge

96

372

NVIDIA T4 × 4

16 GB × 4

30

4.500.000

250.000

24

8

10

1

gn6e, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Skema penggunaan:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

  • Komputasi:

    • Menggunakan GPU NVIDIA V100 yang masing-masing memiliki memori GPU 32 GB dan mendukung NVLink.

    • Menggunakan GPU NVIDIA V100 (berbasis SXM2) dengan fitur berikut:

      • Arsitektur NVIDIA Volta inovatif

      • 32 GB memori HBM2 (bandwidth 900 GB/s) per GPU

      • 5.120 core CUDA per GPU

      • 640 core Tensor per GPU

      • Hingga enam koneksi NVLink dua arah per GPU, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah sehingga total bandwidth mencapai 300 Gbit/s (6 × 25 × 2 = 300)

    • Menawarkan rasio CPU-ke-memori 1:8.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

Tabel berikut mencantumkan tipe instans dan spesifikasi keluarga instans gn6e.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.gn6e-c12g1.3xlarge

12

92

1 × NVIDIA V100

1 × 32 GB

5

800.000

8

6

10

1

ecs.gn6e-c12g1.6xlarge

24

184

2 × NVIDIA V100

2 × 32 GB

8

1.200.000

8

8

20

1

ecs.gn6e-c12g1.12xlarge

48

368

4 × NVIDIA V100

4 × 32 GB

16

2.400.000

8

8

20

1

ecs.gn6e-c12g1.24xlarge

96

736

8 × NVIDIA V100

8 × 32 GB

32

4.500.000

16

8

20

1

gn6v, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Skema penggunaan:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

  • Komputasi:

    • Menggunakan GPU NVIDIA V100.

    • Menggunakan GPU NVIDIA V100 (berbasis SXM2) dengan fitur berikut:

      • Arsitektur NVIDIA Volta inovatif

      • 16 GB memori HBM2 (bandwidth 900 GB/s) per GPU

      • 5.120 core CUDA per GPU

      • 640 core Tensor per GPU

      • Hingga enam koneksi NVLink dua arah per GPU, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah sehingga total bandwidth mencapai 300 Gbit/s (6 × 25 × 2 = 300)

    • Menawarkan rasio CPU-ke-memori 1:4.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn6v mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Pengalihan paket (pps)

IOPS dasar disk

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.gn6v-c8g1.2xlarge

8

32

NVIDIA V100 × 1

16 GB × 1

2,5

800.000

Tidak tersedia

4

4

10

1

ecs.gn6v-c8g1.4xlarge

16

64

NVIDIA V100 × 2

16 GB × 2

5

1.000.000

Tidak tersedia

4

8

20

1

ecs.gn6v-c8g1.8xlarge

32

128

NVIDIA V100 × 4

16 GB × 4

10

2.000.000

Tidak tersedia

8

8

20

1

ecs.gn6v-c8g1.16xlarge

64

256

NVIDIA V100 × 8

16 GB × 8

20

2.500.000

Tidak tersedia

16

8

20

1

ecs.gn6v-c10g1.20xlarge

82

336

NVIDIA V100 × 8

16 GB × 8

35

4.500.000

250.000

16

8

20

1

ebmgn9g, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

Penting

Keluarga instans ebmgn9g sedang dalam pratinjau undangan. Untuk menggunakannya, Anda dapat mengajukan tiket.

  • Pengenalan: ebmgn9g adalah keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kesembilan, lengkap fitur, dan hemat biaya dari Alibaba Cloud. Keluarga ini menggunakan CIPU 2.0 terbaru untuk memberikan layanan cloud. Dilengkapi CPU berfrekuensi tinggi, memori berkapasitas besar, dan GPU profesional berarsitektur Blackwell terbaru, keluarga instans ini menyediakan komputasi GPU cloud hemat biaya untuk pelatihan mengemudi otonom dan AI berwujud, inferensi model bahasa besar, rendering film dan animasi, layanan metaverse dan cloud gaming, serta beban kerja lain yang dipercepat GPU.

  • Skema penggunaan dan fitur utama:

    • Mengemudi otonom dan AI berwujud:
      Menyediakan 256 vCPU. Semua core CPU berjalan pada frekuensi hingga 4,2 GHz atau lebih tinggi. Dipasangkan dengan memori 2,3 TB, keluarga ini mendukung kebutuhan pemrosesan data untuk pelatihan mengemudi otonom dan AI berwujud.

    • Pencarian dan rekomendasi:
      GPU Blackwell memberikan daya komputasi TF32 berkinerja-tinggi sebesar 137 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk beban kerja pencarian dan iklan.

    • Inferensi model besar:
      GPU generasi terbaru memberikan daya komputasi lebih tinggi dibandingkan keluarga instans generasi kedelapan. Bandwidth memori GPU ditingkatkan menjadi 1344 GB/s. Dukungan baru untuk komputasi FP4 secara signifikan meningkatkan kinerja inferensi dan efisiensi biaya. Delapan GPU dihubungkan melalui PCIe Gen5, yang memberikan bandwidth antar-GPU sebesar 128 GB/s dan sangat meningkatkan efisiensi inferensi paralel multi-GPU.

    • Cloud gaming, rendering, dan metaverse:
      CPU mencapai frekuensi clock hingga 5 GHz, menjadikannya pilihan utama untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan mencakup driver grafis kelas workstation yang telah disertifikasi untuk desain profesional. Keluarga ini sepenuhnya mempercepat OpenGL, menjadikannya pilihan terbaik untuk pengembangan film dan animasi kelas atas serta desain berbantu komputer (CAD).

  • Didukung oleh prosesor cloud CIPU 2.0 terbaru:

    CIPU generasi kedua memberikan daya pemrosesan cloud yang lebih tinggi dan peningkatan kinerja komponen eRDMA, VPC, dan EBS. Instans Mesin Fisik ECS memberikan akses langsung ke sumber daya fisik. Keluarga ini juga mendukung beban kerja yang memerlukan lisensi terikat perangkat keras. Wadah seperti Docker, Clear Container, dan Pouch didukung.

  • Komputasi:

    • Menampilkan GPU profesional berarsitektur Blackwell terbaru:

      • Mendukung OpenGL untuk pemrosesan grafis kelas profesional.

      • Mendukung fitur percepatan umum seperti RTX dan TensorRT. Baru ditingkatkan untuk mendukung interkoneksi FP4 dan PCIe Gen5.

      • Menggunakan interkoneksi PCIe Switch. Dibandingkan dengan koneksi langsung ke CPU, kinerja NCCL meningkat 36%. Untuk inferensi model besar terbagi multi-GPU, kinerja puncak meningkat hingga 9%.

    • Spesifikasi GPU:

      Arsitektur GPU

      Memori GPU

      Kinerja komputasi

      Kemampuan enkode/dekode video

      Interkoneksi antar-GPU

      API yang dipercepat

      Blackwell

      • Kapasitas: 48 GB

      • Bandwidth: 1344 GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • Core RT: 196 TFLOPS

      • 3 × Encoder Video

      • 3 × Decoder Video

      • PCIe Gen5 x16: 128 GB/s

      • Dukungan P2P

      Mendukung DX12,

      OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, DirectCompute

    • Prosesor: Menggunakan prosesor AMD Turin-C (SPR) dengan frekuensi clock 3,3 GHz hingga 5 GHz. Frekuensi semua core hingga 4,2 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi lebih lanjut tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan ultra-tinggi hingga 30 juta PPS untuk pengalihan paket.

    • Mendukung Antarmuka RDMA Elastis (ERI). Dalam jaringan VPC, ERI memungkinkan akselerasi tembus RDMA dan meningkatkan bandwidth hingga 360 Gbit/s. Anda dapat menggunakannya untuk mengemudi otonom, AI berwujud, visi komputer (CV), dan pelatihan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan .

Tipe instans ebmgn9g

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (PPS)

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Multi-antrian (ENI primer / ENI sekunder)

Elastic Network Interface (ENI)

Jumlah maksimum disk data

Bandwidth disk maksimum (GB/s)

ecs.ebmgn9g.64xlarge

256

2304

48 GB × 8

360 (180 × 2)

30 juta

30

30

64 / 16

38

33

8

Catatan

Instans ebmgn9g harus boot menggunakan mode UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

ebmgn9ge, Keluarga Instans Mesin Fisik ECS yang Dioptimalkan untuk Komputasi dengan Akselerasi GPU

Penting

Keluarga instans ebmgn9ge sedang dalam pratinjau undangan. Untuk menggunakan keluarga instans ini, ajukan tiket.

  • Pengenalan: Keluarga ebmgn9ge adalah keluarga instans Mesin Fisik ECS generasi kesembilan, lengkap fitur, dan hemat biaya dari Alibaba Cloud. Keluarga ini menggunakan CIPU 2.0 terbaru dan menampilkan CPU berfrekuensi tinggi, kapasitas memori besar, serta kartu grafis profesional berbasis arsitektur Blackwell terbaru. Kombinasi ini memberikan akselerasi GPU hemat biaya untuk skenario seperti pelatihan mengemudi otonom dan intelijensi berwujud, inferensi model bahasa besar (LLM), rendering film dan animasi, serta layanan metaverse atau cloud gaming.

  • Skema penggunaan dan fitur:

    • Mengemudi otonom dan intelijensi berwujud:
      Instans ini menyediakan 256 vCPU dengan semua core berjalan di atas 4,2 GHz dan memori 2,3 TB, memenuhi persyaratan pemrosesan data untuk pelatihan mengemudi otonom dan intelijensi berwujud.

    • Pencarian dan rekomendasi:
      GPU Blackwell memberikan daya komputasi TF32 berkinerja-tinggi sebesar 137 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, menawarkan konfigurasi optimal untuk layanan pencarian dan periklanan.

    • Inferensi model besar:

      Instans ebmgn9ge dirancang untuk model bahasa besar. Instans ini menyediakan memori GPU 72 GB per kartu dan bandwidth memori 1344 GB/s, memungkinkan inferensi berkinerja-tinggi untuk skenario LLM. Dengan arsitektur komputasi FP4 baru dan bandwidth PCIe generasi kelima sebesar 128 GB/s, instans ini mendukung inferensi paralel 8-kartu untuk model dengan lebih dari 671 miliar parameter.

    • Cloud gaming, rendering, dan metaverse:
      CPU mencapai frekuensi clock tinggi hingga 5 GHz, menjadikannya ideal untuk pemodelan 3D. GPU secara native mendukung grafis dan mencakup driver kelas workstation yang disertifikasi untuk desain profesional. Instans ini juga mendukung akselerasi OpenGL lengkap, menjadikannya pilihan optimal untuk pengembangan film dan animasi kelas atas serta desain berbantu komputer (CAD).

  • Menggunakan prosesor cloud CIPU 2.0 terbaru:

    CIPU generasi kedua memberikan daya pemrosesan cloud yang lebih tinggi dan peningkatan kemampuan komputasi untuk komponen elastic Remote Direct Memory Access (eRDMA), VPC, dan EBS. Instans Mesin Fisik ECS memungkinkan akses langsung ke sumber daya fisik dan ideal untuk beban kerja yang memerlukan lisensi terikat perangkat keras. Instans ini mendukung wadah seperti Docker, Clear Container, dan Pouch.

  • Komputasi:

    • Menggunakan kartu grafis profesional berbasis arsitektur Blackwell terbaru:

      • Mendukung pemrosesan grafis OpenGL kelas profesional.

      • Mendukung fitur percepatan umum seperti RTX dan TensorRT dan baru ditingkatkan untuk mendukung interkoneksi FP4 dan PCIe Gen5.

      • Menggunakan PCIe Switch untuk interkoneksi. Dibandingkan dengan koneksi langsung ke CPU, ini meningkatkan kinerja NCCL sebesar 36% dan meningkatkan kinerja hingga 9% untuk inferensi model besar multi-kartu terbagi.

    • Parameter utama GPU:

      Arsitektur GPU

      Memori GPU

      Kinerja komputasi

      Kemampuan enkode/dekode video

      Koneksi antarkartu

      API Akselerasi

      Blackwell

      • Kapasitas: 72 GB

      • Bandwidth: 1344 GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • Core RT: 196 TFLOPS

      • 3 × Encoder Video

      • 3 × Decoder Video

      • PCIe Gen5 x16: 128 GB/s

      • Dukungan P2P

      Mendukung DX12,

      OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

    • Prosesor: Prosesor AMD Turin-C (SPR) dengan frekuensi clock berkisar antara 3,3 GHz hingga 5 GHz. Semua core dapat mencapai hingga 4,2 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Kinerja jaringan ultra-tinggi dengan kemampuan pengalihan paket 30 juta PPS.

    • Mendukung Antarmuka RDMA Elastis (ERI). ERI memungkinkan akselerasi tembus RDMA untuk interkoneksi dipercepat dalam VPC, meningkatkan bandwidth hingga 360 Gbit/s. Fitur ini dapat digunakan untuk tugas pelatihan dalam mengemudi otonom, intelijensi berwujud, visi komputer (CV), dan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.

Tabel berikut mencantumkan tipe instans dan spesifikasi untuk keluarga ebmgn9ge.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (PPS)

Alamat IPv4 pribadi per NIC

Alamat IPv6 per NIC

Antrian (NIC primer/NIC sekunder)

ENI

Jumlah maksimum disk data

Bandwidth disk maksimum (GB/s)

ecs.ebmgn9ge.64xlarge

256

2304

72 GB × 8

360 (180 × 2)

30 juta

30

30

64/16

38

33

8

Catatan

Gambar untuk tipe instans ebmgn9ge harus menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

ebmgn9gc, Keluarga Instans Mesin Fisik ECS yang Dioptimalkan untuk Komputasi dengan Akselerasi GPU

Penting

Keluarga instans ebmgn9gc sedang dalam pratinjau undangan. Untuk menggunakan keluarga instans ini, Anda harus mengajukan tiket.

  • Pengenalan: ebmgn9gc adalah instans Mesin Fisik ECS generasi kesembilan, hemat biaya, dan lengkap fitur dari Alibaba Cloud. Instans ini dilengkapi dengan CIPU 2.0 terbaru, CPU berfrekuensi tinggi, memori berkapasitas besar, dan GPU profesional berarsitektur Blackwell. Keluarga instans ini menyediakan komputasi cloud GPU hemat biaya untuk beban kerja seperti pelatihan mengemudi otonom dan AI berwujud, inferensi LLM, rendering film dan animasi, serta layanan metaverse dan cloud gaming.

  • Skema penggunaan dan fitur:

    • Mengemudi otonom dan AI berwujud:
      Instans ini menyediakan 256 vCPU dengan semua core berjalan pada frekuensi clock hingga 4,2 GHz, dan memori 2,3 TB. Konfigurasi ini memenuhi persyaratan pemrosesan data yang menuntut untuk pelatihan mengemudi otonom dan AI berwujud.

    • Pencarian dan rekomendasi:
      GPU Blackwell memberikan daya komputasi TF32 berkinerja-tinggi sebesar 137 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, yang memberikan konfigurasi optimal untuk beban kerja pencarian dan periklanan.

    • Inferensi model:

      Instans ebmgn9gc dirancang khusus untuk model bahasa besar, menawarkan memori GPU 72 GB per GPU dan bandwidth memori GPU hingga 1344 GB/s. Instans ini menyediakan daya komputasi inferensi berkinerja-tinggi untuk skenario LLM, mendukung arsitektur komputasi FP4 baru, dan menampilkan bandwidth PCIe generasi kelima sebesar 128 GB/s. Hal ini memungkinkan inferensi paralel model besar dengan lebih dari 671 miliar parameter di delapan GPU.

    • Cloud gaming, rendering, dan metaverse:
      CPU memiliki frekuensi clock hingga 5 GHz, yang ideal untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan mencakup driver grafis kelas workstation yang disertifikasi untuk aplikasi desain profesional. Instans ini sepenuhnya mempercepat OpenGL, yang menjadikannya pilihan unggul untuk pengembangan film dan animasi kelas atas serta desain CAD.

  • Didukung oleh prosesor cloud CIPU 2.0 terbaru:

    CIPU generasi kedua memberikan peningkatan kemampuan pemrosesan cloud, termasuk peningkatan kinerja untuk komponen eRDMA, VPC, dan EBS. Instans Mesin Fisik ECS memberikan akses langsung ke perangkat keras fisik atau mendukung beban kerja yang memerlukan lisensi terikat perangkat keras. CIPU generasi kedua mendukung wadah seperti Docker, Clear Containers, dan Pouch.

  • Komputasi:

    • Instans ini menggunakan GPU profesional berbasis arsitektur Blackwell:

      • Mendukung OpenGL untuk pemrosesan grafis kelas profesional.

      • Mendukung fitur percepatan umum, seperti RTX dan TensorRT, bersama dengan interkoneksi FP4 dan PCIe Gen5.

      • Instans ini menggunakan interkoneksi PCIe Switch. Dibandingkan dengan koneksi langsung ke CPU, hal ini meningkatkan kinerja NCCL sebesar 36%. Untuk inferensi LLM multi-GPU terbagi, kinerja puncak meningkat hingga 9%.

    • Spesifikasi GPU:

      Arsitektur GPU

      Memori GPU

      Kinerja komputasi

      Kemampuan enkode/dekode video

      Interkoneksi GPU-ke-GPU

      API yang Dipercepat

      Blackwell

      • Kapasitas: 72 GB

      • Bandwidth: 1344 GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • Core RT: 196 TFLOPS

      • 3 × Encoder Video

      • 3 × Decoder Video

      • PCIe Gen5 x16: 128 GB/s

      • Dukungan peer-to-peer (P2P)

      Mendukung DX12,

      OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

    • Prosesor: Instans ini menggunakan prosesor AMD Turin-C (SPR) dengan frekuensi clock 3,3 GHz hingga 5 GHz. Frekuensi clock semua core hingga 4,2 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Instans ini menyediakan kinerja jaringan ultra-tinggi dengan hingga 30 juta PPS untuk pengalihan paket.

    • Instans ini mendukung Antarmuka RDMA Elastis (ERI). Dalam VPC, ERI memungkinkan akselerasi tembus RDMA dan meningkatkan bandwidth hingga 360 Gbit/s. Fitur ini ideal untuk mengemudi otonom, AI berwujud, visi komputer (CV), dan pelatihan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.

Tabel berikut mencantumkan tipe instans dan spesifikasi untuk keluarga ebmgn9gc.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (PPS)

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Multi-antrian (ENI primer / ENI sekunder)

Elastic Network Interface (ENI)

Jumlah maksimum disk data

Bandwidth disk maksimum (GB/s)

ecs.ebmgn9gc.64xlarge

256

1536

72 GB × 8

360 (180 × 2)

30 juta

30

30

64 / 16

38

33

8

Catatan

Instans ebmgn9gc harus boot dari gambar yang dikonfigurasi untuk mode UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

ebmgn8v, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.

  • Pengenalan: Keluarga instans ini adalah keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang khusus untuk pelatihan model AI dan model ultra-besar. Setiap instans dalam keluarga ini dilengkapi delapan GPU.

  • Skema penggunaan:

    • Komputasi inferensi paralel multi-GPU untuk LLM dengan lebih dari 70 miliar parameter

    • Pelatihan model AI tradisional dan pelatihan mengemudi otonom, di mana setiap GPU memberikan daya komputasi hingga 39,5 TFLOPS dalam format titik mengambang presisi tunggal (FP32)

    • Skema pelatihan model berukuran kecil dan menengah yang memanfaatkan koneksi NVLink antar-delapan GPU

  • Manfaat dan posisi pasar:

    • Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU dilengkapi memori HBM3 sebesar 96 GB dan memberikan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.

    • Bandwidth tinggi antar-GPU: Beberapa GPU saling terhubung melalui koneksi NVLink 900 GB/s. Efisiensi pelatihan dan inferensi multi-GPU jauh lebih tinggi dibandingkan generasi instans yang dioptimalkan untuk komputasi dengan akselerasi GPU sebelumnya.

    • Kuantisasi model besar: Keluarga instans ini mendukung daya komputasi dalam format titik mengambang 8-bit (FP8) dan mengoptimalkan daya komputasi untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi pelatihan dan inferensi serta mengurangi penggunaan memori.

  • Komputasi:

    • Menggunakan prosesor CIPU 1.0 terbaru.

      • Mendekouple kemampuan komputasi dari kemampuan penyimpanan, memungkinkan Anda memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda, dan meningkatkan bandwidth antar-instans hingga 160 Gbit/s untuk transmisi dan pemrosesan data lebih cepat dibandingkan keluarga instans generasi ketujuh.

      • Menggunakan kemampuan mesin fisik yang disediakan oleh prosesor CIPU untuk mendukung komunikasi peer-to-peer (P2P) antar-instans yang dipercepat GPU.

    • Menggunakan prosesor Intel Xeon Scalable generasi keempat yang memberikan frekuensi turbo semua inti hingga 3,1 GHz dan menyediakan 192 vCPU.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 30.000.000 pps.

    • Mendukung ERI untuk memungkinkan komunikasi berbasis RDMA antar-instans dalam VPC dan menyediakan bandwidth hingga 160 Gbit/s per instans, yang cocok untuk tugas pelatihan berbasis model CV dan model tradisional.

      Catatan

      Untuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.

Tipe instans ebmgn8v

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Antrian NIC (ENI Primer/ENI Sekunder)

ENI

Jumlah maksimum disk data yang dipasang

Bandwidth disk maksimum (Gbit/s)

ecs.ebmgn8v.48xlarge

192

1024

96GB*8

170 (85 * 2)

30.000.000

30

30

64

32

31

6

Catatan

Mode boot gambar yang digunakan oleh instans keluarga ini harus UEFI. Jika Anda ingin menggunakan gambar kustom pada instans, pastikan gambar tersebut mendukung mode boot UEFI dan mode boot gambar diatur ke UEFI. Untuk informasi tentang cara mengatur mode boot gambar kustom, lihat Mode boot instans.

ebmgn8ia, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.

  • Pengenalan: Keluarga instans ini adalah generasi kedelapan instans komputasi percepatan Mesin Fisik ECS dari Alibaba Cloud, dirancang untuk aplikasi seperti pencarian, rekomendasi, dan simulasi yang memerlukan jumlah sumber daya vCPU tinggi per GPU. Keluarga ini didukung oleh GPU NVIDIA L20 terbaru, dan setiap instans merupakan host mesin fisik tunggal yang dilengkapi dua CPU berfrekuensi tinggi dan empat GPU.

  • Manfaat dan Skema penggunaan:

    • Frekuensi clock tinggi: Produk ini didukung oleh dua prosesor AMD EPYC™ Genoa 9T34. Setiap prosesor memiliki 64 core fisik, menyediakan total 256 vCPU dengan frekuensi clock berkisar antara 3,4 GHz hingga 3,75 GHz. Konfigurasi ini secara signifikan meningkatkan kinerja CPU single-core, menjadikannya ideal untuk pemodelan CAD dan mempercepat pra-pemrosesan untuk simulasi CAE.

    • Alokasi sumber daya jarang: Setiap GPU dipasangkan rata-rata dengan 64 vCPU dan memori 384 GiB, menyediakan bandwidth memori rata-rata 230 GB/s. Konfigurasi ini ideal untuk skenario komputasi GPU yang memerlukan throughput I/O tinggi, seperti periklanan, pencarian, rekomendasi, dan simulasi CAE tradisional. Konfigurasi ini juga mendukung tugas produksi film dan televisi tertentu yang bergantung pada rendering CPU.

  • Menggunakan prosesor CIPU 1.0 terbaru yang memberikan manfaat berikut:

    • Mendekouple kemampuan komputasi dari kemampuan penyimpanan, memungkinkan Anda memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda, dan meningkatkan bandwidth antar-instans hingga 160 Gbit/s untuk transmisi dan pemrosesan data lebih cepat dibandingkan keluarga instans generasi sebelumnya.

    • Menggunakan kemampuan mesin fisik yang disediakan oleh prosesor CIPU untuk mendukung komunikasi Peripheral Component Interconnect Express (PCIe) P2P antar-instans yang dipercepat GPU.

  • Komputasi:

    • Dengan GPU Enterprise NVIDIA L20 baru:

      • Dukungan fitur percepatan seperti vGPU, teknologi RTX, dan mesin inferensi TensorRT.

      • Dukungan presisi titik mengambang 8-bit meningkatkan efisiensi komputasi.

    • Parameter utama NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Kinerja komputasi

      Kemampuan codec video

      Interkoneksi antarkartu

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: Tidak tersedia

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 * Encoder Video (+AV1)

      • 3 * Decoder Video

      • 4 * Decoder JPEG

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Prosesor: AMD EPYC™ Genoa 9T34, 3,4 GHz hingga 3,75 GHz.

  • Penyimpanan:

  • Newtork:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 30.000.000 pps.

    • Mendukung ERI untuk memungkinkan komunikasi berbasis RDMA antar-instans dalam VPC dan menyediakan bandwidth hingga 160 Gbit/s per instans, yang cocok untuk tugas pelatihan berbasis model CV dan model tradisional.

      Catatan

      Untuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.

Tipe instans ebmgn8ia

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Antrian NIC (ENI Primer/ENI Sekunder)

ENI

Jumlah maksimum disk data yang dipasang

Bandwidth disk maksimum (Gbit/s)

ecs.ebmgn8ia.64xlarge

256

1536

L20 * 4

48GB * 4

160 (80 × 2)

30.000.000

30

30

64/16

32

31

6

Catatan

Mode boot gambar yang digunakan oleh instans keluarga ini harus UEFI. Jika Anda ingin menggunakan gambar kustom pada instans, pastikan gambar tersebut mendukung mode boot UEFI dan mode boot gambar diatur ke UEFI. Untuk informasi tentang cara mengatur mode boot gambar kustom, lihat Mode boot instans.

ebmgn8is, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

Keluarga instans ini hanya tersedia di wilayah tertentu, termasuk wilayah di luar Tiongkok. Untuk menggunakannya, hubungi tenaga penjualan Alibaba Cloud.

  • Pengenalan: ebmgn8is adalah generasi kedelapan keluarga spesifikasi komputasi percepatan (keluarga instans Mesin Fisik ECS) yang diluncurkan oleh Alibaba Cloud untuk mengatasi perkembangan terkini bisnis pembuatan konten AI. Keluarga ini menggunakan GPU NVIDIA L20 terbaru. Setiap instans merupakan host mesin fisik yang menggunakan delapan kartu komputasi GPU.

  • Manfaat dan posisi pasar:

    • Pemrosesan grafis: Keluarga instans ini menggunakan prosesor Intel Xeon Scalable generasi keempat berfrekuensi tinggi untuk memberikan daya komputasi CPU yang cukup dalam skenario pemodelan 3D dan mencapai rendering dan desain grafis yang lancar.

    • Tugas inferensi: menggunakan memori GPU NVIDIA L20 baru sebesar 48 GB pada satu kartu GPU untuk mempercepat tugas inferensi. Keluarga ini mendukung format titik mengambang FP8 dan mendukung inferensi berbasis berbagai model AIGC, terutama untuk tugas inferensi yang menggunakan model LLM di bawah 70 MB.

    • Tugas pelatihan: Keluarga instans ini menyediakan kemampuan komputasi hemat biaya dan memberikan kinerja komputasi FP32 dua kali lipat dibandingkan instans inferensi generasi ketujuh. Instans keluarga ini cocok untuk pelatihan model CV berbasis FP32 dan model kecil-menengah lainnya.

  • Skema penggunaan:

    • Produksi dan rendering efek khusus untuk animasi, film, dan televisi berdasarkan kemampuan pemrosesan grafis kelas workstation dalam skenario di mana gambar GRID Marketplace Alibaba Cloud digunakan, driver GRID diinstal, dan kemampuan grafis OpenGL dan Direct3D diaktifkan

    • Skenario di mana layanan manajemen yang disediakan oleh Container Service for Kubernetes (ACK) untuk aplikasi wadah digunakan untuk mendukung konten grafis yang dihasilkan AI dan tugas inferensi LLM dengan hingga 130 miliar parameter

    • Skema pengenalan AI umum lainnya, pengenalan gambar, dan pengenalan ucapan

  • Menggunakan prosesor CIPU 1.0 terbaru yang memberikan manfaat berikut:

    • Mendekouple kemampuan komputasi dari kemampuan penyimpanan, memungkinkan Anda memilih sumber daya penyimpanan secara fleksibel sesuai kebutuhan bisnis Anda, dan meningkatkan bandwidth antar-instans hingga 160 Gbit/s untuk transmisi dan pemrosesan data lebih cepat dibandingkan keluarga instans generasi sebelumnya.

    • Menggunakan kemampuan mesin fisik yang disediakan oleh prosesor CIPU untuk mendukung komunikasi PCIe P2P antar-instans yang dipercepat GPU.

  • Komputasi:

    • Dengan GPU Enterprise NVIDIA L20 baru:

      • Dukungan fitur percepatan seperti vGPU, teknologi RTX, dan mesin inferensi TensorRT

      • Dukungan interkoneksi PCIe Switch, yang mencapai peningkatan kinerja 36% pada Perpustakaan Komunikasi Kolektif NVIDIA (NCCL) dibandingkan skema koneksi langsung CPU dan membantu meningkatkan kinerja inferensi hingga 9% saat menjalankan tugas inferensi LLM multi-GPU secara paralel

    • Parameter utama NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Kinerja komputasi

      Kemampuan codec video

      Interkoneksi antarkartu

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: Tidak tersedia

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 * Encoder Video(+AV1)

      • 3 * Decoder Video

      • 4 * Decoder JPEG

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Menggunakan prosesor Intel® Xeon® Scalable (SPR) 3,4 GHz yang memberikan frekuensi turbo semua inti hingga 3,9 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 30.000.000 pps.

    • Mendukung ERI untuk memungkinkan komunikasi berbasis RDMA antar-instans dalam VPC dan menyediakan bandwidth hingga 160 Gbit/s per instans, yang cocok untuk tugas pelatihan berbasis model CV dan model tradisional.

      Catatan

      Untuk informasi cara menggunakan ERI, lihat Aktifkan eRDMA pada instans tingkat perusahaan.

Tipe instans ebmgn8is

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

Antrian NIC (ENI Primer/ENI Sekunder)

ENI

Jumlah maksimum disk data yang dipasang

Bandwidth disk maksimum (Gbit/s)

ecs.ebmgn8is.32xlarge

128

1024

L20 * 8

48GB*8

160 (80 × 2)

30.000.000

30

30

64/16

32

31

6

Catatan

Mode boot gambar yang digunakan oleh instans keluarga ini harus UEFI. Jika Anda ingin menggunakan gambar kustom pada instans, pastikan gambar tersebut mendukung mode boot UEFI dan mode boot gambar diatur ke UEFI. Untuk informasi tentang cara mengatur mode boot gambar kustom, lihat Mode boot instans.

ebmgn7e, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.

  • Skema penggunaan:

    • Pelatihan dan pengembangan pembelajaran mendalam

    • Komputasi berkinerja-tinggi (HPC) dan simulasi

    Penting

    Saat Anda menggunakan layanan pelatihan AI yang memiliki beban komunikasi tinggi, seperti model transformer, Anda harus mengaktifkan NVLink untuk komunikasi GPU-ke-GPU. Jika tidak, data dapat rusak akibat kegagalan tak terduga yang disebabkan oleh transmisi data skala besar melalui tautan Peripheral Component Interconnect Express (PCIe). Jika Anda tidak memahami topologi tautan komunikasi yang digunakan untuk layanan pelatihan AI, ajukan tiket untuk mendapatkan dukungan teknis.

  • Komputasi:

    • Menggunakan prosesor Intel® Xeon® Scalable 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz dan mendukung antarmuka PCIe 4.0.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 24.000.000 pps.

Tipe instans ebmgn7e

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC (NIC Primer/NIC Sekunder)

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.ebmgn7e.32xlarge

128

1024

80GB * 8

64

24.000.000

32/12

32

10

1

Anda harus memeriksa status fitur multi-instance GPU (MIG) dan mengaktifkan atau menonaktifkan fitur MIG setelah memulai instans ebmgn7e. Untuk informasi tentang fitur MIG, lihat Panduan Pengguna Multi-Instance GPU NVIDIA.

Tabel berikut menjelaskan apakah fitur MIG didukung oleh tipe instans dalam keluarga instans ebmgn7e.

Tipe instans

Dukungan MIG

Deskripsi

ecs.ebmgn7e.32xlarge

Ya

Fitur MIG didukung oleh instans ebmgn7e.

ebmgn7i, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.

  • Skema penggunaan:

    • Tugas inferensi AI bersamaan yang memerlukan CPU, memori, dan GPU berkinerja-tinggi, seperti pengenalan gambar, pengenalan ucapan, dan identifikasi perilaku

    • Tugas pemrosesan grafis intensif komputasi yang memerlukan kemampuan virtualisasi grafis 3D berkinerja-tinggi, seperti desain grafis jarak jauh dan cloud gaming

    • Skema yang memerlukan bandwidth jaringan dan bandwidth disk tinggi, seperti pembuatan render farm berkinerja-tinggi

    • Aplikasi pelatihan dan pembelajaran mendalam skala kecil yang memerlukan bandwidth jaringan tinggi

  • Komputasi:

    • Menggunakan GPU NVIDIA A10 yang memiliki fitur berikut:

      • Arsitektur NVIDIA Ampere inovatif

      • Dukungan fitur percepatan seperti vGPU, teknologi RTX, dan mesin inferensi TensorRT

    • Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz yang memberikan frekuensi turbo semua inti 3,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan ultra-tinggi dengan laju pengalihan paket 24.000.000 pps.

Tipe instans ebmgn7i

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.ebmgn7i.32xlarge

128

768

NVIDIA A10 * 4

24GB * 4

64

24.000.000

32

32

10

1

Keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU ebmgn7

  • Pengenalan: Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.

  • Skema penggunaan:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah yang memerlukan kemampuan komputasi GPU kuat, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

  • Komputasi:

    • Menggunakan prosesor Intel® Xeon® Platinum 8269CY (Cascade Lake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

Tipe instans ebmgn7

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.ebmgn7.26xlarge

104

768

40GB*8

30

18.000.000

16

15

10

1

Anda harus memeriksa dan memutuskan apakah akan mengaktifkan atau menonaktifkan fitur MIG setelah memulai instans ebmgn7. Sistem tidak menjamin bahwa fitur MIG diaktifkan atau dinonaktifkan. Untuk informasi selengkapnya tentang MIG, lihat Panduan Pengguna Multi-Instance GPU NVIDIA.

Tabel berikut menjelaskan apakah instans ebmgn7 mendukung MIG.

Tipe instans

Dukungan MIG

Deskripsi

ecs.ebmgn7.26xlarge

Ya

Instans mesin fisik ebmgn7 mendukung MIG.

ebmgn6e, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Pengenalan:

    • Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.

    • Keluarga instans ini menggunakan GPU NVIDIA V100 yang masing-masing memiliki memori GPU 32 GB dan mendukung NVLink.

    • Keluarga instans ini menggunakan GPU NVIDIA V100 (berbasis SXM2) yang memiliki fitur berikut:

      • Arsitektur NVIDIA Volta inovatif

      • 32 GB memori HBM2 (bandwidth 900 GB/s) per GPU

      • 5.120 core CUDA per GPU

      • 640 core Tensor per GPU

      • Hingga enam koneksi NVLink per GPU, masing-masing menyediakan bandwidth 25 GB/s di setiap arah untuk total bandwidth 300 GB/s (6 × 25 × 2 = 300)

  • Skema penggunaan:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

  • Komputasi:

    • Menawarkan rasio CPU-ke-memori 1:8.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

Tipe instans ebmgn6e

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.ebmgn6e.24xlarge

96

768

NVIDIA V100 * 8

32GB * 8

32

4.800.000

16

15

10

1

ebmgn6v, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Pengenalan:

    • Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.

    • Keluarga instans ini menggunakan GPU NVIDIA V100.

    • Keluarga instans ini menggunakan GPU NVIDIA V100 (berbasis SXM2) yang memiliki fitur berikut:

      • Arsitektur NVIDIA Volta inovatif

      • 16 GB memori HBM2 (bandwidth 900 GB/s) per GPU

      • 5.120 core CUDA per GPU

      • 640 core Tensor per GPU

      • Hingga enam koneksi NVLink per GPU, masing-masing menyediakan bandwidth 25 GB/s di setiap arah untuk total bandwidth 300 GB/s (6 × 25 × 2 = 300)

  • Skema penggunaan:

    • Aplikasi pembelajaran mendalam, seperti aplikasi pelatihan dan inferensi algoritma AI untuk klasifikasi gambar, kendaraan otonom, dan pengenalan ucapan

    • Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analitik lingkungan

  • Komputasi:

    • Menawarkan rasio CPU-ke-memori 1:4.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

Tipe instans ebmgn6v

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.ebmgn6v.24xlarge

96

384

NVIDIA V100 * 8

16GB * 8

30

4.500.000

8

32

10

1

ebmgn6i, keluarga instans Mesin Fisik ECS yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Pengenalan:

    • Keluarga instans ini menggunakan arsitektur SHENLONG untuk menyediakan komputasi software-defined yang fleksibel dan kuat.

    • Keluarga instans ini menggunakan GPU NVIDIA T4 yang memiliki fitur berikut:

      • Arsitektur NVIDIA Turing inovatif

      • 16 GB memori (bandwidth 320 GB/s) per GPU

      • 2.560 core CUDA per GPU

      • Hingga 320 core Tensor Turing per GPU

      • Core Tensor presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4

  • Skema penggunaan:

    • Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk visi komputer, pengenalan suara, sintesis suara, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem referensi

    • Rendering real-time untuk cloud gaming

    • Rendering real-time untuk aplikasi Augmented Reality (AR) dan Virtual Reality (VR)

    • Workstation grafis atau komputasi berat grafis

    • Database yang dipercepat GPU

    • Komputasi berkinerja-tinggi

  • Komputasi:

    • Menawarkan rasio CPU-ke-memori 1:4.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

Tipe instans ebmgn6i

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.ebmgn6i.24xlarge

96

384

NVIDIA T4 * 4

16GB * 4

30

4.500.000

8

32

10

1

gn5i, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Skema penggunaan: Beban kerja komputasi GPU sisi server, seperti inferensi pembelajaran mendalam dan enkode/dekode multimedia.

  • Komputasi:

    • Menggunakan GPU NVIDIA P4.

    • Menawarkan rasio CPU-ke-memori 1:4.

    • Menggunakan prosesor Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.

  • Penyimpanan:

    • Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.

    • Mendukung SSD standar dan disk ultra.

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn5i mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.gn5i-c2g1.large

2

8

NVIDIA P4 × 1

8 GB × 1

1

100.000

2

2

6

1

ecs.gn5i-c4g1.xlarge

4

16

NVIDIA P4 × 1

8 GB × 1

1,5

200.000

2

3

10

1

ecs.gn5i-c8g1.2xlarge

8

32

NVIDIA P4 × 1

8 GB × 1

2

400.000

4

4

10

1

ecs.gn5i-c16g1.4xlarge

16

64

NVIDIA P4 × 1

8 GB × 1

3

800.000

4

8

20

1

ecs.gn5i-c16g1.8xlarge

32

128

NVIDIA P4 × 2

8 GB × 2

6

1.200.000

8

8

20

1

ecs.gn5i-c28g1.14xlarge

56

224

NVIDIA P4 × 2

8 GB × 2

10

2.000.000

14

8

20

1

gn5, keluarga instans yang dioptimalkan untuk komputasi dengan akselerasi GPU

  • Skema penggunaan:

    • Pembelajaran mendalam

    • Aplikasi komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, genomika, dan analitik lingkungan

    • Beban kerja komputasi GPU sisi server, seperti komputasi berkinerja-tinggi, rendering, dan enkode/dekode multimedia

  • Komputasi:

    • Menggunakan GPU NVIDIA P100.

    • Menawarkan beberapa rasio CPU-ke-memori.

    • Menggunakan prosesor Intel® Xeon® E5-2682 v4 (Broadwell) 2,5 GHz.

  • Penyimpanan:

    • Mendukung SSD Non-Volatile Memory Express (NVMe) lokal berkinerja-tinggi.

    • Merupakan keluarga instans di mana semua instansnya dioptimalkan untuk I/O.

    • Mendukung SSD standar dan disk ultra.

  • Jaringan:

    • Hanya mendukung IPv4.

    • Menyediakan kinerja jaringan tinggi berdasarkan kapasitas komputasi besar.

gn5 mencakup tipe instans dan data metrik yang tercantum dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Penyimpanan lokal (GiB)

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (pps)

Antrian NIC

ENI

Alamat IPv4 pribadi per ENI

ecs.gn5-c4g1.xlarge

4

30

1 × NVIDIA P100

1 × 16 GB

440

3

300.000

1

3

10

ecs.gn5-c8g1.2xlarge

8

60

1 × NVIDIA P100

1 × 16 GB

440

3

400.000

1

4

10

ecs.gn5-c4g1.2xlarge

8

60

2 × NVIDIA P100

2 × 16 GB

880

5

1.000.000

4

4

10

ecs.gn5-c8g1.4xlarge

16

120

2 × NVIDIA P100

2 × 16 GB

880

5

1.000.000

4

8

20

ecs.gn5-c28g1.7xlarge

28

112

1 × NVIDIA P100

1 × 16 GB

440

5

2.250.000

7

8

10

ecs.gn5-c8g1.8xlarge

32

240

4 × NVIDIA P100

4 × 16 GB

1760

10

2.000.000

8

8

20

ecs.gn5-c28g1.14xlarge

56

224

2 × NVIDIA P100

2 × 16 GB

880

10

4.500.000

14

8

20

ecs.gn5-c8g1.14xlarge

54

480

8 × NVIDIA P100

8 × 16 GB

3520

25

4.000.000

14

8

10