All Products
Search
Document Center

Elastic GPU Service:GPU compute-optimized: gn, ebm, and scc

Last Updated:May 30, 2026

Instans komputasi GPU menyediakan performa tinggi dan paralelisme masif, menjadikannya ideal untuk workload komputasi paralel skala besar. Instans ini meningkatkan performa dan efisiensi komputasi bisnis Anda. Topik ini menjelaskan fitur keluarga instans komputasi GPU Elastic Compute Service (ECS) dan mencantumkan tipe instans yang tersedia.

Catatan

Type

Related links

GPU-accelerated compute-optimized (gn series)

ECS Bare Metal Instance

Not recommended (If this instance family is unavailable, we recommend one of the families listed above.)

gn9gc, GPU-accelerated compute-optimized instance family

Catatan

gn9gc berada dalam pratinjau undangan. Untuk menggunakan gn9gc, kirimkan tiket.

  • Ikhtisar: gn9gc adalah keluarga instans cloud server GPU hemat biaya generasi ke-9 dari Alibaba Cloud. Instans ini menggunakan CIPU generasi terbaru 2.0 untuk memberikan kemampuan layanan cloud, dilengkapi prosesor berkecepatan clock tinggi, serta kapasitas memori yang sesuai. Keluarga instans ini menyediakan instans hemat biaya untuk skenario generasi model bahasa besar (LLM) dan skenario generasi video/gambar. GPU juga dapat langsung menyediakan kemampuan pemrosesan grafis untuk mendukung berbagai workload rendering.

  • Kasus penggunaan:

    • Inferensi LLM: GPU generasi baru memberikan daya komputasi yang melampaui generasi ke-8 dengan bandwidth memori yang jauh lebih baik. Dukungan FP4 yang baru secara komprehensif meningkatkan performa inferensi dan efektivitas biaya. Efisiensi inferensi paralel multi-GPU sangat ditingkatkan.

  • Komputasi:

    • Menggunakan prosesor cloud CIPU 2.0 terbaru.

      • CIPU generasi ke-2 menyediakan daya pemrosesan cloud yang lebih tinggi dengan peningkatan kemampuan komponen eRDMA, VPC, dan EBS. Mendukung kontainer (termasuk namun tidak terbatas pada Docker, Clear Container, dan Pouch).

    • Menggunakan kartu grafis profesional berarsitektur Blackwell generasi baru:

      • Mendukung pemrosesan grafis OpenGL tingkat profesional.

      • Mendukung fitur akselerasi umum seperti RTX, TensorRT, dan lainnya, dengan dukungan FP4 yang baru ditingkatkan serta interkoneksi PCIe Gen5.

    • Spesifikasi utama GPU:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Enkode/dekode video

      Interkoneksi antar-GPU

      API akselerasi

      NVIDIA Blackwell

      • Kapasitas: 72 GB

      • Bandwidth: 1.344 GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 530 TFLOPS

      • FP4: 970 TFLOPS

      • Inti RT: 196 TFLOPS

      • 3 × Enkoder Video

      • 3 × Dekoder Video

      • Antarmuka PCIe: PCIe Gen5 x16

      • Bandwidth: 128 GB/s, P2P didukung

      DX12, OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, DirectCompute

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang IPv6, lihat IPv6.

    • Performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta PPS (instans 8-GPU).

    • Mendukung ERI (Elastic RDMA Interface) untuk akselerasi langsung RDMA melalui jaringan VPC, dengan bandwidth hingga 360 Gbit/s. Cocok untuk workload pelatihan model tradisional, visi komputer, kecerdasan terwujud, dan pengemudi otonom.

    • Catatan

      Untuk informasi selengkapnya tentang ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut menjelaskan tipe instans dalam keluarga instans gn9gc.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth dasar/burst (Gbit/s)

Laju pengalihan paket (pps)

Alamat IPv4 per ENI

Alamat IPv6 per ENI

Antrian NIC (primer/sekunder)

ENI

Disk data maks

Bandwidth disk maks (GB/s)

ecs.gn9gc.4xlarge

16

128

72 GB × 1

16

3,6 juta

30

30

8/32

8

1

1

ecs.gn9gc.8xlarge

32

192

72 GB × 1

32

7,5 juta

30

30

16/64

8

1

1

ecs.gn9gc-2x.16xlarge

64

384

72 GB × 2

65

15 juta

30

30

32/64

15

2

2

ecs.gn9gc-4x.32xlarge

128

768

72 GB × 4

131

30 juta

50

50

64/64

15

4

4

ecs.gn9gc-8x.64xlarge

256

1.536

72 GB × 8

204

30 juta

50

50

128/64

15

6

6

Catatan

Gambar yang digunakan untuk instans gn9gc harus dalam mode boot UEFI. Jika Anda ingin menggunakan gambar kustom, pastikan gambar kustom tersebut mendukung mode boot UEFI dan atribut mode boot gambarnya diatur ke UEFI. Untuk informasi selengkapnya, lihat Atur mode boot gambar kustom ke UEFI dengan memanggil operasi API.

gn8v dan gn8v-tee, GPU-accelerated compute-optimized instance family

Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakannya, hubungi perwakilan penjualan Alibaba Cloud Anda.

  • Pengantar:

    • gn8v: Keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi ke-8 dari Alibaba Cloud untuk pelatihan dan inferensi model AI pada model bahasa ultra-besar (LLM). Keluarga ini menyediakan tipe instans dengan satu, dua, empat, atau delapan GPU untuk berbagai kebutuhan aplikasi.

    • gn8v-tee: Untuk meningkatkan keamanan pelatihan dan inferensi model besar, Alibaba Cloud menawarkan gn8v-tee, keluarga instans generasi ke-8 berbasis gn8v dengan fitur komputasi rahasia. Instans ini mengenkripsi data selama komputasi GPU untuk melindungi data Anda.

  • Kasus penggunaan:

    • Hemat biaya untuk inferensi paralel multi-GPU pada LLM dengan lebih dari 70 miliar parameter.

    • Setiap GPU menyediakan daya komputasi FP32 sebesar 39,5 TFLOPS dan memberikan performa luar biasa untuk workload pelatihan model AI tradisional dan pelatihan pengemudi otonom.

    • Delapan GPU mendukung konektivitas NVLink dan cocok untuk pelatihan model skala kecil hingga menengah.

  • Fitur:

    • Memori GPU berkapasitas besar dan berkecepatan tinggi: Setiap GPU dilengkapi memori GPU HBM3 96 GB dan menyediakan bandwidth memori hingga 4 TB/s, yang secara signifikan mempercepat pelatihan dan inferensi model.

    • Bandwidth antar-GPU tinggi: Beberapa GPU saling terhubung melalui NVLink pada 900 GB/s. Hal ini memungkinkan efisiensi pelatihan dan inferensi multi-GPU yang jauh lebih tinggi dibandingkan instans GPU generasi sebelumnya.

    • Kuantisasi LLM: Mendukung daya komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan pelatihan dan inferensi serta mengurangi penggunaan memori GPU.

    • (Hanya untuk instans gn8v-tee) Keamanan tinggi: Mendukung komputasi rahasia CPU dengan Intel® Trust Domain Extensions (TDX) dan komputasi rahasia GPU dengan NVIDIA Confidential Computing (CC). Ini menyediakan komputasi rahasia end-to-end untuk seluruh pipeline inferensi model, melindungi data inferensi dan model perusahaan Anda selama pelatihan dan inferensi model.

  • Komputasi:

    • Didukung oleh CIPU 1.0 terbaru.

      • Memisahkan komputasi dari penyimpanan, sehingga Anda dapat secara fleksibel memilih sumber daya penyimpanan yang Anda butuhkan.

      • Menyediakan kemampuan bare metal, yang mendukung komunikasi peer-to-peer (P2P) antar instans GPU, berbeda dengan instans virtualisasi tradisional.

    • Didukung oleh prosesor Intel® Xeon® Scalable generasi ke-4 dengan frekuensi dasar hingga 2,8 GHz dan frekuensi turbo semua-core hingga 3,1 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Instans ini mendukung frame jumbo. Untuk informasi selengkapnya, lihat Frame jumbo.

    • Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket hingga 30 juta pps (pada instans 8-GPU).

    • Mendukung antarmuka RDMA elastis (ERI).

    • Catatan

      Untuk informasi tentang cara menggunakan ERI, lihat Aktifkan pada instans enterprise-level.

  • Keamanan: Mendukung fitur komputasi tepercaya (vTPM). Fitur ini tersedia pada instans gn8v tetapi tidak pada instans gn8v-tee. Untuk informasi selengkapnya, lihat Ikhtisar kemampuan komputasi tepercaya.

Tabel berikut menjelaskan tipe instans dalam keluarga gn8v.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan (Gbit/s)

ENI

Antrian ENI primer

Alamat IPv4 per ENI

Alamat IPv6 per ENI

Disk cloud maks

IOPS dasar

Bandwidth dasar (GB/s)

ecs.gn8v.4xlarge

16

96

96 GB × 1

12

8

16

30

30

17

100.000

0,75

ecs.gn8v.6xlarge

24

128

96 GB × 1

15

8

24

30

30

17

120.000

0,937

ecs.gn8v-2x.8xlarge

32

192

96 GB × 2

20

8

32

30

30

25

200.000

1,25

ecs.gn8v-4x.8xlarge

32

384

96 GB × 4

20

8

32

30

30

25

200.000

1,25

ecs.gn8v-2x.12xlarge

48

256

96 GB × 2

25

8

48

30

30

33

300.000

1,50

ecs.gn8v-8x.16xlarge

64

768

96 GB × 8

32

8

64

30

30

33

360.000

2,5

ecs.gn8v-4x.24xlarge

96

512

96 GB × 4

50

15

64

30

30

49

500.000

3

ecs.gn8v-8x.48xlarge

192

1024

96 GB × 8

100

15

64

50

50

65

1.000.000

6

Tabel berikut menjelaskan tipe instans dalam keluarga gn8v-tee .

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan (Gbit/s)

ENI

Antrian ENI primer

Alamat IPv4 per ENI

Alamat IPv6 per ENI

Disk cloud maks

IOPS dasar

Bandwidth dasar (GB/s)

ecs.gn8v-tee.4xlarge

16

96

96 GB × 1

12

8

16

30

30

17

100.000

0,75

ecs.gn8v-tee.6xlarge

24

128

96 GB × 1

15

8

24

30

30

17

120.000

0,937

ecs.gn8v-tee-8x.16xlarge

64

768

96 GB × 8

32

8

64

30

30

33

360.000

2,5

ecs.gn8v-tee-8x.48xlarge

192

1024

96 GB × 8

100

15

64

50

50

65

1.000.000

6

Catatan

Keluarga instans gn8v-tee hanya mendukung gambar Alibaba Cloud Linux 3. Jika Anda menggunakan gambar kustom yang dibuat berdasarkan Alibaba Cloud Linux 3 untuk membuat instans, pastikan versi kernelnya 5.10.134-18 atau yang lebih baru.

gn8is, GPU-accelerated compute-optimized instance family

Keluarga instans ini tersedia di wilayah tertentu, termasuk wilayah luar Tiongkok daratan. Untuk menggunakan keluarga instans ini, hubungi perwakilan penjualan Alibaba Cloud Anda.

  • Pengantar: gn8is adalah keluarga instans komputasi dioptimalkan dengan akselerasi GPU generasi kedelapan dari Alibaba Cloud, dirancang untuk memenuhi permintaan yang terus berkembang dari konten yang dihasilkan AI (AIGC). Didukung oleh GPU NVIDIA L20 generasi terbaru, keluarga ini menawarkan tipe instans dengan satu, dua, empat, atau delapan GPU, serta berbagai rasio CPU-ke-GPU untuk memenuhi kebutuhan aplikasi yang beragam.

  • Fitur:

    • Pemrosesan grafis: Didukung oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi ke-4, instans ini menyediakan daya komputasi CPU yang kuat untuk skenario pemodelan 3D, memastikan rendering grafis dan alur kerja desain yang lebih lancar.

    • Tugas inferensi: Dilengkapi dengan GPU NVIDIA L20 baru, masing-masing dengan memori GPU 48 GB, instans ini mempercepat tugas inferensi. Mereka mendukung format floating-point FP8 dan dapat dipasangkan dengan Container Service for Kubernetes (ACK) untuk menjalankan inferensi secara fleksibel untuk berbagai model AIGC. Mereka sangat cocok untuk tugas inferensi pada model bahasa besar (LLM) dengan kurang dari 70 miliar parameter.

  • Kasus penggunaan:

    • Gunakan driver GRID dengan gambar dari Alibaba Cloud Marketplace untuk mengaktifkan kemampuan OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk workload seperti animasi, efek khusus film dan televisi, dan rendering.

    • Gunakan kemampuan manajemen kontainer Container Service for Kubernetes (ACK) untuk menghasilkan gambar AIGC dan inferensi LLM yang lebih efisien dan hemat biaya.

    • Aplikasi AI tujuan umum lainnya, seperti pengenalan gambar dan pengenalan suara.

  • Komputasi:

    • Didukung oleh GPU NVIDIA L20 tingkat enterprise baru.

      • Mendukung fitur akselerasi umum seperti TensorRT dan format floating-point FP8 untuk meningkatkan performa inferensi model.

      • Hingga 48 GB memori GPU per GPU. Dengan beberapa GPU, instans dalam keluarga ini mendukung inferensi single-instance untuk model dengan 70 miliar atau lebih parameter.

      • Kemampuan pemrosesan grafis yang ditingkatkan. Setelah Anda menginstal driver GRID menggunakan Cloud Assistant atau gambar dari Alibaba Cloud Marketplace, performa pemrosesan grafis menjadi dua kali lipat dari platform generasi ke-7.

    • Parameter utama GPU NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Enkode/dekode video

      Konektivitas antar-GPU

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: N/A

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 × Enkoder Video (+AV1)

      • 3 × Dekoder Video

      • 4 × Dekoder JPEG

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Prosesor: Didukung oleh prosesor Intel® Xeon® frekuensi tinggi terbaru dengan frekuensi turbo semua-core hingga 3,9 GHz untuk menangani permintaan pemodelan 3D yang kompleks.

  • Penyimpanan:

  • Jaringan:

  • Keamanan: Instans ini mendukung fitur vTPM. Untuk informasi selengkapnya, lihat Ikhtisar komputasi tepercaya.

Tabel berikut menjelaskan tipe dan spesifikasi instans untuk keluarga gn8is.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

ENI

Antrian ENI primer

Alamat IPv4 privat

Alamat IPv6

Disk cloud maks

IOPS disk

Bandwidth disk (GB/s)

ecs.gn8is.2xlarge

8

64

L20 × 1

48 GB × 1

8

4

8

15

15

17

60.000

0,75

ecs.gn8is.4xlarge

16

128

L20 × 1

48 GB × 1

16

8

16

30

30

17

120.000

1,25

ecs.gn8is-2x.8xlarge

32

256

L20 × 2

48 GB × 2

32

8

32

30

30

33

250.000

2

ecs.gn8is-4x.16xlarge

64

512

L20 × 4

48 GB × 4

64

8

64

30

30

33

450.000

4

ecs.gn8is-8x.32xlarge

128

1024

L20 × 8

48 GB × 8

100

15

64

50

50

65

900.000

8

gn7e, GPU-accelerated compute-optimized instance family

Fitur keluarga instans gn7e meliputi:

  • Ikhtisar:

    • keluarga instans ini memungkinkan Anda memilih tipe instans dengan jumlah GPU dan sumber daya CPU yang berbeda untuk memenuhi berbagai kebutuhan bisnis AI Anda.

    • Dibangun di atas arsitektur X-Dragon generasi ketiga, instans gn7e memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan dengan generasi sebelumnya.

  • Kasus penggunaan:

    • Workload pelatihan AI skala kecil dan menengah.

    • Workload komputasi berkinerja tinggi (HPC) yang dipercepat menggunakan CUDA.

    • Workload inferensi AI yang memerlukan performa komputasi GPU tinggi atau memori GPU besar.

    • Pembelajaran mendalam, seperti pelatihan algoritma AI untuk klasifikasi gambar, pengemudi otonom, dan pengenalan suara.

    • Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

    Penting

    Saat menjalankan workload pelatihan AI dengan beban komunikasi tinggi, seperti model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi antar-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin tentang topologi tautan komunikasi untuk workload pelatihan Anda, kirimkan tiket untuk mendapatkan dukungan dari pakar teknis Alibaba Cloud.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans gn7e mencakup tipe dan spesifikasi instans yang dijelaskan dalam tabel berikut.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth dasar (Gbit/s)

Laju pengalihan (pps)

Antrian

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.gn7e-c16g1.4xlarge

16

125

80 GB × 1

8

3.000.000

8

8

10

1

ecs.gn7e-c16g1.8xlarge

32

250

80 GB × 2

16

6.000.000

16

8

10

1

ecs.gn7e-c16g1.16xlarge

64

500

80 GB × 4

32

12.000.000

32

8

10

1

ecs.gn7e-c16g1.32xlarge

128

1000

80 GB × 8

64

24.000.000

32

16

15

1

gn7i, GPU-accelerated compute-optimized instance family

  • Ikhtisar: Didukung oleh arsitektur SHENLONG generasi ketiga, instans gn7i memberikan performa tinggi yang stabil dan dapat diprediksi. Mereka menggunakan akselerasi jalur cepat berbasis chip untuk meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi hingga satu orde besaran.

  • Kasus penggunaan:

    • Dilengkapi CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk tugas inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan pengenalan perilaku.

    • Instans ini mendukung fitur RTX dan menggunakan CPU frekuensi tinggi untuk memberikan virtualisasi grafis 3D berperforma tinggi. Mereka cocok untuk workload intensif grafis, seperti desain grafis jarak jauh dan cloud gaming.

  • Komputasi:

    • Dilengkapi akselerator GPU NVIDIA A10 yang memiliki:

      • Arsitektur inovatif NVIDIA Ampere.

      • Dukungan untuk fitur akselerasi umum seperti RTX dan TensorRT.

    • Prosesor: Prosesor Intel ® Xeon ® Scalable 2,9 GHz (Ice Lake) dengan frekuensi turbo semua-core 3,5 GHz.

    • Keluarga instans ini menyediakan hingga 752 GiB memori, peningkatan signifikan dibandingkan keluarga instans gn6i.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans. Tipe instans yang lebih besar menawarkan performa jaringan yang lebih baik.

Keluarga instans gn7i mencakup tipe dan spesifikasi instans berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

Laju paket (PPS)

Antrian NIC

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.gn7i-c8g1.2xlarge

8

30

NVIDIA A10 * 1

24 GB * 1

16

1.600.000

8

4

15

15

ecs.gn7i-c16g1.4xlarge

16

60

NVIDIA A10 * 1

24 GB * 1

16

3.000.000

8

8

30

30

ecs.gn7i-c32g1.8xlarge

32

188

NVIDIA A10 * 1

24 GB * 1

16

6.000.000

12

8

30

30

ecs.gn7i-c32g1.16xlarge

64

376

NVIDIA A10 * 2

24 GB * 2

32

12.000.000

16

15

30

30

ecs.gn7i-c32g1.32xlarge

128

752

NVIDIA A10 * 4

24 GB * 4

64

24.000.000

32

15

30

30

ecs.gn7i-c48g1.12xlarge

48

310

NVIDIA A10 * 1

24 GB * 1

16

9.000.000

16

8

30

30

ecs.gn7i-c56g1.14xlarge

56

346

NVIDIA A10 * 1

24 GB * 1

16

10.000.000

16

8

30

30

ecs.gn7i-2x.8xlarge

32

128

NVIDIA A10 * 2

24 GB * 2

16

6.000.000

16

8

30

30

ecs.gn7i-4x.8xlarge

32

128

NVIDIA A10 * 4

24 GB * 4

32

6.000.000

16

8

30

30

ecs.gn7i-4x.16xlarge

64

256

NVIDIA A10 * 4

24 GB * 4

64

12.000.000

32

8

30

30

ecs.gn7i-8x.32xlarge

128

512

NVIDIA A10 * 8

24 GB * 8

64

24.000.000

32

16

30

30

ecs.gn7i-8x.16xlarge

64

256

NVIDIA A10 * 8

24 GB * 8

32

12.000.000

32

8

30

30

Penting

Anda dapat mengubah instans tipe ecs.gn7i-2x.8xlarge, ecs.gn7i-4x.8xlarge, ecs.gn7i-4x.16xlarge, ecs.gn7i-8x.32xlarge, dan ecs.gn7i-8x.16xlarge menjadi ecs.gn7i-c8g1.2xlarge atau ecs.gn7i-c16g1.4xlarge. Namun, Anda tidak dapat mengubahnya menjadi tipe instans lain seperti ecs.gn7i-c32g1.8xlarge.

gn7s, GPU-accelerated compute-optimized instance family

Untuk menggunakan keluarga instans gn7s, kirimkan tiket.

  • Pengantar:

    • Keluarga instans ini didukung oleh prosesor Intel Ice Lake terbaru dan GPU NVIDIA A30 berbasis arsitektur NVIDIA Ampere. Keluarga ini menawarkan berbagai tipe instans dengan konfigurasi GPU dan CPU yang berbeda untuk memenuhi kebutuhan AI spesifik Anda.

    • Dibangun di atas arsitektur SHENLONG generasi ketiga Alibaba Cloud, instans gn7s memberikan bandwidth jaringan rata-rata dua kali lipat untuk VPC dan disk cloud dibandingkan dengan generasi sebelumnya.

  • Kasus penggunaan: Menampilkan CPU, memori, dan GPU berperforma tinggi, instans ini ideal untuk workload inferensi AI konkuren, seperti pengenalan gambar, pengenalan suara, dan identifikasi perilaku.

  • Komputasi:

    • Menampilkan GPU NVIDIA A30, yang mencakup:

      • Arsitektur inovatif NVIDIA Ampere.

      • Dukungan untuk fitur Multi-Instance GPU (MIG) dan akselerasi berbasis Tensor Core generasi kedua untuk berbagai workload.

    • Prosesor: Prosesor Intel ® Xeon ® Scalable 2,9 GHz (Ice Lake) dengan frekuensi turbo semua-core 3,5 GHz.

    • Menawarkan memori yang jauh lebih banyak dibandingkan keluarga instans generasi sebelumnya.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn7s mencakup tipe dan spesifikasi instans berikut:

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

Laju paket (pps)

IPv4 privat per ENI

IPv6 per ENI

Multi-antrian

ENI

ecs.gn7s-c8g1.2xlarge

8

60

NVIDIA A30 * 1

24GB * 1

16

1.600.000

5

1

8

4

ecs.gn7s-c16g1.4xlarge

16

120

NVIDIA A30 * 1

24GB * 1

16

3.000.000

5

1

8

8

ecs.gn7s-c32g1.8xlarge

32

250

NVIDIA A30 * 1

24GB * 1

16

6.000.000

5

1

12

8

ecs.gn7s-c32g1.16xlarge

64

500

NVIDIA A30 * 2

24GB * 2

32

12.000.000

5

1

16

15

ecs.gn7s-c32g1.32xlarge

128

1000

NVIDIA A30 * 4

24GB * 4

64

24.000.000

10

1

32

15

ecs.gn7s-c48g1.12xlarge

48

380

NVIDIA A30 * 1

24GB * 1

16

9.000.000

8

1

16

8

ecs.gn7s-c56g1.14xlarge

56

440

NVIDIA A30 * 1

24GB * 1

16

10.000.000

8

1

16

8

gn7, GPU-accelerated compute-optimized instance family

  • Skenario:

    • Pembelajaran mendalam, seperti pelatihan algoritma AI yang digunakan dalam klasifikasi gambar, pengemudi otonom, dan pengenalan suara.

    • Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga gn7.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan (Gbit/s)

Laju paket (pps)

Antrian NIC

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.gn7-c12g1.3xlarge

12

94

40 GB × 1

4

2.500.000

4

8

10

1

ecs.gn7-c13g1.13xlarge

52

378

40 GB × 4

16

9.000.000

16

8

30

30

ecs.gn7-c13g1.26xlarge

104

756

40 GB × 8

30

18.000.000

16

15

10

1

gn6i, GPU-accelerated compute-optimized instance family

  • Kasus penggunaan:

    • Inferensi AI (pembelajaran mendalam dan pembelajaran mesin) untuk aplikasi seperti visi komputer, pengenalan suara, sintesis suara, pemrosesan bahasa alami (NLP), penerjemahan mesin, dan sistem rekomendasi.

    • Rendering real-time untuk cloud gaming.

    • Rendering real-time berbasis cloud untuk augmented reality (AR) dan virtual reality (VR).

    • Komputasi atau workstation grafis yang intensif grafis.

    • Database yang dipercepat GPU.

    • Komputasi berkinerja tinggi (HPC).

  • Komputasi:

    • Dilengkapi akselerator GPU NVIDIA T4, yang memiliki:

      • Arsitektur inovatif NVIDIA Turing.

      • 16 GB memori per GPU dengan bandwidth memori 320 GB/s.

      • 2.560 core CUDA per GPU.

      • Hingga 320 Tensor Core Turing per GPU.

      • Tensor Core presisi campuran yang mendukung 65 TFLOPS FP16, 130 TOPS INT8, dan 260 TOPS INT4.

    • Rasio vCPU-ke-memori sekitar 1:4.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk detailnya, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn6i mencakup tipe instans berikut.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

Laju paket (pps)

IOPS disk

Multi-antrian

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.gn6i-c4g1.xlarge

4

15

NVIDIA T4 × 1

16 GB × 1

4

2.500.000

N/A

2

2

10

1

ecs.gn6i-c8g1.2xlarge

8

31

NVIDIA T4 × 1

16 GB × 1

5

2.500.000

N/A

2

2

10

1

ecs.gn6i-c16g1.4xlarge

16

62

NVIDIA T4 × 1

16 GB × 1

6

2.500.000

N/A

4

3

10

1

ecs.gn6i-c24g1.6xlarge

24

93

NVIDIA T4 × 1

16 GB × 1

7,5

2.500.000

N/A

6

4

10

1

ecs.gn6i-c40g1.10xlarge

40

155

NVIDIA T4 × 1

16 GB × 1

10

2.500.000

N/A

16

10

10

1

ecs.gn6i-c24g1.12xlarge

48

186

NVIDIA T4 × 2

16 GB × 2

15

4.500.000

N/A

12

6

10

1

ecs.gn6i-c24g1.24xlarge

96

372

NVIDIA T4 × 4

16 GB × 4

30

4.500.000

250.000

24

8

10

1

gn6e, GPU-accelerated compute-optimized instance family

  • Kasus penggunaan:

    • Aplikasi pembelajaran mendalam, seperti pelatihan dan inferensi untuk algoritma AI untuk klasifikasi gambar, pengemudi otonom, dan pengenalan suara.

    • Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

  • Komputasi:

    • Menampilkan kartu GPU NVIDIA V100 (32 GB NVLink).

    • Akselerator GPU: V100 (paket SXM2).

      • Arsitektur inovatif NVIDIA Volta.

      • 32 GB memori HBM2 per GPU dengan bandwidth memori GPU 900 GB/s.

      • 5.120 Core CUDA per GPU.

      • 640 Tensor Core per GPU.

      • Setiap GPU mendukung enam koneksi NVLink dua arah, masing-masing menyediakan bandwidth 25 Gbit/s di setiap arah untuk total 300 Gbit/s.

    • Menampilkan rasio vCPU-ke-memori sekitar 1:8.

    • Prosesor: Intel ® Xeon ® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans.

gn6e mencakup tipe dan spesifikasi instans yang tercantum dalam tabel di bawah ini.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth dasar (Gbit/s)

Laju paket (PPS)

Antrian NIC

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.gn6e-c12g1.3xlarge

12

92

1 × NVIDIA V100

1 × 32 GB

5

800.000

8

6

10

1

ecs.gn6e-c12g1.6xlarge

24

184

2 × NVIDIA V100

2 × 32 GB

8

1.200.000

8

8

20

1

ecs.gn6e-c12g1.12xlarge

48

368

4 × NVIDIA V100

4 × 32 GB

16

2.400.000

8

8

20

1

ecs.gn6e-c12g1.24xlarge

96

736

8 × NVIDIA V100

8 × 32 GB

32

4.500.000

16

8

20

1

gn6v, GPU-accelerated compute-optimized instance family

  • Kasus penggunaan:

    • Aplikasi pembelajaran mendalam, seperti pelatihan dan inferensi untuk algoritma AI dalam klasifikasi gambar, pengemudi otonom, dan pengenalan suara.

    • Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

  • Komputasi:

    • Dilengkapi GPU NVIDIA V100.

    • Akselerator GPU: V100 (paket SXM2).

      • Arsitektur inovatif NVIDIA Volta.

      • 16 GB memori HBM2 GPU per GPU dengan bandwidth memori 900 GB/s.

      • 5.120 Core CUDA per GPU.

      • 640 Tensor Core per GPU.

      • Hingga enam koneksi NVLink dua arah per GPU. Setiap koneksi menyediakan bandwidth 25 Gbit/s di setiap arah, untuk total bandwidth 300 Gbit/s.

    • Menampilkan rasio vCPU-ke-memori sekitar 1:4.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi selengkapnya, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans.

Keluarga instans gn6v mencakup tipe dan spesifikasi instans yang tercantum di bawah ini.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

Laju paket (pps)

IOPS baseline disk

Multi-antrian

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.gn6v-c8g1.2xlarge

8

32

1 × NVIDIA V100

1 × 16 GB

2,5

800.000

N/A

4

4

10

1

ecs.gn6v-c8g1.4xlarge

16

64

2 × NVIDIA V100

2 × 16 GB

5

1.000.000

N/A

4

8

20

1

ecs.gn6v-c8g1.8xlarge

32

128

4 × NVIDIA V100

4 × 16 GB

10

2.000.000

N/A

8

8

20

1

ecs.gn6v-c8g1.16xlarge

64

256

8 × NVIDIA V100

8 × 16 GB

20

2.500.000

N/A

16

8

20

1

ecs.gn6v-c10g1.20xlarge

82

336

8 × NVIDIA V100

8 × 16 GB

35

4.500.000

250.000

16

8

20

1

GPU elastic bare metal server instance family ebmgn9g

Penting

Keluarga instans ebmgn9g hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.

  • Pengantar keluarga instans: Keluarga instans ebmgn9g adalah lini instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, kapasitas memori besar, dan GPU profesional berarsitektur Blackwell terbaru. Mereka memberikan layanan cloud GPU berperforma tinggi dan hemat biaya untuk berbagai workload akselerasi, seperti pelatihan untuk pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan untuk metaverse dan cloud gaming.

  • Kasus penggunaan dan fitur:

    • Pengemudi otonom/kecerdasan terwujud:
      Dengan 256 vCPU yang berjalan pada frekuensi semua-core hingga 4,2 GHz dan memori 2.304 GiB, instans ini menangani kebutuhan pemrosesan data yang menuntut untuk pelatihan pengemudi otonom dan kecerdasan terwujud.

    • Pencarian dan rekomendasi:
      GPU Blackwell menyediakan daya komputasi TF32 sebesar 123 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, menjadikannya konfigurasi optimal untuk layanan pencarian dan periklanan.

    • Inferensi model besar:
      GPU generasi baru menawarkan lompatan performa signifikan dibandingkan pendahulunya, dengan bandwidth memori video meningkat menjadi 1.344 GB/s. Dukungan untuk daya komputasi FP4 secara signifikan meningkatkan performa dan efektivitas biaya inferensi. Delapan GPU saling terhubung melalui PCIe Gen5 dengan bandwidth 128 GB/s. Koneksi ini secara dramatis meningkatkan efisiensi inferensi paralel multi-kartu.

    • Cloud gaming/rendering/metaverse:
      Dengan frekuensi CPU hingga 5 GHz, instans ini merupakan pilihan unggul untuk pemodelan 3D. GPU menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikan instans ini pilihan optimal untuk pengembangan film dan animasi high-end serta desain CAD.

  • Didukung oleh CIPU 2.0 terbaru:

    CIPU generasi kedua menawarkan daya pemrosesan yang lebih tinggi, meningkatkan performa komponen eRDMA, VPC, dan disk cloud. Instans bare metal ideal untuk workload yang memerlukan akses langsung ke sumber daya fisik atau memiliki persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, termasuk namun tidak terbatas pada Docker, Clear Containers, dan PouchContainer.

  • Komputasi:

    • Didukung oleh GPU profesional berarsitektur Blackwell terbaru:

      • Mendukung pemrosesan grafis OpenGL tingkat profesional.

      • Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dengan dukungan tambahan untuk FP4 dan interkoneksi PCIe Gen5.

      • Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-kartu.

    • Spesifikasi utama GPU:

      Arsitektur GPU

      Memori video

      Performa komputasi

      Enjin enkode/dekode

      Interkoneksi antar-GPU

      API akselerasi

      Blackwell

      • Kapasitas: 48 GB

      • Bandwidth: 1.344 GB/s

      • TF32: 123 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 261 TFLOPS

      • FP8/INT8: 533 TFLOPS

      • FP4: 970 TFLOPS

      • Inti RT: 196 TFLOPS

      • 3 × Enkoder Video

      • 3 × Dekoder Video

      • PCIe Gen5 x16: 128 GB/s

      • Mendukung P2P

      Mendukung DX12,

      OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

    • Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5 GHz dan turbo semua-core hingga 4,2 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Memberikan performa jaringan hingga 30 juta PPS Jaringan.

    • Mendukung eRDMA, yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. eRDMA meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan eRDMA, lihat Aktifkan eRDMA untuk instans enterprise-level.

Tabel berikut mencantumkan spesifikasi untuk keluarga instans ebmgn9g.

Tipe instans

vCPU

Memori (GiB)

Memori video

Bandwidth jaringan (Gbit/s)

PPS Jaringan

Alamat IPv4 privat

Alamat IPv6

Antrian (primer/sekunder)

ENI

Disk data maks

Bandwidth disk cloud (GB/s)

ecs.ebmgn9g.64xlarge

256

2304

48 GB × 8

360 (180 × 2)

30 juta

30

30

64/16

38

33

8

Catatan

Instans ebmgn9g memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU elastic bare metal server instance family ebmgn9ge

Penting

Keluarga instans ebmgn9ge hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.

  • Pengantar: Keluarga instans ebmgn9ge adalah instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, kapasitas memori besar, dan GPU profesional berarsitektur Blackwell terbaru. Mereka memberikan layanan cloud GPU berperforma tinggi dan hemat biaya untuk berbagai workload akselerasi, termasuk pelatihan pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan metaverse dan cloud gaming.

  • Kasus penggunaan dan fitur:

    • Pengemudi otonom dan kecerdasan terwujud:
      Dengan 256 vCPU yang berjalan pada frekuensi semua-core lebih dari 4,2 GHz dan memori 2,3 TB, instans ini memenuhi kebutuhan pemrosesan data yang menuntut untuk pelatihan pengemudi otonom dan kecerdasan terwujud.

    • Pencarian dan rekomendasi:
      GPU Blackwell menyediakan daya komputasi TF32 sebesar 126 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk layanan pencarian dan periklanan.

    • Inferensi model besar:

      Keluarga instans ebmgn9ge dirancang khusus untuk model bahasa besar, menawarkan memori GPU 72 GB per GPU. Bandwidth memori GPU mencapai 1.344 GB/s, memberikan inferensi berperforma tinggi untuk skenario LLM. Dikombinasikan dengan arsitektur komputasi FP4 baru dan bandwidth PCIe Gen5 128 GB/s, satu instans dapat mendukung inferensi paralel untuk model dengan lebih dari 671 miliar parameter di 8 GPU.

    • Cloud gaming, rendering, dan metaverse:
      Dengan frekuensi CPU hingga 5 GHz, instans ini sangat cocok untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikannya ideal untuk pengembangan film dan animasi high-end serta desain CAD.

  • Didukung oleh CIPU 2.0 terbaru:

    CIPU generasi ke-2 memberikan daya pemrosesan cloud yang lebih besar, meningkatkan performa untuk komponen eRDMA, VPC, dan EBS. Instans bare metal memungkinkan workload mengakses sumber daya fisik secara langsung atau memenuhi persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, seperti Docker, Clear Containers, dan Pouch.

  • Komputasi:

    • Didukung oleh GPU profesional berarsitektur Blackwell terbaru:

      • Mendukung pemrosesan grafis OpenGL tingkat profesional.

      • Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dan menambahkan dukungan untuk komputasi FP4 dan interkoneksi PCIe Gen5.

      • Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-GPU.

    • Spesifikasi utama GPU:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Enjin enkode/dekode video

      Interkoneksi antar-GPU

      API dipercepat

      Blackwell

      • Kapasitas: 72 GB

      • Bandwidth: 1.344 GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 530 TFLOPS

      • FP4: 971 TFLOPS

      • Inti RT: 196 TFLOPS

      • 3 × Enkoder Video

      • 3 × Dekoder Video

      • PCIe Gen5 x16: 128 GB/s

      • Mendukung P2P

      Mendukung DX12,

      OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

    • Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5 GHz dan turbo semua-core hingga 4,2 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Memberikan performa jaringan hingga 30 juta paket jaringan per detik (PPS).

    • Mendukung ERI (Elastic RDMA Interface), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn9ge.

Catatan

Untuk versi dengan memori lebih rendah, Anda dapat memilih ebmgn9gc.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

PPS Jaringan

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Pasangan antrian (ENI primer/sekunder)

ENI

Disk data yang dapat dilampirkan maks

Bandwidth disk cloud maks (GB/s)

ecs.ebmgn9ge.64xlarge

256

2.304

72 GB × 8

360 (180 × 2)

30 juta

30

30

64/16

38

33

8

Catatan

Instans dari keluarga instans ebmgn9ge memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan bahwa gambar tersebut mendukung mode boot UEFI dan bahwa properti mode boot-nya disetel ke UEFI. Untuk informasi selengkapnya, lihat Mode Boot Instans.

GPU-accelerated elastic bare metal instance family ebmgn9gc

Penting

Keluarga instans ebmgn9gc hanya tersedia berdasarkan undangan. Untuk meminta akses, kirimkan tiket.

  • Pengantar: Keluarga instans ebmgn9gc adalah instans bare metal GPU penuh fitur dan hemat biaya generasi kesembilan dari Alibaba Cloud. Didukung oleh CIPU 2.0 terbaru, instans ini menggabungkan CPU frekuensi tinggi, memori kapasitas besar, dan GPU profesional berarsitektur Blackwell terbaru untuk memberikan layanan cloud GPU hemat biaya untuk berbagai workload akselerasi, termasuk pelatihan pengemudi otonom dan kecerdasan terwujud, inferensi model besar, rendering film dan animasi, serta layanan metaverse dan cloud gaming.

  • Kasus penggunaan dan fitur:

    • Pengemudi otonom dan kecerdasan terwujud:
      Menawarkan 256 vCPU dengan rentang frekuensi 3,3 GHz hingga 5,0 GHz dan turbo semua-core hingga 4,2 GHz. Dipasangkan dengan memori 1,5 TB, instans ini memenuhi permintaan pemrosesan data untuk pelatihan pengemudi otonom dan kecerdasan terwujud.

    • Pencarian dan rekomendasi:
      GPU Blackwell yang dilengkapi menyediakan komputasi TF32 berperforma tinggi sebesar 126 TFLOPS. Setiap GPU dipasangkan dengan 32 vCPU dan bandwidth memori 153 GB/s, memberikan konfigurasi optimal untuk layanan pencarian dan periklanan.

    • Inferensi model besar:

      Instans ebmgn9gc dirancang untuk model bahasa besar. Dengan memori GPU 72 GB dan bandwidth memori 1.344 GB/s per GPU, mereka memberikan inferensi berperforma tinggi untuk skenario LLM. Dikombinasikan dengan arsitektur komputasi FP4 baru dan bandwidth PCIe Gen5 128 GB/s, instans 8-kartu dapat mendukung inferensi paralel untuk model dengan lebih dari 671 miliar parameter.

    • Cloud gaming, rendering, dan metaverse:
      Dengan frekuensi CPU hingga 5,0 GHz, instans ini sangat cocok untuk pemodelan 3D. GPU secara native mendukung kemampuan grafis dan menyediakan driver grafis workstation bersertifikasi dengan akselerasi OpenGL penuh, menjadikannya pilihan yang baik untuk pengembangan film dan animasi high-end serta desain CAD.

  • Didukung oleh CIPU 2.0 terbaru:

    CIPU generasi ke-2 menawarkan daya pemrosesan cloud yang lebih tinggi dan kemampuan komputasi yang ditingkatkan untuk eRDMA, VPC, dan penyimpanan blok. Instans bare metal memungkinkan workload mengakses sumber daya fisik secara langsung atau memenuhi persyaratan seperti lisensi berbasis perangkat keras. Mereka juga mendukung kontainer, seperti Docker, Clear Container, dan Pouch.

  • Komputasi:

    • Didukung oleh GPU profesional berarsitektur Blackwell terbaru:

      • Mendukung fitur pemrosesan grafis tingkat profesional.

      • Mendukung fitur akselerasi umum seperti RTX dan TensorRT, dan menambahkan dukungan untuk FP4 dan interkoneksi PCIe Gen5.

      • Menggunakan switch PCIe untuk interkoneksi, yang meningkatkan performa NCCL sebesar 36% dibandingkan koneksi langsung ke CPU. Hal ini dapat meningkatkan performa hingga 9% untuk inferensi model besar dengan sharding multi-kartu.

    • Parameter utama GPU:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Enkode/dekode video

      Interkoneksi GPU-ke-GPU

      API akselerasi

      Blackwell

      • Kapasitas: 72 GB

      • Bandwidth: 1.344 GB/s

      • TF32: 126 TFLOPS

      • FP32: 52 TFLOPS

      • FP16/BF16: 266 TFLOPS

      • FP8/INT8: 530 TFLOPS

      • FP4: 971 TFLOPS

      • Inti RT: 196 TFLOPS

      • 3 × Enkoder Video

      • 3 × Dekoder Video

      • PCIe Gen5 x16: 128 GB/s

      • Mendukung P2P

      Mendukung DX12,

      OpenGL 4.6, Vulkan 1.3, CUDA 12.8, OpenCL 3.0, dan DirectCompute

    • Prosesor: Prosesor AMD Turin-C dengan rentang frekuensi 3,3 GHz hingga 5,0 GHz dan turbo semua-core hingga 4,2 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Memberikan performa jaringan hingga 30 juta paket per detik (PPS).

    • Mendukung RDMA elastis (eRDMA), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. eRDMA meningkatkan bandwidth menjadi 360 Gbit/s dan ideal untuk workload pelatihan dalam pengemudi otonom, kecerdasan terwujud, visi komputer (CV), dan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan eRDMA, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn9gc.

Catatan

Untuk versi dengan memori lebih banyak, Anda dapat memilih ebmgn9ge.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan (Gbit/s)

PPS Jaringan

Alamat IPv4 privat

Alamat IPv6

Multi-antrian (primer/sekunder)

Antarmuka jaringan elastis

Disk data maksimum

Bandwidth disk cloud (GB/s)

ecs.ebmgn9gc.64xlarge

256

1536

72 GB × 8

360 (180 × 2)

30.000.000

30

30

64/16

38

33

8

Catatan

Instans dalam keluarga ebmgn9gc harus diluncurkan dari gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan properti mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU compute-optimized elastic bare metal server instance family ebmgn8v

Keluarga instans ini saat ini hanya tersedia di wilayah tertentu. Untuk meminta akses, hubungi perwakilan penjualan Alibaba Cloud Anda.

  • Ikhtisar keluarga instans: ebmgn8v adalah keluarga instans komputasi akselerasi generasi kedelapan Alibaba Cloud (keluarga instans Elastic Bare Metal Server), dirancang untuk pelatihan model AI dan model parameter ultra-besar. Setiap instans adalah host bare metal yang dilengkapi delapan kartu GPU.

  • Kasus penggunaan:

    • Hemat biaya untuk inferensi paralel multi-GPU pada model bahasa besar (LLM) dengan lebih dari 70 miliar parameter.

    • Setiap GPU memberikan daya komputasi FP32 sebesar 39,5 TFLOPS, menjadikannya ideal untuk pelatihan model AI tradisional dan workload pengemudi otonom.

    • Konektivitas NVLINK di antara delapan GPU mendukung skenario pelatihan model skala kecil dan menengah.

  • Fitur utama dan posisi:

    • Memori GPU berkecepatan tinggi dan berkapasitas besar: Setiap GPU memiliki memori HBM3 96 GB, memberikan bandwidth memori 4 TB/s. Hal ini secara signifikan mempercepat pelatihan dan inferensi model.

    • Bandwidth antar-GPU tinggi: GPU saling terhubung melalui NVLINK 900 GB/s, memberikan efisiensi yang jauh lebih tinggi untuk pelatihan dan inferensi multi-GPU dibandingkan generasi GPU sebelumnya.

    • Teknologi kuantisasi model besar: Mendukung komputasi FP8, yang mengoptimalkan performa untuk pelatihan dan inferensi dengan parameter skala besar. Hal ini secara signifikan meningkatkan kecepatan komputasi dan mengurangi penggunaan memori GPU.

  • Komputasi:

    • Didukung oleh CIPU (Cloud Processing Unit) 1.0 terbaru:

      • Memisahkan komputasi dan penyimpanan, memungkinkan pemilihan sumber daya penyimpanan secara fleksibel. Dibandingkan dengan instans GPU generasi ke-7, bandwidth antar-host ditingkatkan menjadi 160 Gbit/s untuk transfer dan pemrosesan data yang lebih cepat.

      • Tidak seperti instans virtualisasi tradisional, CIPU menyediakan kemampuan bare metal yang mendukung komunikasi P2P antar instans GPU.

    • Didukung oleh prosesor Intel® Xeon® Scalable generasi ke-4, menyediakan 192 vCPU dengan frekuensi turbo semua-core hingga 3,1 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Memberikan performa jaringan ultra-tinggi hingga 30 juta PPS.

    • Mendukung Elastic RDMA Interface (ERI), yang memungkinkan akselerasi pass-through RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk workload pelatihan visi komputer (CV) dan model tradisional.

      Catatan

      Untuk petunjuk cara menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga instans ebmgn8v.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

Laju pengalihan paket (PPS)

IPv4 privat per ENI

IPv6 per ENI

Multi-antrian

ENI

Disk data maks

Bandwidth disk cloud maks (GB/s)

ecs.ebmgn8v.48xlarge

192

1.024

96 GB × 8

170 (85 × 2)

30 juta

30

30

64

32

31

6

Catatan

Mode boot untuk gambar yang digunakan oleh instans ebmgn8v harus UEFI. Jika Anda menggunakan gambar kustom, pastikan gambar tersebut mendukung mode boot UEFI dan atribut mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU-accelerated ebmgn8ia instance family

Keluarga instans ini saat ini hanya tersedia di wilayah tertentu. Untuk meminta akses, hubungi perwakilan penjualan Alibaba Cloud Anda.

  • Pengantar: ebmgn8ia, keluarga instans bare metal elastis, adalah keluarga instans komputasi akselerasi generasi kedelapan Alibaba Cloud. Dirancang untuk pencarian dan rekomendasi, simulasi, dan workload intensif GPU lainnya yang memerlukan rasio vCPU-ke-GPU tinggi. Didukung oleh GPU NVIDIA L20 terbaru, setiap instans adalah server bare metal yang dilengkapi dua prosesor frekuensi tinggi dan empat GPU.

  • Fitur dan kasus penggunaan:

    • Frekuensi tinggi: Instans ini dilengkapi dua prosesor AMD EPYC™ Genoa 9T34. Setiap prosesor memiliki 64 core fisik, menyediakan total 256 vCPU per instans, dengan rentang frekuensi 3,4 GHz hingga 3,75 GHz. Hal ini secara signifikan meningkatkan performa CPU single-core, menjadikannya ideal untuk pemodelan CAD dan mempercepat pra-pemrosesan untuk simulasi CAE.

    • Rasio sumber daya jarang: Setiap GPU dipasangkan dengan 64 vCPU dan memori 384 GiB, memberikan bandwidth memori rata-rata 230 GB/s per GPU. Konfigurasi ini cocok untuk skenario komputasi GPU yang memerlukan throughput I/O tinggi, seperti periklanan, pencarian, rekomendasi, simulasi CAE tradisional, dan tugas rendering berbasis CPU tertentu dalam produksi film.

  • Didukung oleh CIPU 1.0 terbaru:

    • Memisahkan komputasi dan penyimpanan, memungkinkan Anda secara fleksibel memilih sumber daya penyimpanan. Dibandingkan dengan generasi sebelumnya, bandwidth antar-mesin tipe instans ini ditingkatkan menjadi 160 Gbit/s untuk transfer dan pemrosesan data yang lebih cepat.

    • CIPU menyediakan kemampuan bare metal, memungkinkan komunikasi PCIe P2P antar instans GPU, peningkatan dibandingkan instans virtualisasi tradisional.

  • Komputasi:

    • Didukung oleh GPU NVIDIA L20 kelas enterprise baru:

      • Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.

      • Mendukung presisi FP8 untuk meningkatkan efisiensi komputasi.

    • Spesifikasi utama NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Enjin enkode/dekode video

      Interkoneksi GPU

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: N/A

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 × Enkoder Video (+AV1)

      • 3 × Dekoder Video

      • 4 × Dekoder JPEG

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Prosesor: Prosesor AMD EPYC™ Genoa 9T34 dengan rentang frekuensi 3,4 GHz hingga 3,75 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Memberikan performa jaringan ultra-tinggi hingga 30.000.000 PPS.

    • Mendukung Elastic RDMA Interface (ERI), yang memungkinkan passthrough RDMA melalui jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk melatih model visi komputer (CV) dan model tradisional.

      Catatan

      Untuk petunjuk penggunaan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn8ia.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan dasar (Gbit/s)

PPS Jaringan

Alamat IPv4 privat per ENI

Alamat IPv6 per ENI

Jumlah antrian (ENI Primer/Sekunder)

Antarmuka jaringan elastis

Disk data maks

Bandwidth disk cloud maks (GB/s)

ecs.ebmgn8ia.64xlarge

256

1536

L20 × 4

48 GB × 4

160 (80 × 2)

30.000.000

30

30

64/16

32

31

6

Catatan

Instans keluarga ebmgn8ia memerlukan gambar yang menggunakan mode boot UEFI. Jika Anda menggunakan gambar kustom, gambar tersebut harus mendukung boot UEFI, dan properti mode boot-nya harus diatur ke UEFI. Untuk informasi selengkapnya, lihat Mode boot instans.

GPU compute-optimized elastic bare metal family ebmgn8is

Keluarga instans ini saat ini hanya tersedia di wilayah tertentu di luar Tiongkok daratan. Untuk pertanyaan, hubungi perwakilan penjualan Alibaba Cloud Anda.

  • Ikhtisar keluarga instans: ebmgn8is adalah keluarga instans komputasi akselerasi generasi kedelapan dari Alibaba Cloud. Sebagai keluarga instans bare metal elastis, keluarga ini dibangun untuk permintaan yang terus berkembang dalam workload yang dihasilkan AI. Didukung oleh GPU NVIDIA L20 terbaru, setiap instans adalah host bare metal dengan delapan kartu GPU.

  • Fitur dan posisi:

    • Pemrosesan grafis: Instans ini didukung oleh prosesor Intel® Xeon® Scalable frekuensi tinggi generasi ke-4. Mereka menyediakan daya komputasi CPU yang cukup untuk pemodelan 3D, memastikan rendering dan desain grafis yang lebih lancar.

    • Tugas inferensi: Didukung oleh GPU NVIDIA L20 baru, di mana setiap kartu menyediakan memori 48 GB untuk mempercepat tugas inferensi. Instans ini mendukung format floating-point FP8. Dikombinasikan dengan Container Service for Kubernetes (ACK) Alibaba Cloud, mereka secara fleksibel mendukung inferensi pada berbagai model AIGC dan sangat cocok untuk tugas inferensi pada model bahasa besar (LLM) dengan hingga 70 miliar parameter.

    • Tugas pelatihan: Instans ini menawarkan daya komputasi hemat biaya, memberikan performa komputasi FP32 dua kali lipat dibandingkan instans inferensi generasi ke-7. Mereka sangat cocok untuk melatih model visi komputer (CV) yang menggunakan FP32, dan untuk melatih model skala kecil hingga menengah lainnya.

  • Kasus penggunaan:

    • Gunakan gambar GRID dengan driver grafis GRID dari Cloud Marketplace untuk mengaktifkan kemampuan grafis OpenGL dan Direct3D. Ini menyediakan pemrosesan grafis tingkat workstation untuk workload seperti animasi, efek khusus film dan televisi, dan rendering.

    • Dikombinasikan dengan kemampuan manajemen kontainer ACK, Anda dapat lebih efisien dan hemat biaya mendukung generasi grafis AIGC dan inferensi model bahasa besar (LLM) (hingga 130 miliar parameter).

    • Skenario AI umum lainnya, seperti pengenalan gambar dan pengenalan suara.

  • Didukung oleh CIPU 1.0 terbaru:

    • Menampilkan komputasi dan penyimpanan yang terpisah, yang memungkinkan Anda secara fleksibel memilih sumber daya penyimpanan yang diperlukan. Dibandingkan dengan generasi sebelumnya, bandwidth antar-instans keluarga instans ini ditingkatkan menjadi 160 Gbit/s untuk memungkinkan transfer dan pemrosesan data yang lebih cepat.

    • CIPU menyediakan kemampuan bare metal yang memungkinkan komunikasi PCIe P2P antar GPU, yang tidak didukung oleh instans virtualisasi tradisional.

  • Komputasi:

    • Didukung oleh GPU NVIDIA L20 kelas enterprise baru:

      • Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.

      • Menggunakan switch PCIe untuk interkoneksi. Dibandingkan dengan koneksi langsung ke CPU, desain ini meningkatkan performa NCCL sebesar 36% dan dapat meningkatkan performa inferensi hingga 9% ketika Anda menjalankan inferensi terbagi untuk model besar di beberapa kartu.

    • Parameter utama NVIDIA L20:

      Arsitektur GPU

      Memori GPU

      Performa komputasi

      Enkode/dekode video

      Interkoneksi antar-GPU

      NVIDIA Ada Lovelace

      • Kapasitas: 48 GB

      • Bandwidth: 864 GB/s

      • FP64: N/A

      • FP32: 59,3 TFLOPS

      • FP16/BF16: 119 TFLOPS

      • FP8/INT8: 237 TFLOPS

      • 3 × Enkoder Video (+AV1)

      • 3 × Dekoder Video

      • 4 × Dekoder JPEG

      • Antarmuka PCIe: PCIe Gen4 x16

      • Bandwidth: 64 GB/s

    • Prosesor: Prosesor Intel® Xeon® Scalable (SPR) dengan frekuensi dasar 3,4 GHz dan frekuensi turbo semua-core hingga 3,9 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Memberikan performa jaringan ultra-tinggi dengan laju pengalihan paket 30 juta PPS.

    • Mendukung ERI (Elastic RDMA Interface), yang memungkinkan akselerasi passthrough RDMA dalam jaringan VPC. ERI meningkatkan bandwidth menjadi 160 Gbit/s dan ideal untuk workload pelatihan CV dan model tradisional.

      Catatan

      Untuk menggunakan ERI, lihat Aktifkan eRDMA pada instans enterprise-level.

Tabel berikut menjelaskan tipe dan spesifikasi instans dari keluarga instans ebmgn8is.

Instance type

vCPUs

Memory (GiB)

GPU

GPU memory

Base bandwidth (Gbit/s)

Packet forwarding rate (PPS)

Private IPv4 addresses

IPv6 addresses

Queue pairs (primary/secondary ENI)

ENIs

Attachable data disks

Cloud disk bandwidth (GB/s)

ecs.ebmgn8is.32xlarge

128

1024

L20 × 8

48 GB × 8

160 (80 × 2)

30.000.000

30

30

64/16

32

31

6

Catatan

Mode boot image untuk tipe instans ebmgn8is harus UEFI. Jika Anda menggunakan custom image, pastikan bahwa custom image tersebut mendukung UEFI dan atribut mode boot-nya diatur ke UEFI. Untuk informasi selengkapnya, lihat Instance boot modes.

Keluarga instans ebmgn7e

  • Deskripsi keluarga instans: ebmgn7e adalah keluarga instans yang dibangun di atas arsitektur X-Dragon. Keluarga ini menggabungkan performa perangkat keras yang andal dengan fleksibilitas dan elastisitas berbasis software-defined.

  • Kasus penggunaan:

    • Pelatihan dan pengembangan deep learning.

    • Komputasi akselerasi HPC dan simulasi.

    Penting

    Saat menjalankan workload pelatihan AI dengan beban komunikasi tinggi, seperti yang melibatkan model Transformer, Anda harus mengaktifkan NVLink untuk komunikasi antar-GPU. Jika tidak, transfer data skala besar melalui tautan PCIe dapat menyebabkan kegagalan tak terduga dan korupsi data. Jika Anda tidak yakin mengenai topologi tautan komunikasi untuk workload pelatihan Anda, submit a ticket untuk mendapatkan dukungan dari pakar teknis Alibaba Cloud.

  • Komputasi:

    • Prosesor: Menggunakan prosesor Intel® Xeon® Scalable dengan frekuensi dasar 2,9 GHz, frekuensi turbo semua core 3,5 GHz, dan dukungan PCIe 4.0.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat IPv6 communication.

    • Mencapai laju pengalihan paket hingga 24 juta PPS.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn7e.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth jaringan (Gbit/s)

PPS jaringan

Multi-queue (primary/secondary)

ENIs

Alamat IPv4 privat

Alamat IPv6

ecs.ebmgn7e.32xlarge

128

1024

80 GB × 8

64

24 juta

32/12

32

10

1

Setelah menjalankan instans ebmgn7e, Anda harus memeriksa apakah fitur Multi-Instance GPU (MIG) dalam keadaan aktif atau nonaktif karena status default-nya tidak dijamin. Untuk informasi lebih lanjut mengenai MIG, lihat NVIDIA Multi-Instance GPU User Guide.

Tabel berikut menjelaskan apakah instans ebmgn7e mendukung fitur MIG.

Tipe instans

Dukungan fitur MIG

Deskripsi

ecs.ebmgn7e.32xlarge

Yes

Anda dapat mengaktifkan fitur MIG pada instans bare metal ebmgn7e.

Keluarga instans ebmgn7i yang dipercepat GPU

  • Pendahuluan: ebmgn7i adalah keluarga instans yang dibangun di atas arsitektur X-Dragon. Instans-instans ini menyediakan komputasi perangkat keras berbasis software-defined, menghadirkan elastisitas sekaligus kinerja tinggi.

  • Kasus penggunaan:

    • Dilengkapi CPU, memori, dan GPU berkinerja-tinggi, instans ini mampu menangani beban kerja inferensi AI konkuren dalam volume tinggi, sehingga ideal untuk pengenalan gambar, suara, dan perilaku.

    • Dukungan RTX, dikombinasikan dengan CPU berfrekuensi tinggi, menghadirkan virtualisasi grafis 3D berkinerja-tinggi yang ideal untuk beban kerja pemrosesan grafis intensif seperti desain grafis remote dan cloud gaming.

    • Dukungan RTX, dikombinasikan dengan bandwidth jaringan dan disk cloud yang tinggi, menjadikan instans ini ideal untuk membangun rendering farm berkinerja-tinggi.

    • Dengan multiple GPU dan bandwidth jaringan tinggi, instans ini mendukung beban kerja pelatihan pembelajaran mendalam skala kecil.

  • Komputasi:

    • Ditenagai oleh GPU NVIDIA A10:

      • Arsitektur Ampere inovatif.

      • Mendukung fitur akselerasi umum seperti vGPU, RTX, dan TensorRT.

    • Prosesor: Prosesor Intel® Xeon® Scalable (Ice Lake) dengan frekuensi dasar 2,9 GHz dan frekuensi turbo semua-core 3,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.

    • Menghadirkan kinerja jaringan ultra-tinggi dengan PPS jaringan hingga 24 juta.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn7i.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

PPS jaringan

Multi-queue

Antarmuka jaringan elastis

Alamat IPv4 privat

Alamat IPv6

ecs.ebmgn7i.32xlarge

128

768

NVIDIA A10 × 4

24 GB × 4

64

24 juta

32

32

10

1

Keluarga instans ebmgn7 yang dipercepat GPU

  • Pendahuluan: Berdasarkan Arsitektur X-Dragon, keluarga tipe instans ebmgn7 menampilkan perangkat keras yang didefinisikan oleh perangkat lunak, menawarkan fleksibilitas sekaligus kinerja komputasi yang andal.

  • Kasus penggunaan:

    • Beban kerja pelatihan deep learning, seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara.

    • Komputasi ilmiah intensif GPU, seperti dinamika fluida komputasi (CFD), keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

  • Komputasi:

    • Prosesor: Prosesor Intel® Xeon® Platinum 8269CY (Cascade Lake) berkecepatan 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.

    • Kinerja jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga tipe instans ebmgn7.

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth dasar (Gbit/s)

PPS

Multi-queue

ENI

IPv4 per ENI

IPv6 per ENI

ecs.ebmgn7.26xlarge

104

768

40 GB × 8

30

18.000.000

16

15

10

1

Fitur Multi-Instance GPU (MIG) mungkin diaktifkan atau dinonaktifkan secara default saat instans ebmgn7 dimulai. Anda harus memeriksa statusnya dan mengaktifkan atau menonaktifkannya sesuai kebutuhan. Untuk informasi lebih lanjut mengenai MIG, lihat NVIDIA Multi-Instance GPU User Guide.

Tabel berikut menjelaskan dukungan MIG untuk instans ebmgn7.

Tipe instans

MIG didukung

Deskripsi

ecs.ebmgn7.26xlarge

Ya

Instans ini mendukung fitur MIG.

Keluarga instans GPU-accelerated ebmgn6e

  • Pengenalan:

    • Keluarga instans ebmgn6e, yang dibangun di atas arsitektur X-Dragon, menghadirkan komputasi perangkat keras berbasis software-defined yang menggabungkan fleksibilitas, elastisitas, dan performa tinggi.

    • Instans ini didukung oleh kartu komputasi GPU NVIDIA V100 (32 GB NVLink).

    • Akselerator GPU-nya adalah V100 (paket SXM2), yang memiliki fitur-fitur berikut:

      • Arsitektur Volta yang inovatif.

      • 32 GB memori HBM2 per GPU (dengan bandwidth memori GPU sebesar 900 GB/s).

      • 5.120 CUDA Core per GPU.

      • 640 Tensor Core per GPU.

      • Setiap GPU mendukung enam tautan NVLink dua arah. Setiap tautan satu arah menyediakan bandwidth 25 GB/s, sehingga total mencapai 300 GB/s (6 × 25 × 2).

  • Kasus penggunaan:

    • Deep learning, seperti pelatihan dan inferensi untuk algoritma AI seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara.

    • Komputasi ilmiah, seperti dinamika fluida komputasi, keuangan komputasi, dinamika molekuler, dan analisis lingkungan.

  • Komputasi:

    • Rasio vCPU-memori 1:8.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn6e.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth dasar (Gbit/s)

PPS

Multi-queue

ENIs

Alamat IPv4 privat

Alamat IPv6

ecs.ebmgn6e.24xlarge

96

768

NVIDIA V100 × 8

32 GB × 8

32

4.800.000

16

15

10

1

Keluarga instans ebmgn6v

  • Deskripsi keluarga instans:

    • Keluarga instans ebmgn6v dibangun di atas arsitektur X-Dragon. Instans ini menawarkan komputasi perangkat keras berdefinisi-perangkat lunak berkinerja-tinggi dengan elastisitas cloud.

    • Ditenagai oleh GPU NVIDIA V100.

    • Akselerator GPU V100 (paket SXM2) memiliki fitur-fitur berikut:

      • Arsitektur Volta yang inovatif

      • Memori GPU HBM2 sebesar 16 GB per GPU, dengan bandwidth memori 900 GB/s

      • 5.120 CUDA Core per GPU

      • 640 Tensor Core per GPU

      • Tiap GPU mendukung enam tautan NVLink dua arah, dengan bandwidth satu arah sebesar 25 GB/s per tautan, sehingga total bandwidth mencapai 300 GB/s (6 × 25 × 2 = 300 GB/s)

  • Kasus penggunaan:

    • Beban kerja pelatihan dan inferensi deep learning, seperti klasifikasi gambar, kendaraan otonom, dan pengenalan suara

    • Beban kerja komputasi ilmiah, seperti dinamika fluida komputasional, keuangan komputasional, dinamika molekuler, dan analisis lingkungan

  • Komputasi:

    • Rasio vCPU-memori sebesar 1:4.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.

    • Kinerja jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe dan spesifikasi instans untuk keluarga instans ebmgn6v.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

PPS jaringan

Multi-queue

ENI

IPv4 per ENI

IPv6 per ENI

ecs.ebmgn6v.24xlarge

96

384

NVIDIA V100 × 8

16 GB × 8

30

4.500.000

8

32

10

1

Keluarga instans komputasi GPU ebmgn6i

  • Pengantar

    • ebmgn6i adalah keluarga tipe instans yang dibangun di atas Arsitektur X-Dragon, menghadirkan komputasi perangkat keras berbasis software-defined, serta menggabungkan elastisitas fleksibel dengan performa tinggi.

    • Instans-Instans ini didukung oleh akselerator GPU NVIDIA T4 dengan fitur-fitur berikut:

      • Arsitektur Turing inovatif

      • 16 GB memori GPU per GPU dengan bandwidth memori 320 GB/s

      • 2.560 CUDA Core per GPU

      • Hingga 320 Turing Tensor Core per GPU

      • Tensor Core presisi variabel menghadirkan performa FP16 sebesar 65 TFLOPS, 130 INT8 TOPS, dan 260 INT4 TOPS.

  • Kasus penggunaan

    • Inferensi AI (DL/ML), termasuk aplikasi seperti computer vision, pengenalan suara, speech synthesis, NLP, machine translation, dan sistem rekomendasi.

    • Rendering cloud real-time untuk cloud gaming.

    • Rendering cloud real-time untuk AR/VR.

    • Beban kerja grafis intensif komputasi atau workstation grafis.

    • Database yang dipercepat GPU.

    • Komputasi berkinerja tinggi (high-performance computing).

  • Komputasi

    • Rasio vCPU terhadap memori sebesar 1:4.

    • Prosesor: Intel® Xeon® Platinum 8163 (Skylake) dengan frekuensi dasar 2,5 GHz.

  • Penyimpanan

  • Jaringan

    • Instans ini mendukung IPv4 dan IPv6. Untuk informasi mengenai komunikasi IPv6, lihat Komunikasi IPv6.

    • Performa jaringan meningkat seiring dengan tipe instans.

Tabel berikut mencantumkan tipe instans dan spesifikasinya untuk keluarga instans ebmgn6i.

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth jaringan (Gbit/s)

Laju forwarding (PPS)

Multiqueue

ENI

Alamat IPv4 privat

Alamat IPv6

ecs.ebmgn6i.24xlarge

96

384

NVIDIA T4 × 4

16 GB × 4

30

4,5 juta

8

32

10

1