全部产品
Search
文档中心

Elastic GPU Service:Keluarga instans dipercepat vGPU (seri vgn dan sgn)

更新时间:Jun 29, 2025

Instans dari Keluarga Instans Dipercepat vGPU menyediakan kemampuan pemrosesan grafis berperforma tinggi serta komputasi GPU yang dipercepat. Cocok untuk skenario akselerasi grafis, rendering, dan komputasi serbaguna. Topik ini menjelaskan fitur Keluarga Instans Dipercepat vGPU dari Elastic Compute Service (ECS) serta mencantumkan tipe instans dari setiap keluarga.

sgn8ia, keluarga instans dipercepat vGPU

  • Pengenalan:

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk memberikan performa ultra-tinggi yang dapat diprediksi dan konsisten. Percepatan jalur cepat pada chip meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi secara signifikan, mempercepat penyimpanan data dan pemuatan model.

    • Dilengkapi dengan lisensi NVIDIA GRID vWS, keluarga instans ini mendukung akselerasi grafis bersertifikat untuk perangkat lunak CAD, memenuhi kebutuhan desain grafis profesional. Instans ini juga cocok sebagai solusi komputasi dioptimalkan ringan dengan akselerasi GPU untuk mengurangi biaya inferensi AI skala kecil.

  • Skema yang Didukung:

    • Tugas inferensi AI yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, suara, dan identifikasi perilaku.

    • Pemrosesan grafis intensif komputasi yang memerlukan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming.

    • Pemodelan 3D di bidang animasi, produksi film, cloud gaming, dan desain mekanis menggunakan prosesor AMD Genoa dengan kecepatan clock tinggi.

  • Komputasi:

    • Menggunakan GPU NVIDIA Lovelace dengan fitur berikut:

      • Memori GPU besar dan solusi pemotongan GPU ganda.

      • Dukungan untuk fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk berbagai kebutuhan bisnis.

    • Menggunakan prosesor AMD Genoa dengan kecepatan clock 3,4 GHz hingga 3,75 GHz, memberikan daya komputasi tinggi untuk pemodelan 3D.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.

sgn8ia tipe instans

Tipe instans

vCPU

Memori (GiB)

Memori GPU

Bandwidth dasar jaringan (Gbit/s)

Laju penerusan paket (pps)

Antrian NIC

ENIs

Alamat IPv4/IPv6 pribadi per ENI

Disk maksimum

IOPS dasar disk

BPS dasar disk (MB/s)

ecs.sgn8ia-m2.xlarge

4

16

2 GB

2,5

1.000.000

4

4

15/15

9

30.000

244

ecs.sgn8ia-m4.2xlarge

8

32

4 GB

4

1.600.000

8

4

15/15

9

45.000

305

ecs.sgn8ia-m8.4xlarge

16

64

8 GB

7

2.000.000

16

8

30/30

17

60.000

427

ecs.sgn8ia-m16.8xlarge

32

128

16 GB

10

3.000.000

32

8

30/30

33

80.000

610

ecs.sgn8ia-m24.12xlarge

48

192

24 GB

16

4.500.000

48

8

30/30

33

120.000

1.000

ecs.sgn8ia-m48.24xlarge

96

384

48 GB

32

9.000.000

64

15

30/30

33

240.000

2.000

Catatan
  • Kolom terkait GPU dalam tabel di atas menunjukkan vGPU yang dipotong menggunakan teknologi pemotongan vGPU.

  • Memori dan memori GPU dari instans sgn8ia bersifat eksklusif untuk instans tersebut. CPU merupakan sumber daya bersama dengan rasio overcommit sekitar 1:1,5. Jika Anda memiliki persyaratan khusus untuk daya komputasi CPU, gunakan keluarga instans komputasi dioptimalkan dengan akselerasi GPU, seperti instans gn7i GPU-accelerated compute-optimized.

sgn7i-vws, keluarga instans dipercepat vGPU dengan CPU dibagi

  • Pengenalan:

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk performa ultra-tinggi yang dapat diprediksi dan konsisten. Percepatan jalur cepat pada chip meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, mempercepat penyimpanan data dan pemuatan model.

    • Instans dalam keluarga ini berbagi sumber daya CPU dan jaringan untuk memaksimalkan pemanfaatan sumber daya bawah. Setiap instans memiliki akses eksklusif ke memori dan memori GPU-nya, memberikan isolasi data dan jaminan performa.

      Catatan

      Untuk sumber daya CPU eksklusif, gunakan keluarga instans vgn7i-vws.

    • Dilengkapi dengan lisensi NVIDIA GRID vWS, keluarga instans ini mendukung akselerasi grafis bersertifikat untuk perangkat lunak CAD, memenuhi kebutuhan desain grafis profesional. Instans ini cocok sebagai solusi komputasi dioptimalkan ringan dengan akselerasi GPU untuk mengurangi biaya inferensi AI skala kecil.

  • Skema yang Didukung:

    • Tugas inferensi AI yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, suara, dan identifikasi perilaku.

    • Pemrosesan grafis intensif komputasi yang memerlukan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming.

    • Pemodelan 3D di bidang animasi, produksi film, cloud gaming, dan desain mekanis menggunakan prosesor Ice Lake.

  • Komputasi:

    • Menggunakan GPU NVIDIA A10 dengan fitur berikut:

      • Arsitektur NVIDIA Ampere inovatif.

      • Dukungan untuk fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk berbagai kebutuhan bisnis.

    • Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo semua inti sebesar 3,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.

sgn7i-vws tipe instans

Tipe instans

vCPU

Memori (GiB)

GPU

Memori GPU

Bandwidth dasar/meledak jaringan (Gbit/s)

Laju penerusan paket (pps)

Antrian NIC

ENIs

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.sgn7i-vws-m2.xlarge

4

15,5

NVIDIA A10 * 1/12

24GB * 1/12

1,5/5

500.000

4

2

2

1

ecs.sgn7i-vws-m4.2xlarge

8

31

NVIDIA A10 * 1/6

24GB * 1/6

2,6/10

1.000.000

4

4

6

1

ecs.sgn7i-vws-m8.4xlarge

16

62

NVIDIA A10 * 1/3

24GB * 1/3

5/20

2.000.000

8

4

10

1

ecs.sgn7i-vws-m2s.xlarge

4

8

NVIDIA A10 * 1/12

24GB * 1/12

1,5/5

500.000

4

2

2

1

ecs.sgn7i-vws-m4s.2xlarge

8

16

NVIDIA A10 * 1/6

24GB * 1/6

2,6/10

1.000.000

4

4

6

1

ecs.sgn7i-vws-m8s.4xlarge

16

32

NVIDIA A10 * 1/3

24GB * 1/3

5/20

2.000.000

8

4

10

1

Catatan

Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi pemotongan GPU untuk setiap tipe instans. Setiap GPU dapat dipotong menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans. Contoh:

NVIDIA A10 * 1/12. NVIDIA A10 adalah model GPU. 1/12 menunjukkan bahwa GPU dipotong menjadi 12 partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans.

vgn7i-vws, keluarga instans dipercepat vGPU

  • Pengenalan:

    • Keluarga instans ini menggunakan arsitektur SHENLONG generasi ketiga untuk performa ultra-tinggi yang dapat diprediksi dan konsisten. Percepatan jalur cepat pada chip meningkatkan performa penyimpanan, jaringan, dan stabilitas komputasi, mempercepat penyimpanan data dan pemuatan model.

    • Dilengkapi dengan lisensi NVIDIA GRID vWS, keluarga instans ini mendukung akselerasi grafis bersertifikat untuk perangkat lunak CAD, memenuhi kebutuhan desain grafis profesional. Instans ini cocok sebagai solusi komputasi dioptimalkan ringan dengan akselerasi GPU untuk mengurangi biaya inferensi AI skala kecil.

  • Skema yang Didukung:

    • Tugas inferensi AI yang memerlukan CPU, memori, dan GPU berperforma tinggi, seperti pengenalan gambar, suara, dan identifikasi perilaku.

    • Pemrosesan grafis intensif komputasi yang memerlukan virtualisasi grafis 3D berperforma tinggi, seperti desain grafis jarak jauh dan cloud gaming.

    • Pemodelan 3D di bidang animasi, produksi film, cloud gaming, dan desain mekanis menggunakan prosesor Ice Lake.

  • Komputasi:

    • Menggunakan GPU NVIDIA A10 dengan fitur berikut:

      • Arsitektur NVIDIA Ampere inovatif.

      • Dukungan untuk fitur akselerasi seperti vGPU, RTX, dan TensorRT untuk berbagai kebutuhan bisnis.

    • Menggunakan prosesor Intel® Xeon® Scalable (Ice Lake) 2,9 GHz dengan frekuensi turbo semua inti sebesar 3,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.

vgn7i-vws tipe instans

Tipe instans

vCPUs

Memori (GiB)

GPU

Memori GPU

Bandwidth dasar jaringan (Gbit/s)

Laju penerusan paket (pps)

Antrian NIC

ENIs

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.vgn7i-vws-m4.xlarge

4

30

NVIDIA A10 * 1/6

24GB * 1/6

3

1.000.000

4

4

10

1

ecs.vgn7i-vws-m8.2xlarge

10

62

NVIDIA A10 * 1/3

24GB * 1/3

5

2.000.000

8

6

10

1

ecs.vgn7i-vws-m12.3xlarge

14

93

NVIDIA A10 * 1/2

24GB * 1/2

8

3.000.000

8

6

15

1

ecs.vgn7i-vws-m24.7xlarge

30

186

NVIDIA A10 * 1

24GB * 1

16

6.000.000

12

8

30

1

Catatan

Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi pemotongan GPU untuk setiap tipe instans. Setiap GPU dapat dipotong menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans. Contoh:

NVIDIA A10 * 1/6. NVIDIA A10 adalah model GPU. 1/6 menunjukkan bahwa GPU dipotong menjadi enam partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans.

vgn6i-vws, keluarga instans dipercepat vGPU

Penting
  • Sehubungan dengan peningkatan driver NVIDIA GRID, Alibaba Cloud meng-upgrade keluarga instans vgn6i menjadi keluarga instans vgn6i-vws. Keluarga instans vgn6i-vws menggunakan driver NVIDIA GRID terbaru dan menyediakan lisensi NVIDIA GRID vWS. Untuk mengajukan citra gratis dengan driver NVIDIA GRID yang sudah terinstal, ajukan tiket.

  • Untuk menggunakan citra publik lainnya atau citra kustom yang tidak mengandung driver NVIDIA GRID, ajukan tiket untuk mendapatkan file driver GRID dan menginstal driver NVIDIA GRID. Alibaba Cloud tidak memungut biaya lisensi tambahan untuk driver GRID.

  • Skema yang Didukung:

    • Rendering real-time untuk cloud gaming.

    • Rendering real-time untuk aplikasi Augmented Reality (AR) dan Virtual Reality (VR).

    • Inferensi AI (deep learning dan machine learning) untuk penyebaran layanan Internet elastis.

    • Lingkungan pendidikan deep learning.

    • Lingkungan eksperimen pemodelan deep learning.

  • Komputasi:

    • Menggunakan GPU NVIDIA T4.

    • Menggunakan vGPU.

      • Mendukung kapasitas komputasi 1/4 dan 1/2 dari GPU NVIDIA Tesla T4.

      • Mendukung 4 GB dan 8 GB memori GPU.

    • Menawarkan rasio CPU-memori sebesar 1:5.

    • Menggunakan prosesor Intel® Xeon® Platinum 8163 (Skylake) 2,5 GHz.

  • Penyimpanan:

  • Jaringan:

    • Mendukung IPv4 dan IPv6. Untuk informasi tentang komunikasi IPv6, lihat Komunikasi IPv6.

    • Menyediakan performa jaringan tinggi berdasarkan kapasitas komputasi besar.

vgn6i-vws tipe instans

Tipe instans

vCPUs

Memori (GiB)

GPU

Memori GPU

Bandwidth dasar jaringan (Gbit/s)

Laju penerusan paket (pps)

Antrian NIC

ENIs

Alamat IPv4 pribadi per ENI

Alamat IPv6 per ENI

ecs.vgn6i-m4-vws.xlarge

4

23

NVIDIA T4 * 1/4

16GB * 1/4

2

500.000

4/2

3

10

1

ecs.vgn6i-m8-vws.2xlarge

10

46

NVIDIA T4 * 1/2

16GB * 1/2

4

800.000

8/2

4

10

1

ecs.vgn6i-m16-vws.5xlarge

20

92

NVIDIA T4 * 1

16GB * 1

7,5

1.200.000

6

4

10

1

Catatan

Kolom GPU dalam tabel di atas menunjukkan model GPU dan informasi pemotongan GPU untuk setiap tipe instans. Setiap GPU dapat dipotong menjadi beberapa partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans. Contoh:

NVIDIA T4 * 1/4. NVIDIA T4 adalah model GPU. 1/4 menunjukkan bahwa GPU dipotong menjadi empat partisi GPU, dan setiap partisi GPU dapat dialokasikan sebagai vGPU ke sebuah instans.