全部产品
Search
文档中心

Container Compute Service:Ikhtisar pod ACS

更新时间:Jan 24, 2026

Dalam lingkungan cloud computing dan kontainer modern, pod merupakan unit penyebaran terkecil di Kubernetes dan biasanya terdiri dari satu atau beberapa container. Kelas komputasi dan kualitas komputasi pod secara signifikan memengaruhi performa aplikasi serta pemanfaatan resource. Container Compute Service (ACS) menyediakan berbagai kelas komputasi dan tingkat kualitas komputasi yang sesuai untuk memenuhi beragam kebutuhan bisnis. Topik ini menjelaskan prasyarat, batasan, dan fitur inti pod ACS, termasuk isolasi keamanan, konfigurasi resource CPU, memori, dan GPU, pulling image, penyimpanan, jaringan, serta pengumpulan log.

Kelas komputasi

ACS menawarkan kelas komputasi kontainer CPU dan GPU yang hemat biaya. Setiap kelas komputasi memiliki alokasi resource berbeda untuk menyesuaikan dengan skenario bisnis tertentu.

Jenis Komputasi

Label

Fitur

General-purpose (default)

general-purpose

Cocok untuk sebagian besar aplikasi microservice tanpa status, aplikasi web Java, dan tugas komputasi-intensif.

Performance-enhanced

performance

Cocok untuk skenario berkinerja-tinggi seperti pelatihan dan inferensi AI/ML berbasis CPU serta pemrosesan batch HPC.

GPU-accelerated

gpu

Cocok untuk skenario komputasi heterogen seperti AI dan HPC, termasuk inferensi single-GPU atau multi-GPU serta komputasi paralel GPU.

GPU-HPN

gpu-hpn

Cocok untuk skenario komputasi heterogen seperti AI dan HPC, termasuk pelatihan terdistribusi GPU, inferensi terdistribusi, dan komputasi berkinerja-tinggi yang dipercepat GPU.

Anda dapat menentukan kelas komputasi pod dengan menambahkan label alibabacloud.com/compute-class ke pod tersebut. Contoh berikut menunjukkan deployment aplikasi Nginx dengan kelas komputasi yang diatur ke general-purpose, gpu, dan gpu-hpn.

General-purpose

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        alibabacloud.com/compute-class: general-purpose 
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest

GPU-accelerated

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        # Set compute-class to gpu.
        alibabacloud.com/compute-class: "gpu"
        # Set GPU model to example-model. Replace with your actual GPU model, such as T4.
        alibabacloud.com/gpu-model-series: "example-model"
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest
        resources:
          limits:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
          requests:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
Catatan

Untuk informasi lebih lanjut mengenai model dan spesifikasi GPU yang didukung oleh ACS, lihat Tipe instans komputasi dipercepat.

High-Performance Network GPU Type

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        # Set compute-class to gpu-hpn.
        alibabacloud.com/compute-class: "gpu-hpn"
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest
        resources:
          limits:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
          requests:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
Catatan

Untuk menggunakan GPU HPN di ACS, Anda harus terlebih dahulu membuat reservasi kapasitas GPU-HPN.

Definisi kualitas daya komputasi

ACS menyediakan dua kelas kualitas komputasi yang berbeda dalam alokasi resource untuk menyesuaikan dengan skenario bisnis tertentu.

Kualitas komputasi

Label

Fitur

Skenario khas

Default

default

  • Mungkin mengalami fluktuasi kecil pada daya komputasi.

  • Tidak terjadi eviction paksa instans. Sebaliknya, kegagalan instans diselesaikan melalui migrasi panas, atau Anda diberi notifikasi untuk memicu eviction.

  • Aplikasi microservice

  • Aplikasi web

  • Tugas komputasi

BestEffort

best-effort

  • Mungkin mengalami fluktuasi kecil pada daya komputasi.

  • Pod dapat dipreempt secara paksa dan dievict. ACS mengirim notifikasi event lima menit sebelum eviction.

  • Komputasi big data

  • Transkoding audio dan video

  • Tugas pemrosesan batch

Anda dapat menentukan kualitas komputasi pod dengan menambahkan label alibabacloud.com/compute-qos ke pod tersebut. Contoh berikut menunjukkan deployment aplikasi Nginx dengan kualitas komputasi diatur ke default.

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        alibabacloud.com/compute-qos: default
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest 
Catatan
  • Kelas kualitas komputasi ACS berbeda dari kelas QoS native Kubernetes. Kelas kualitas komputasi default di ACS setara dengan kelas QoS Guaranteed di Kubernetes.

  • Instans BestEffort menggunakan inventaris dinamis. Di lingkungan produksi, Anda dapat mengonfigurasi penjadwalan prioritas inventaris sehingga ACS secara otomatis beralih ke kelas default ketika inventaris BestEffort tidak tersedia. Untuk informasi selengkapnya, lihat Kebijakan penjadwalan resource kustom.

Pemetaan antara kelas komputasi dan kelas kualitas komputasi

Kelas komputasi (label)

Kualitas komputasi yang didukung (label)

General-purpose (general-purpose)

Default (default), BestEffort (best-effort)

Performance-enhanced (performance)

Default (default), BestEffort (best-effort)

GPU-accelerated (gpu)

Default (default), BestEffort (best-effort)

GPU-HPN (gpu-hpn)

Default (default)

Menentukan vendor CPU

Untuk kelas komputasi general-purpose dan performance-enhanced, Anda dapat memilih antara CPU Intel dan AMD.

Untuk menentukan vendor CPU, Anda dapat menambahkan anotasi alibabacloud.com/cpu-vendors ke pod Anda atau mendefinisikan anotasi alibabacloud.com/cpu-vendors dalam templat pod workload Anda. Untuk menentukan CPU AMD, Anda harus mengajukan tiket untuk menambahkan akun Anda ke daftar putih. Penentuan merek CPU tidak didukung untuk tipe instans selain General-purpose dan Performance-enhanced. Nilai yang didukung untuk anotasi ini tercantum di bawah:

Kunci

Nilai

Deskripsi

alibabacloud.com/cpu-vendors

intel (default)

Menentukan CPU Intel. Jika tidak ditentukan, nilai default-nya adalah intel.

amd

Menentukan CPU AMD.

intel,amd

Mengizinkan CPU Intel atau AMD. ACS memilih vendor CPU berdasarkan inventaris saat ini. Anda tidak dapat menentukan urutan preferensi.

Setelah instans dibuat, Anda dapat memeriksa label alibabacloud.com/cpu-vendor dalam YAML pod untuk memverifikasi vendor CPU yang digunakan.

Contoh berikut menunjukkan Deployment untuk aplikasi Nginx yang menentukan vendor CPU sebagai amd.

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        alibabacloud.com/compute-class: general-purpose
        alibabacloud.com/compute-qos: default
      annotations:
        alibabacloud.com/cpu-vendors: amd
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest 
Peringatan

Jangan gunakan label sistem ACS, seperti alibabacloud.com/compute-class, alibabacloud.com/compute-qos, dan alibabacloud.com/cpu-vendor, dalam pemilih matchLabels controller workload Anda. Label-label ini dapat dimodifikasi oleh sistem, yang dapat menyebabkan controller sering membuat ulang pod dan memengaruhi stabilitas aplikasi.

Fitur inti

Fitur

Deskripsi

Security isolation

Pod ACS berjalan di lingkungan kontainer arsitektur tanpa server yang aman dan andal. Setiap pod sepenuhnya diisolasi pada lapisan dasar menggunakan teknologi sandbox ringan, memastikan tidak ada gangguan antar pod. Selain itu, ACS menjadwalkan pod di mesin fisik yang berbeda sedapat mungkin untuk meningkatkan ketersediaan tinggi.

CPU, memory, GPU, and ephemeral storage configuration

  • Tentukan permintaan resource untuk CPU, memori, penyimpanan sementara, dan GPU untuk setiap kontainer menggunakan metode standar Kubernetes (resources.requests). Total permintaan resource pod adalah jumlah permintaan semua kontainernya. ACS secara otomatis menyesuaikan spesifikasi pod.

  • Tentukan batas resource untuk CPU, memori, penyimpanan sementara, dan GPU untuk setiap kontainer menggunakan metode standar Kubernetes (resources.limits). Jika tidak ditentukan, batas resource default untuk kontainer sama dengan total permintaan resource yang telah disesuaikan dari semua kontainer dalam pod.

Image

Secara default, setiap kali pod ACS dimulai, gambar kontainer ditarik melalui VPC yang terkait dengan pod tersebut. Jika gambarnya publik, Anda harus mengaktifkan gateway NAT untuk VPC tersebut. Kami merekomendasikan menyimpan gambar kontainer di Container Registry (ACR) Alibaba Cloud untuk mengurangi waktu pulling gambar melalui jaringan VPC. Selain itu, ACS menyediakan pulling gambar ACR tanpa kata sandi untuk gambar ACR privat.

Storage

ACS mendukung empat jenis penyimpanan persisten: cloud disk, NAS, OSS, dan CPFS.

Network

Secara default, setiap pod ACS menggunakan alamat IP pod khusus dan menempati satu antarmuka jaringan elastis (ENI) dari vSwitch.

Di kluster ACS, pod berkomunikasi menggunakan metode berikut:

Log collection

Konfigurasikan variabel lingkungan pod untuk mengumpulkan log stdout atau file dan mengirimkannya ke Alibaba Cloud Simple Log Service (SLS).

Spesifikasi resource

Peringatan

Di kluster ACS, spesifikasi pod untuk kelas komputasi GPU dan GPU-HPN secara otomatis disesuaikan saat pod dikirimkan. Misalnya, pod kelas komputasi GPU disesuaikan ke kelas QoS Guaranteed, di mana requests sama dengan limits. Saat Anda menggunakan kapasitas GPU ACS secara elastis melalui saluran lain, seperti kluster ACK atau kluster ACK One, penyesuaian spesifikasi tidak tercermin dalam metadata pod. Untuk mencegah kegagalan pembaruan status pod, pastikan kelas QoS pod tetap tidak berubah sebelum dan sesudah pengiriman. Misalnya, pod kelas komputasi GPU harus dikirimkan dengan kelas QoS Guaranteed.

Kelas komputasi tujuan umum

Kelas komputasi tujuan umum

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Lebar pita jaringan (dua arah) (Gbit/s)

Penyimpanan

0,25

0,5; 1; 2

N/A

0,08

Penyimpanan hingga 30 GiB gratis. Kapasitas di atas 30 GiB dikenai biaya untuk kelebihannya, dengan maksimum 512 GiB.

Untuk memperluas penyimpanan, mount volume NAS atau jenis penyimpanan lainnya.

0,5

1–4

1

0,08

1

1–8

0,1

1,5

2–12

1

2

2–16

2,5

3–20

1,5

3

3–24

3,5

4–28

4

4–32

4,5

5–36

5

5–40

5,5

6–44

6

6–48

6,5

7–52

2,5

7

7–56

7,5

8–60

8

8–64

8,5

9–68

9

9–72

9,5

10–76

10

10–80

10,5

11–84

11

11–88

11,5

12–92

12

12–96

12,5

13–100

3

13

13–104

13,5

14–108

14

14–112

14,5

15–116

15

15–120

15,5

16–124

16

16–128

24

24; 48; 96; 192

N/A

4,5

32

32; 64; 128; 256

N/A

6

48

48; 96; 192; 384

N/A

12,5

64

64; 128; 256; 512

N/A

20

Kelas komputasi performance-enhanced

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Lebar pita jaringan (dua arah) (Gbit/s)

Penyimpanan

0,25

0,5; 1; 2

N/A

0,1

Penyimpanan hingga 30 GiB gratis. Kapasitas di atas 30 GiB dikenai biaya untuk kelebihannya, dengan maksimum 512 GiB.

Untuk memperluas penyimpanan, mount volume NAS atau jenis penyimpanan lainnya.

0,5

1–4

1

0,5

1

1–8

1,5

2–12

2

2–16

1,5

2,5

3–20

3

3–24

3,5

4–28

4

4–32

2

4,5

5–36

5

5–40

5,5

6–44

6

6–48

2,5

6,5

7–52

7

7–56

7,5

8–60

8

8–64

3

8,5

9–68

9

9–72

9,5

10–76

10

10–80

3,5

10,5

11–84

11

11–88

11,5

12–92

12

12–96

4

12,5

13–100

13

13–104

13,5

14–108

14

14–112

4,5

14,5

15–116

15

15–120

15,5

16–124

16

16–128

6

24

24; 48; 96; 192

N/A

8

32

32; 64; 128; 256

N/A

10

48

48; 96; 192; 384

N/A

16

64

64; 128; 256; 512

N/A

25

Penting

Untuk menggunakan pod ACS dengan lebih dari 16 vCPU atau 128 GiB memori, Anda harus mengajukan tiket.

Jika Anda tidak menentukan permintaan atau batas resource untuk kontainer (baik .resources.requests maupun .resources.limits), setiap pod secara default menggunakan 2 vCPU dan 4 GiB memori.

ACS secara otomatis menyesuaikan spesifikasi pod dengan membulatkan total .resources.requests atau .resources.limits kontainer ke spesifikasi yang didukung terdekat. Spesifikasi yang telah disesuaikan tersedia dalam anotasi alibabacloud.com/pod-use-spec. Jika spesifikasi dibulatkan ke atas, ACS menyesuaikan .resources.requests atau .resources.limits kontainer agar semua resource berbayar dimanfaatkan.

Logika penyesuaian spesifikasi pod ACS

Sebagai contoh, jika jumlah .resources.requests atau .resources.limits adalah 2 vCPU dan 3,5 GiB memori, ACS secara otomatis menyesuaikan spesifikasi pod menjadi 2 vCPU dan 4 GiB memori saat startup. Resource tambahan diterapkan ke kontainer pertama, dan pod menerima anotasi alibabacloud.com/pod-use-spec=2-4Gi. Contoh deklarasi resource:

apiVersion: v1 
kind: Pod
metadata:
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 2 # Request 2 vCPUs.
        memory: "3.5Gi" # Request 3.5 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Deklarasi resource yang telah disesuaikan:

apiVersion: v1 
kind: Pod
metadata:
  annotations:
    alibabacloud.com/pod-use-spec: "2-4Gi"
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 2 # Request 2 vCPUs.
        memory: "4Gi" # Request 4 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Menentukan spesifikasi pod menggunakan anotasi

Cakupan penerapan

  • Fitur ini hanya mendukung pod CPU dari kelas komputasi general-purpose dan performance-enhanced.

  • Spesifikasi maksimum yang didukung oleh anotasi adalah 64 vCPU dan 512 GiB memori, yang tunduk pada batasan yang dijelaskan dalam Spesifikasi kelas komputasi tujuan umum.

Penggunaan

Untuk skenario di mana kelas Quality of Service (QoS) pod adalah Burstable (.resources.limits > .resources.requests), Anda dapat mendeklarasikan spesifikasi resource target untuk pod dengan menentukan anotasi alibabacloud.com/pod-required-spec: "X-YGi". Spesifikasi resource harus dalam format <CPU>-<Memory>, di mana CPU ditentukan dalam core (misalnya, "2" merepresentasikan 2 vCPU) dan memori ditentukan dalam GiB (misalnya, "4Gi" merepresentasikan 4 GiB). Aturan penyesuaian dan penggunaan resource yang terperinci adalah sebagai berikut:

  1. Jika format spesifikasi tidak valid (misalnya, tidak ada satuan, menggunakan Mi, atau urutannya salah), pod gagal dibuat.

  2. Jika anotasi diatur tetapi tidak ada kontainer yang mendefinisikan .resources, ACS secara ketat mengikuti nilai anotasi dan tidak kembali ke spesifikasi default (misalnya, 2 vCPU dan 4 GiB memori).

  3. Jika nilai anotasi kurang dari jumlah .resources.requests semua kontainer, pod gagal dibuat.

  4. Jika nilai anotasi melebihi jumlah .resources.limits semua kontainer, ACS menggunakan nilai anotasi sebagai spesifikasi target.

    Dalam pod multi-kontainer, kontainer pertama diidentifikasi sebagai kontainer utama. Selisih antara nilai anotasi dan jumlah limits saat ini dialokasikan ke .resources.limits (dan .resources.requests jika perlu) kontainer utama sehingga total resource pod sesuai dengan spesifikasi target.

Contoh

Sebagai contoh, jika Anda mengatur anotasi ke alibabacloud.com/pod-required-spec: "2-4Gi" dan jumlah .resources.requests atau .resources.limits kontainer adalah 1 vCPU dan 2 GiB memori, ACS secara otomatis mengatur spesifikasi pod menjadi 2 vCPU dan 4 GiB memori saat meluncurkan pod. Resource tambahan diterapkan ke kontainer pertama, dan pod dianotasi dengan alibabacloud.com/pod-use-spec=2-4Gi.

Contoh deklarasi resource:

Dalam contoh ini, .resources.limits.memory adalah 3,5 GiB.
apiVersion: v1 
kind: Pod
metadata:
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  annotations:
    alibabacloud.com/pod-required-spec: "2-4Gi"
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 1 # Request 1 vCPU.
        memory: "2Gi" # Request 2 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.
      limits:
        cpu: 2 # Request 2 vCPUs.
        memory: "3.5Gi" # Request 3.5 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Deklarasi resource yang telah disesuaikan:

Dalam deklarasi yang telah disesuaikan, .resources.limits.memory diubah dari 3,5 GiB menjadi 4 GiB.
apiVersion: v1 
kind: Pod
metadata:
  annotations:
    alibabacloud.com/pod-required-spec: "2-4Gi"
    alibabacloud.com/pod-use-spec: "2-4Gi"
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 1 # Request 1 vCPU.
        memory: "2Gi" # Request 2 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.
      limits:
        cpu: 2 # Request 2 vCPUs.
        memory: "4Gi" # Request 4 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Kelas komputasi dipercepat

Model GPU berikut didukung oleh ACS. Spesifikasi bervariasi tergantung modelnya. Untuk mempelajari pemetaan spesifiknya, ajukan tiket.

GU8TF

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (96 GB Memori GPU)

2

2–16

1

30–256

4

4–32

1

6

6–48

1

8

8–64

1

10

10–80

1

12

12–96

1

14

14–112

1

16

16–128

1

22

22; 32; 64; 128

N/A

2 (96 GB × 2 Memori GPU)

16

16–128

1

30–512

32

32; 64; 128; 230

N/A

46

64, 128, 230

N/A

4 (96 GB × 4 Memori GPU)

32

32; 64; 128; 256

N/A

30–1024

64

64; 128; 256; 460

N/A

92

128, 256, 460

N/A

8 (96 GB Memori GPU)

64

64; 128; 256; 512

N/A

30–2048

128

128; 256; 512; 920

N/A

184

256; 512; 920

N/A

GU8TEF

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (141 GB Memori GPU)

2

2–16

1

30–768

4

4–32

1

6

6–48

1

8

8–64

1

10

10–80

1

12

12–96

1

14

14–112

1

16

16–128

1

22

22; 32; 64; 128; 225

N/A

2 × 141 GB Memori GPU

16

16–128

1

30–1536

32

32; 64; 128; 256

N/A

46

64; 128; 256; 450

N/A

4 (141 GB × 4 Memori GPU)

32

32; 64; 128; 256

N/A

30–3072

64

64; 128; 256; 512

N/A

92

128, 256, 512, 900

N/A

8 × 141 GB Memori GPU

64

64; 128; 256; 512

N/A

30–6144

128

128, 256, 512, 1.024

N/A

184

256; 512; 1024; 1800

N/A

L20 (GN8IS)

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (48 GB Memori GPU)

2

2–16

1

30–256

4

4–32

1

6

6–48

1

8

8–64

1

10

10–80

1

12

12–96

1

14

14–112

1

16

16–120

1

2 (48 GB × 2 Memori GPU)

16

16–128

1

30–512

32

32; 64; 128; 230

N/A

4 (48 GB × 4 Memori GPU)

32

32; 64; 128; 256

N/A

30–1024

64

64; 128; 256; 460

N/A

8 (48 GB × 8 Memori GPU)

64

64; 128; 256; 512

N/A

30–2048

128

128; 256; 512; 920

N/A

L20X (GX8SF)

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

8 (141 GB × 8 Memori GPU)

184

1800

N/A

30–6144

P16EN

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (96 GB Memori GPU)

2

2–16

1

30–384

4

4–32

1

6

6–48

1

8

8–64

1

10

10–80

1

2 (96 GB × 2 Memori GPU)

4

4–32

1

30–768

6

6–48

1

8

8–64

1

16

16–128

1

22

32; 64; 128; 225

N/A

4 (96 GB × 4 Memori GPU)

8

8–64

1

30–1536

16

16–128

1

32

32; 64; 128; 256

N/A

46

64; 128; 256; 450

N/A

8 (96 GB × 8 Memori GPU)

16

16–128

1

30–3072

32

32; 64; 128; 256

N/A

64

64; 128; 256; 512

N/A

92

128; 256; 512; 900

N/A

16 × 96 GB Memori GPU

32

32; 64; 128; 256

N/A

30–6144

64

64; 128; 256; 512

N/A

128

128; 256; 512; 1024

N/A

184

256; 512; 1024; 1800

N/A

G49E

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (48 GB Memori GPU)

2

2–16

1

30–256

4

4–32

1

6

6–48

1

8

8–64

1

10

10–80

1

12

12–96

1

14

14–112

1

16

16–120

1

2 (48 GB × 2 Memori GPU)

16

16–128

1

30–512

32

32; 64; 128; 230

N/A

4 (48 GB × 4 Memori GPU)

32

32; 64; 128; 256

N/A

30–1024

64

64; 128; 256; 460

N/A

8 (48 GB × 8 Memori GPU)

64

64; 128; 256; 512

N/A

30–2048

128

128; 256; 512; 920

N/A

T4

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (16 GB Memori GPU)

2

2–8

1

30–1536

4

4–16

1

6

6–24

1

8

8–32

1

10

10–40

1

12

12–48

1

14

14–56

1

16

16–64

1

24

24; 48; 90

N/A

30–1536

2 (16 GB × 2 Memori GPU)

16

16–64

1

24

24; 48; 96

N/A

32

32, 64, 128

N/A

48

48, 96, 180

N/A

A10

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

1 (24 GB Memori GPU)

2

2–8

1

30–256

4

4–16

1

6

6–24

1

8

8–32

1

10

10–40

1

12

12–48

1

14

14–56

1

16

16–60

1

2 (24 GB × 2 Memori GPU)

16

16–64

1

30–512

32

32, 64, 120

N/A

4 (24 GB × 4 Memori GPU)

32

32; 64; 128

N/A

30–1024

64

64, 128, 240

N/A

8 (24 GB × 8 Memori GPU)

64

64; 128; 256

N/A

30–2048

128

128; 256; 480

N/A

G59

GPU (kartu)

vCPU

Memori (GiB)

Ukuran langkah memori (GiB)

Penyimpanan (GiB)

Jaringan

1 (32 GB Memori GPU)

2

2–16

1

30–256

1 Gbps per vCPU

4

4–32

1

6

6–48

1

8

8–64

1

10

10–80

1

12

12–96

1

14

14–112

1

16

16–128

1

22

22; 32; 64; 128

N/A

2 (32 GB × 2 Memori GPU)

16

16–128

1

30–512

32

32; 64; 128; 256

N/A

46

64; 128; 256; 360

N/A

4 (32 GB × 4 Memori GPU)

32

32; 64; 128; 256

N/A

30–1024

64

64; 128; 256; 512

N/A

92

128; 256; 512; 720

N/A

8 (32 GB × 8 Memori GPU)

64

64; 128; 256; 512

N/A

30–2048

128

128; 256; 512; 1024

N/A

100 Gbps

184

256; 512; 1024; 1440

N/A

Penting

Semua model GPU memiliki spesifikasi yang sama di seluruh skenario bayar sesuai penggunaan, reservasi kapasitas, dan BestEffort. Secara khusus:

  • Untuk spesifikasi dengan memori 16 GiB atau kurang, overhead memori ditangani oleh ACS. Untuk spesifikasi dengan memori lebih dari 16 GiB, overhead memori dialokasikan ke pod yang sesuai. Pastikan Anda menyisihkan resource yang cukup untuk aplikasi Anda guna menjamin operasi yang stabil.

  • Disk sistem hingga 30 GiB, termasuk ukuran image, tidak dikenai biaya tambahan. Jika disk sistem lebih besar dari 30 GiB, Anda akan dikenai biaya untuk kelebihannya.

Penyesuaian spesifikasi otomatis

Jika Anda tidak menentukan spesifikasi, pod kontainer GPU menggunakan spesifikasi pod terkecil berdasarkan tipe GPU. Misalnya, 2 vCPU, 2 GiB memori, dan satu kartu GPU.

ACS secara otomatis menyesuaikan spesifikasi yang tidak didukung. Setelah penyesuaian, .resources.requests kontainer tetap tidak berubah, tetapi spesifikasi pod tersedia dalam anotasi alibabacloud.com/pod-use-spec. Jika batas resource yang ditentukan kontainer (resources.limits) melebihi spesifikasi pod, ACS mengatur batas resource kontainer ke spesifikasi pod.

Catatan
  • Logika penyesuaian CPU dan memori: Jika total resource semua kontainer berjumlah 2 vCPU dan 3,5 GiB memori, ACS secara otomatis menyesuaikan pod menjadi 2 vCPU dan 4 GiB memori. Resource tambahan diterapkan ke kontainer pertama, dan pod menerima anotasi alibabacloud.com/pod-use-spec=2-4Gi. Jika satu kontainer dalam pod menentukan batas resource 3 vCPU dan 5 GiB memori, batas resource kontainer tersebut disesuaikan menjadi 2 vCPU dan 5 GiB.

  • Logika penyesuaian GPU: Jika jumlah GPU yang diminta tidak tercantum dalam tabel, pengiriman pod gagal.

Kelas komputasi GPU-HPN

Untuk kelas komputasi GPU-HPN, ACS menyelaraskan permintaan dan batas resource dengan mengatur limits sama dengan requests. Selain itu, spesifikasi pod dibatasi oleh kapasitas node. Jika spesifikasi melebihi kapasitas node, pod tetap dalam status pending karena resource tidak mencukupi. Untuk informasi lebih lanjut mengenai spesifikasi node tertentu, lihat dokumentasi spesifikasi pembelian.

Batasan aplikasi Kubernetes

ACS terintegrasi secara mulus dengan Kubernetes melalui node virtual. Pod ACS tidak ditempatkan pada node fisik terpusat, melainkan didistribusikan di kolam sumber daya Alibaba Cloud. Karena persyaratan keamanan cloud publik dan keterbatasan node virtual, ACS tidak mendukung fitur Kubernetes tertentu, seperti HostPath dan DaemonSet. Tabel berikut merinci batasan-batasan tersebut.

Batasan

Deskripsi

Kebijakan penanganan saat validasi gagal

Alternatif yang direkomendasikan

DaemonSet

Workload DaemonSet tidak didukung.

Pod berjalan tetapi tidak berfungsi seperti yang diharapkan.

Gunakan pola sidecar untuk men-deploy beberapa kontainer dalam pod.

NodePort service

Jenis layanan ini memetakan port host ke kontainer.

Pengiriman ditolak.

Gunakan Layanan type=LoadBalancer.

HostNetwork

Pemetaan port host ke kontainer tidak didukung.

Nilai ditulis ulang menjadi HostNetwork=false.

Opsional

HostIPC

Komunikasi antar proses antara kontainer dan proses host tidak didukung.

Nilai ditulis ulang menjadi HostIPC=false.

Tidak diperlukan

HostPID

Kontainer tidak dapat melihat namespace PID host.

Nilai ditulis ulang menjadi HostPID=false.

Tidak diperlukan

HostUsers

Membatasi namespace pengguna

Nilai ditulis ulang menjadi kosong.

Tidak diperlukan

DNSPolicy

Membatasi penggunaan DNSPolicy tertentu

Catatan
  • None

  • Default

  • ClusterFirst

  • Kebijakan `ClusterFirstWithHostNet` ditulis ulang menjadi `ClusterFirst`.

  • Pengiriman yang menggunakan kebijakan lain ditolak.

Gunakan salah satu nilai yang diizinkan.

Container environment variables

Selain batasan default dari server API Kubernetes, ACS mensyaratkan bahwa untuk kelas komputasi GPU dan GPU-HPN, nama variabel lingkungan terdiri dari huruf, angka, garis bawah, titik, atau tanda hubung. Nama tidak boleh diawali dengan angka.

Pod gagal dimulai.

Gunakan nama variabel lingkungan yang mengikuti format yang ditentukan.

Penggunaan port

Tabel berikut mencantumkan port yang digunakan oleh ACS. Hindari menggunakan port-port ini saat men-deploy layanan.

Port

Deskripsi

111, 10250, 10255

Digunakan oleh kluster ACS untuk antarmuka exec, log, metrik, dan lainnya.