Ikhtisar pod ACS - Container Compute Service

Dalam lingkungan cloud computing dan kontainer modern, pod merupakan unit penyebaran terkecil di Kubernetes dan biasanya terdiri dari satu atau beberapa container. Kelas komputasi dan kualitas komputasi pod secara signifikan memengaruhi performa aplikasi serta pemanfaatan resource. Container Compute Service (ACS) menyediakan berbagai kelas komputasi dan tingkat kualitas komputasi yang sesuai untuk memenuhi beragam kebutuhan bisnis. Topik ini menjelaskan prasyarat, batasan, dan fitur inti pod ACS, termasuk isolasi keamanan, konfigurasi resource CPU, memori, dan GPU, pulling image, penyimpanan, jaringan, serta pengumpulan log.

Kelas komputasi

ACS menawarkan kelas komputasi kontainer CPU dan GPU yang hemat biaya. Setiap kelas komputasi memiliki alokasi resource berbeda untuk menyesuaikan dengan skenario bisnis tertentu.

Jenis Komputasi	Label	Fitur
General-purpose (default)	general-purpose	Cocok untuk sebagian besar aplikasi microservice tanpa status, aplikasi web Java, dan tugas komputasi-intensif.
Performance-enhanced	performance	Cocok untuk skenario berkinerja-tinggi seperti pelatihan dan inferensi AI/ML berbasis CPU serta pemrosesan batch HPC.
GPU-accelerated	gpu	Cocok untuk skenario komputasi heterogen seperti AI dan HPC, termasuk inferensi single-GPU atau multi-GPU serta komputasi paralel GPU.
GPU-HPN	gpu-hpn	Cocok untuk skenario komputasi heterogen seperti AI dan HPC, termasuk pelatihan terdistribusi GPU, inferensi terdistribusi, dan komputasi berkinerja-tinggi yang dipercepat GPU.

Anda dapat menentukan kelas komputasi pod dengan menambahkan label alibabacloud.com/compute-class ke pod tersebut. Contoh berikut menunjukkan deployment aplikasi Nginx dengan kelas komputasi yang diatur ke general-purpose, gpu, dan gpu-hpn.

General-purpose

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        alibabacloud.com/compute-class: general-purpose 
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest

GPU-accelerated

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        # Set compute-class to gpu.
        alibabacloud.com/compute-class: "gpu"
        # Set GPU model to example-model. Replace with your actual GPU model, such as T4.
        alibabacloud.com/gpu-model-series: "example-model"
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest
        resources:
          limits:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
          requests:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.

Catatan

Untuk informasi lebih lanjut mengenai model dan spesifikasi GPU yang didukung oleh ACS, lihat Tipe instans komputasi dipercepat.

High-Performance Network GPU Type

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        # Set compute-class to gpu-hpn.
        alibabacloud.com/compute-class: "gpu-hpn"
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest
        resources:
          limits:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
          requests:
            cpu: 4
            memory: "8Gi"
            nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.

Catatan

Untuk menggunakan GPU HPN di ACS, Anda harus terlebih dahulu membuat reservasi kapasitas GPU-HPN.

Definisi kualitas daya komputasi

ACS menyediakan dua kelas kualitas komputasi yang berbeda dalam alokasi resource untuk menyesuaikan dengan skenario bisnis tertentu.

Kualitas komputasi	Label	Fitur	Skenario khas
Default	default	Mungkin mengalami fluktuasi kecil pada daya komputasi. Tidak terjadi eviction paksa instans. Sebaliknya, kegagalan instans diselesaikan melalui migrasi panas, atau Anda diberi notifikasi untuk memicu eviction.	Aplikasi microservice Aplikasi web Tugas komputasi
BestEffort	best-effort	Mungkin mengalami fluktuasi kecil pada daya komputasi. Pod dapat dipreempt secara paksa dan dievict. ACS mengirim notifikasi event lima menit sebelum eviction.	Komputasi big data Transkoding audio dan video Tugas pemrosesan batch

Anda dapat menentukan kualitas komputasi pod dengan menambahkan label alibabacloud.com/compute-qos ke pod tersebut. Contoh berikut menunjukkan deployment aplikasi Nginx dengan kualitas komputasi diatur ke default.

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        alibabacloud.com/compute-qos: default
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest

Catatan

Kelas kualitas komputasi ACS berbeda dari kelas QoS native Kubernetes. Kelas kualitas komputasi default di ACS setara dengan kelas QoS Guaranteed di Kubernetes.
Instans BestEffort menggunakan inventaris dinamis. Di lingkungan produksi, Anda dapat mengonfigurasi penjadwalan prioritas inventaris sehingga ACS secara otomatis beralih ke kelas default ketika inventaris BestEffort tidak tersedia. Untuk informasi selengkapnya, lihat Kebijakan penjadwalan resource kustom.

Pemetaan antara kelas komputasi dan kelas kualitas komputasi

Kelas komputasi (label)	Kualitas komputasi yang didukung (label)
General-purpose (general-purpose)	Default (default), BestEffort (best-effort)
Performance-enhanced (performance)	Default (default), BestEffort (best-effort)
GPU-accelerated (gpu)	Default (default), BestEffort (best-effort)
GPU-HPN (gpu-hpn)	Default (default)

Menentukan vendor CPU

Untuk kelas komputasi general-purpose dan performance-enhanced, Anda dapat memilih antara CPU Intel dan AMD.

Untuk menentukan vendor CPU, Anda dapat menambahkan anotasi alibabacloud.com/cpu-vendors ke pod Anda atau mendefinisikan anotasi alibabacloud.com/cpu-vendors dalam templat pod workload Anda. Untuk menentukan CPU AMD, Anda harus mengajukan tiket untuk menambahkan akun Anda ke daftar putih. Penentuan merek CPU tidak didukung untuk tipe instans selain General-purpose dan Performance-enhanced. Nilai yang didukung untuk anotasi ini tercantum di bawah:

Kunci	Nilai	Deskripsi
`alibabacloud.com/cpu-vendors`	intel (default)	Menentukan CPU Intel. Jika tidak ditentukan, nilai default-nya adalah intel.
	amd	Menentukan CPU AMD.
	intel,amd	Mengizinkan CPU Intel atau AMD. ACS memilih vendor CPU berdasarkan inventaris saat ini. Anda tidak dapat menentukan urutan preferensi.

Setelah instans dibuat, Anda dapat memeriksa label alibabacloud.com/cpu-vendor dalam YAML pod untuk memverifikasi vendor CPU yang digunakan.

Contoh berikut menunjukkan Deployment untuk aplikasi Nginx yang menentukan vendor CPU sebagai amd.

apiVersion: apps/v1 
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
        alibabacloud.com/compute-class: general-purpose
        alibabacloud.com/compute-qos: default
      annotations:
        alibabacloud.com/cpu-vendors: amd
    spec:
      containers:
      - name: nginx
        image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest

Peringatan

Jangan gunakan label sistem ACS, seperti alibabacloud.com/compute-class, alibabacloud.com/compute-qos, dan alibabacloud.com/cpu-vendor, dalam pemilih matchLabels controller workload Anda. Label-label ini dapat dimodifikasi oleh sistem, yang dapat menyebabkan controller sering membuat ulang pod dan memengaruhi stabilitas aplikasi.

Fitur inti

Fitur	Deskripsi
Security isolation	Pod ACS berjalan di lingkungan kontainer arsitektur tanpa server yang aman dan andal. Setiap pod sepenuhnya diisolasi pada lapisan dasar menggunakan teknologi sandbox ringan, memastikan tidak ada gangguan antar pod. Selain itu, ACS menjadwalkan pod di mesin fisik yang berbeda sedapat mungkin untuk meningkatkan ketersediaan tinggi.
CPU, memory, GPU, and ephemeral storage configuration	Tentukan permintaan resource untuk CPU, memori, penyimpanan sementara, dan GPU untuk setiap kontainer menggunakan metode standar Kubernetes (`resources.requests`). Total permintaan resource pod adalah jumlah permintaan semua kontainernya. ACS secara otomatis menyesuaikan spesifikasi pod. Tentukan batas resource untuk CPU, memori, penyimpanan sementara, dan GPU untuk setiap kontainer menggunakan metode standar Kubernetes (`resources.limits`). Jika tidak ditentukan, batas resource default untuk kontainer sama dengan total permintaan resource yang telah disesuaikan dari semua kontainer dalam pod.
Image	Secara default, setiap kali pod ACS dimulai, gambar kontainer ditarik melalui VPC yang terkait dengan pod tersebut. Jika gambarnya publik, Anda harus mengaktifkan gateway NAT untuk VPC tersebut. Kami merekomendasikan menyimpan gambar kontainer di Container Registry (ACR) Alibaba Cloud untuk mengurangi waktu pulling gambar melalui jaringan VPC. Selain itu, ACS menyediakan pulling gambar ACR tanpa kata sandi untuk gambar ACR privat.
Storage	ACS mendukung empat jenis penyimpanan persisten: cloud disk, NAS, OSS, dan CPFS. Cloud disk Mendukung ESSD, ESSD AutoPL, SSD, dan ultra disk. Pilih tipe disk sesuai kebutuhan Anda. Untuk detailnya, lihat Ikhtisar volume cloud disk. Mendukung provisioning PV secara dinamis. Untuk detailnya, lihat Menggunakan volume cloud disk yang disediakan secara dinamis. NAS Provisioning statis mendukung sistem file NAS tujuan umum dan NAS Ekstrem. Provisioning dinamis membuat sistem file NAS tujuan umum secara default. Untuk detailnya, lihat Detail. Mendukung provisioning PV baik secara dinamis maupun statis. Untuk detailnya, lihat Ikhtisar volume NAS. OSS Mendukung provisioning PV secara statis. Untuk detailnya, lihat Menggunakan volume OSS yang disediakan secara statis. CPFS Mendukung provisioning PV secara statis. Untuk detailnya, lihat Menggunakan volume CPFS yang disediakan secara statis.
Network	Secara default, setiap pod ACS menggunakan alamat IP pod khusus dan menempati satu antarmuka jaringan elastis (ENI) dari vSwitch. Di kluster ACS, pod berkomunikasi menggunakan metode berikut: Akses langsung menggunakan alamat IP pod. Mount pod ACS ke Layanan LoadBalancer. Untuk detailnya, lihat Mengekspos aplikasi menggunakan instans Server Load Balancer yang ada. Akses Layanan ClusterIP: Pod ACS dapat mengakses alamat IP kluster. Untuk detailnya, lihat Membuat Layanan ClusterIP. Lampirkan EIP: Lampirkan EIP ke pod ACS, baik melalui pembuatan otomatis maupun mengikat ke instans EIP yang ada. Untuk detailnya, lihat Melampirkan EIP ke pod menggunakan anotasi.
Log collection	Konfigurasikan variabel lingkungan pod untuk mengumpulkan log `stdout` atau file dan mengirimkannya ke Alibaba Cloud Simple Log Service (SLS).

Spesifikasi resource

Peringatan

Di kluster ACS, spesifikasi pod untuk kelas komputasi GPU dan GPU-HPN secara otomatis disesuaikan saat pod dikirimkan. Misalnya, pod kelas komputasi GPU disesuaikan ke kelas QoS Guaranteed, di mana requests sama dengan limits. Saat Anda menggunakan kapasitas GPU ACS secara elastis melalui saluran lain, seperti kluster ACK atau kluster ACK One, penyesuaian spesifikasi tidak tercermin dalam metadata pod. Untuk mencegah kegagalan pembaruan status pod, pastikan kelas QoS pod tetap tidak berubah sebelum dan sesudah pengiriman. Misalnya, pod kelas komputasi GPU harus dikirimkan dengan kelas QoS Guaranteed.

Kelas komputasi tujuan umum

vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Lebar pita jaringan (dua arah) (Gbit/s)	Penyimpanan
0,25	0,5; 1; 2	N/A	0,08	Penyimpanan hingga 30 GiB gratis. Kapasitas di atas 30 GiB dikenai biaya untuk kelebihannya, dengan maksimum 512 GiB. Untuk memperluas penyimpanan, mount volume NAS atau jenis penyimpanan lainnya.
0,5	1–4	1	0,08
1	1–8		0,1
1,5	2–12		1
2	2–16		1
2,5	3–20		1,5
3	3–24
3,5	4–28
4	4–32
4,5	5–36
5	5–40
5,5	6–44
6	6–48
6,5	7–52		2,5
7	7–56
7,5	8–60
8	8–64
8,5	9–68
9	9–72
9,5	10–76
10	10–80
10,5	11–84
11	11–88
11,5	12–92
12	12–96
12,5	13–100		3
13	13–104
13,5	14–108
14	14–112
14,5	15–116
15	15–120
15,5	16–124
16	16–128
24	24; 48; 96; 192	N/A	4,5
32	32; 64; 128; 256	N/A	6
48	48; 96; 192; 384	N/A	12,5
64	64; 128; 256; 512	N/A	20

Kelas komputasi performance-enhanced

vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Lebar pita jaringan (dua arah) (Gbit/s)	Penyimpanan
0,25	0,5; 1; 2	N/A	0,1	Penyimpanan hingga 30 GiB gratis. Kapasitas di atas 30 GiB dikenai biaya untuk kelebihannya, dengan maksimum 512 GiB. Untuk memperluas penyimpanan, mount volume NAS atau jenis penyimpanan lainnya.
0,5	1–4	1	0,5
1	1–8
1,5	2–12
2	2–16		1,5
2,5	3–20
3	3–24
3,5	4–28
4	4–32		2
4,5	5–36
5	5–40
5,5	6–44
6	6–48		2,5
6,5	7–52
7	7–56
7,5	8–60
8	8–64		3
8,5	9–68
9	9–72
9,5	10–76
10	10–80		3,5
10,5	11–84
11	11–88
11,5	12–92
12	12–96		4
12,5	13–100
13	13–104
13,5	14–108
14	14–112		4,5
14,5	15–116
15	15–120
15,5	16–124
16	16–128		6
24	24; 48; 96; 192	N/A	8
32	32; 64; 128; 256	N/A	10
48	48; 96; 192; 384	N/A	16
64	64; 128; 256; 512	N/A	25

Penting

Untuk menggunakan pod ACS dengan lebih dari 16 vCPU atau 128 GiB memori, Anda harus mengajukan tiket.

Jika Anda tidak menentukan permintaan atau batas resource untuk kontainer (baik .resources.requests maupun .resources.limits), setiap pod secara default menggunakan 2 vCPU dan 4 GiB memori.

ACS secara otomatis menyesuaikan spesifikasi pod dengan membulatkan total .resources.requests atau .resources.limits kontainer ke spesifikasi yang didukung terdekat. Spesifikasi yang telah disesuaikan tersedia dalam anotasi alibabacloud.com/pod-use-spec. Jika spesifikasi dibulatkan ke atas, ACS menyesuaikan .resources.requests atau .resources.limits kontainer agar semua resource berbayar dimanfaatkan.

Logika penyesuaian spesifikasi pod ACS

Sebagai contoh, jika jumlah .resources.requests atau .resources.limits adalah 2 vCPU dan 3,5 GiB memori, ACS secara otomatis menyesuaikan spesifikasi pod menjadi 2 vCPU dan 4 GiB memori saat startup. Resource tambahan diterapkan ke kontainer pertama, dan pod menerima anotasi alibabacloud.com/pod-use-spec=2-4Gi. Contoh deklarasi resource:

apiVersion: v1 
kind: Pod
metadata:
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 2 # Request 2 vCPUs.
        memory: "3.5Gi" # Request 3.5 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Deklarasi resource yang telah disesuaikan:

apiVersion: v1 
kind: Pod
metadata:
  annotations:
    alibabacloud.com/pod-use-spec: "2-4Gi"
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 2 # Request 2 vCPUs.
        memory: "4Gi" # Request 4 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Menentukan spesifikasi pod menggunakan anotasi

Cakupan penerapan

Fitur ini hanya mendukung pod CPU dari kelas komputasi general-purpose dan performance-enhanced.
Spesifikasi maksimum yang didukung oleh anotasi adalah 64 vCPU dan 512 GiB memori, yang tunduk pada batasan yang dijelaskan dalam Spesifikasi kelas komputasi tujuan umum.

Penggunaan

Untuk skenario di mana kelas Quality of Service (QoS) pod adalah Burstable (.resources.limits > .resources.requests), Anda dapat mendeklarasikan spesifikasi resource target untuk pod dengan menentukan anotasi alibabacloud.com/pod-required-spec: "X-YGi". Spesifikasi resource harus dalam format <CPU>-<Memory>, di mana CPU ditentukan dalam core (misalnya, "2" merepresentasikan 2 vCPU) dan memori ditentukan dalam GiB (misalnya, "4Gi" merepresentasikan 4 GiB). Aturan penyesuaian dan penggunaan resource yang terperinci adalah sebagai berikut:

Jika format spesifikasi tidak valid (misalnya, tidak ada satuan, menggunakan Mi, atau urutannya salah), pod gagal dibuat.
Jika anotasi diatur tetapi tidak ada kontainer yang mendefinisikan .resources, ACS secara ketat mengikuti nilai anotasi dan tidak kembali ke spesifikasi default (misalnya, 2 vCPU dan 4 GiB memori).
Jika nilai anotasi kurang dari jumlah .resources.requests semua kontainer, pod gagal dibuat.
Jika nilai anotasi melebihi jumlah .resources.limits semua kontainer, ACS menggunakan nilai anotasi sebagai spesifikasi target.
Dalam pod multi-kontainer, kontainer pertama diidentifikasi sebagai kontainer utama. Selisih antara nilai anotasi dan jumlah limits saat ini dialokasikan ke .resources.limits (dan .resources.requests jika perlu) kontainer utama sehingga total resource pod sesuai dengan spesifikasi target.

Contoh

Sebagai contoh, jika Anda mengatur anotasi ke alibabacloud.com/pod-required-spec: "2-4Gi" dan jumlah .resources.requests atau .resources.limits kontainer adalah 1 vCPU dan 2 GiB memori, ACS secara otomatis mengatur spesifikasi pod menjadi 2 vCPU dan 4 GiB memori saat meluncurkan pod. Resource tambahan diterapkan ke kontainer pertama, dan pod dianotasi dengan alibabacloud.com/pod-use-spec=2-4Gi.

Contoh deklarasi resource:

Dalam contoh ini, .resources.limits.memory adalah 3,5 GiB.

apiVersion: v1 
kind: Pod
metadata:
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  annotations:
    alibabacloud.com/pod-required-spec: "2-4Gi"
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 1 # Request 1 vCPU.
        memory: "2Gi" # Request 2 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.
      limits:
        cpu: 2 # Request 2 vCPUs.
        memory: "3.5Gi" # Request 3.5 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Deklarasi resource yang telah disesuaikan:

Dalam deklarasi yang telah disesuaikan, .resources.limits.memory diubah dari 3,5 GiB menjadi 4 GiB.

apiVersion: v1 
kind: Pod
metadata:
  annotations:
    alibabacloud.com/pod-required-spec: "2-4Gi"
    alibabacloud.com/pod-use-spec: "2-4Gi"
  labels:
    app: nginx
    alibabacloud.com/compute-class: general-purpose
    alibabacloud.com/compute-qos: default
  name: nginx
spec:
  containers:
  - name: nginx
    image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
    ports:
    - containerPort: 80
    resources:
      requests:
        cpu: 1 # Request 1 vCPU.
        memory: "2Gi" # Request 2 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.
      limits:
        cpu: 2 # Request 2 vCPUs.
        memory: "4Gi" # Request 4 GiB of memory.
        ephemeral-storage: "30Gi" # Request 30 GiB of storage.

Kelas komputasi dipercepat

Model GPU berikut didukung oleh ACS. Spesifikasi bervariasi tergantung modelnya. Untuk mempelajari pemetaan spesifiknya, ajukan tiket.

GU8TF

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (96 GB Memori GPU)	2	2–16	1	30–256
	4	4–32	1
	6	6–48	1
	8	8–64	1
	10	10–80	1
	12	12–96	1
	14	14–112	1
	16	16–128	1
	22	22; 32; 64; 128	N/A
2 (96 GB × 2 Memori GPU)	16	16–128	1	30–512
	32	32; 64; 128; 230	N/A
	46	64, 128, 230	N/A
4 (96 GB × 4 Memori GPU)	32	32; 64; 128; 256	N/A	30–1024
	64	64; 128; 256; 460	N/A
	92	128, 256, 460	N/A
8 (96 GB Memori GPU)	64	64; 128; 256; 512	N/A	30–2048
	128	128; 256; 512; 920	N/A
	184	256; 512; 920	N/A

GU8TEF

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (141 GB Memori GPU)	2	2–16	1	30–768
	4	4–32	1
	6	6–48	1
	8	8–64	1
	10	10–80	1
	12	12–96	1
	14	14–112	1
	16	16–128	1
	22	22; 32; 64; 128; 225	N/A
2 × 141 GB Memori GPU	16	16–128	1	30–1536
	32	32; 64; 128; 256	N/A
	46	64; 128; 256; 450	N/A
4 (141 GB × 4 Memori GPU)	32	32; 64; 128; 256	N/A	30–3072
	64	64; 128; 256; 512	N/A
	92	128, 256, 512, 900	N/A
8 × 141 GB Memori GPU	64	64; 128; 256; 512	N/A	30–6144
	128	128, 256, 512, 1.024	N/A
	184	256; 512; 1024; 1800	N/A

L20 (GN8IS)

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (48 GB Memori GPU)	2	2–16	1	30–256
	4	4–32	1
	6	6–48	1
	8	8–64	1
	10	10–80	1
	12	12–96	1
	14	14–112	1
	16	16–120	1
2 (48 GB × 2 Memori GPU)	16	16–128	1	30–512
2 (48 GB × 2 Memori GPU)	32	32; 64; 128; 230	N/A	30–512
4 (48 GB × 4 Memori GPU)	32	32; 64; 128; 256	N/A	30–1024
4 (48 GB × 4 Memori GPU)	64	64; 128; 256; 460	N/A	30–1024
8 (48 GB × 8 Memori GPU)	64	64; 128; 256; 512	N/A	30–2048
8 (48 GB × 8 Memori GPU)	128	128; 256; 512; 920	N/A	30–2048

L20X (GX8SF)

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
8 (141 GB × 8 Memori GPU)	184	1800	N/A	30–6144

P16EN

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (96 GB Memori GPU)	2	2–16	1	30–384
	4	4–32	1
	6	6–48	1
	8	8–64	1
	10	10–80	1
2 (96 GB × 2 Memori GPU)	4	4–32	1	30–768
	6	6–48	1
	8	8–64	1
	16	16–128	1
	22	32; 64; 128; 225	N/A
4 (96 GB × 4 Memori GPU)	8	8–64	1	30–1536
	16	16–128	1
	32	32; 64; 128; 256	N/A
	46	64; 128; 256; 450	N/A
8 (96 GB × 8 Memori GPU)	16	16–128	1	30–3072
	32	32; 64; 128; 256	N/A
	64	64; 128; 256; 512	N/A
	92	128; 256; 512; 900	N/A
16 × 96 GB Memori GPU	32	32; 64; 128; 256	N/A	30–6144
	64	64; 128; 256; 512	N/A
	128	128; 256; 512; 1024	N/A
	184	256; 512; 1024; 1800	N/A

G49E

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (48 GB Memori GPU)	2	2–16	1	30–256
	4	4–32	1
	6	6–48	1
	8	8–64	1
	10	10–80	1
	12	12–96	1
	14	14–112	1
	16	16–120	1
2 (48 GB × 2 Memori GPU)	16	16–128	1	30–512
2 (48 GB × 2 Memori GPU)	32	32; 64; 128; 230	N/A	30–512
4 (48 GB × 4 Memori GPU)	32	32; 64; 128; 256	N/A	30–1024
4 (48 GB × 4 Memori GPU)	64	64; 128; 256; 460	N/A	30–1024
8 (48 GB × 8 Memori GPU)	64	64; 128; 256; 512	N/A	30–2048
8 (48 GB × 8 Memori GPU)	128	128; 256; 512; 920	N/A	30–2048

T4

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (16 GB Memori GPU)	2	2–8	1	30–1536
	4	4–16	1
	6	6–24	1
	8	8–32	1
	10	10–40	1
	12	12–48	1
	14	14–56	1
	16	16–64	1
	24	24; 48; 90	N/A	30–1536
2 (16 GB × 2 Memori GPU)	16	16–64	1
	24	24; 48; 96	N/A
	32	32, 64, 128	N/A
	48	48, 96, 180	N/A

A10

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)
1 (24 GB Memori GPU)	2	2–8	1	30–256
	4	4–16	1
	6	6–24	1
	8	8–32	1
	10	10–40	1
	12	12–48	1
	14	14–56	1
	16	16–60	1
2 (24 GB × 2 Memori GPU)	16	16–64	1	30–512
2 (24 GB × 2 Memori GPU)	32	32, 64, 120	N/A	30–512
4 (24 GB × 4 Memori GPU)	32	32; 64; 128	N/A	30–1024
4 (24 GB × 4 Memori GPU)	64	64, 128, 240	N/A	30–1024
8 (24 GB × 8 Memori GPU)	64	64; 128; 256	N/A	30–2048
8 (24 GB × 8 Memori GPU)	128	128; 256; 480	N/A	30–2048

G59

GPU (kartu)	vCPU	Memori (GiB)	Ukuran langkah memori (GiB)	Penyimpanan (GiB)	Jaringan
1 (32 GB Memori GPU)	2	2–16	1	30–256	1 Gbps per vCPU
	4	4–32	1
	6	6–48	1
	8	8–64	1
	10	10–80	1
	12	12–96	1
	14	14–112	1
	16	16–128	1
	22	22; 32; 64; 128	N/A
2 (32 GB × 2 Memori GPU)	16	16–128	1	30–512
	32	32; 64; 128; 256	N/A
	46	64; 128; 256; 360	N/A
4 (32 GB × 4 Memori GPU)	32	32; 64; 128; 256	N/A	30–1024
	64	64; 128; 256; 512	N/A
	92	128; 256; 512; 720	N/A
8 (32 GB × 8 Memori GPU)	64	64; 128; 256; 512	N/A	30–2048
	128	128; 256; 512; 1024	N/A		100 Gbps
	184	256; 512; 1024; 1440	N/A		100 Gbps

Penting

Semua model GPU memiliki spesifikasi yang sama di seluruh skenario bayar sesuai penggunaan, reservasi kapasitas, dan BestEffort. Secara khusus:

Untuk spesifikasi dengan memori 16 GiB atau kurang, overhead memori ditangani oleh ACS. Untuk spesifikasi dengan memori lebih dari 16 GiB, overhead memori dialokasikan ke pod yang sesuai. Pastikan Anda menyisihkan resource yang cukup untuk aplikasi Anda guna menjamin operasi yang stabil.
Disk sistem hingga 30 GiB, termasuk ukuran image, tidak dikenai biaya tambahan. Jika disk sistem lebih besar dari 30 GiB, Anda akan dikenai biaya untuk kelebihannya.

Penyesuaian spesifikasi otomatis

Jika Anda tidak menentukan spesifikasi, pod kontainer GPU menggunakan spesifikasi pod terkecil berdasarkan tipe GPU. Misalnya, 2 vCPU, 2 GiB memori, dan satu kartu GPU.

ACS secara otomatis menyesuaikan spesifikasi yang tidak didukung. Setelah penyesuaian, .resources.requests kontainer tetap tidak berubah, tetapi spesifikasi pod tersedia dalam anotasi alibabacloud.com/pod-use-spec. Jika batas resource yang ditentukan kontainer (resources.limits) melebihi spesifikasi pod, ACS mengatur batas resource kontainer ke spesifikasi pod.

Catatan

Logika penyesuaian CPU dan memori: Jika total resource semua kontainer berjumlah 2 vCPU dan 3,5 GiB memori, ACS secara otomatis menyesuaikan pod menjadi 2 vCPU dan 4 GiB memori. Resource tambahan diterapkan ke kontainer pertama, dan pod menerima anotasi alibabacloud.com/pod-use-spec=2-4Gi. Jika satu kontainer dalam pod menentukan batas resource 3 vCPU dan 5 GiB memori, batas resource kontainer tersebut disesuaikan menjadi 2 vCPU dan 5 GiB.
Logika penyesuaian GPU: Jika jumlah GPU yang diminta tidak tercantum dalam tabel, pengiriman pod gagal.

Kelas komputasi GPU-HPN

Untuk kelas komputasi GPU-HPN, ACS menyelaraskan permintaan dan batas resource dengan mengatur limits sama dengan requests. Selain itu, spesifikasi pod dibatasi oleh kapasitas node. Jika spesifikasi melebihi kapasitas node, pod tetap dalam status pending karena resource tidak mencukupi. Untuk informasi lebih lanjut mengenai spesifikasi node tertentu, lihat dokumentasi spesifikasi pembelian.

Batasan aplikasi Kubernetes

ACS terintegrasi secara mulus dengan Kubernetes melalui node virtual. Pod ACS tidak ditempatkan pada node fisik terpusat, melainkan didistribusikan di kolam sumber daya Alibaba Cloud. Karena persyaratan keamanan cloud publik dan keterbatasan node virtual, ACS tidak mendukung fitur Kubernetes tertentu, seperti HostPath dan DaemonSet. Tabel berikut merinci batasan-batasan tersebut.

Batasan	Deskripsi	Kebijakan penanganan saat validasi gagal	Alternatif yang direkomendasikan
DaemonSet	Workload DaemonSet tidak didukung.	Pod berjalan tetapi tidak berfungsi seperti yang diharapkan.	Gunakan pola sidecar untuk men-deploy beberapa kontainer dalam pod.
NodePort service	Jenis layanan ini memetakan port host ke kontainer.	Pengiriman ditolak.	Gunakan Layanan `type=LoadBalancer`.
HostNetwork	Pemetaan port host ke kontainer tidak didukung.	Nilai ditulis ulang menjadi `HostNetwork=false`.	Opsional
HostIPC	Komunikasi antar proses antara kontainer dan proses host tidak didukung.	Nilai ditulis ulang menjadi `HostIPC=false`.	Tidak diperlukan
HostPID	Kontainer tidak dapat melihat namespace PID host.	Nilai ditulis ulang menjadi `HostPID=false`.	Tidak diperlukan
HostUsers	Membatasi namespace pengguna	Nilai ditulis ulang menjadi kosong.	Tidak diperlukan
DNSPolicy	Membatasi penggunaan DNSPolicy tertentu Catatan None Default ClusterFirst	Kebijakan `ClusterFirstWithHostNet` ditulis ulang menjadi `ClusterFirst`. Pengiriman yang menggunakan kebijakan lain ditolak.	Gunakan salah satu nilai yang diizinkan.
Container environment variables	Selain batasan default dari server API Kubernetes, ACS mensyaratkan bahwa untuk kelas komputasi GPU dan GPU-HPN, nama variabel lingkungan terdiri dari huruf, angka, garis bawah, titik, atau tanda hubung. Nama tidak boleh diawali dengan angka.	Pod gagal dimulai.	Gunakan nama variabel lingkungan yang mengikuti format yang ditentukan.

Penggunaan port

Tabel berikut mencantumkan port yang digunakan oleh ACS. Hindari menggunakan port-port ini saat men-deploy layanan.

Port	Deskripsi
111, 10250, 10255	Digunakan oleh kluster ACS untuk antarmuka exec, log, metrik, dan lainnya.