Dalam lingkungan cloud computing dan kontainer modern, pod merupakan unit penyebaran terkecil di Kubernetes dan biasanya terdiri dari satu atau beberapa container. Kelas komputasi dan kualitas komputasi pod secara signifikan memengaruhi performa aplikasi serta pemanfaatan resource. Container Compute Service (ACS) menyediakan berbagai kelas komputasi dan tingkat kualitas komputasi yang sesuai untuk memenuhi beragam kebutuhan bisnis. Topik ini menjelaskan prasyarat, batasan, dan fitur inti pod ACS, termasuk isolasi keamanan, konfigurasi resource CPU, memori, dan GPU, pulling image, penyimpanan, jaringan, serta pengumpulan log.
Kelas komputasi
ACS menawarkan kelas komputasi kontainer CPU dan GPU yang hemat biaya. Setiap kelas komputasi memiliki alokasi resource berbeda untuk menyesuaikan dengan skenario bisnis tertentu.
Jenis Komputasi | Label | Fitur |
General-purpose (default) | general-purpose | Cocok untuk sebagian besar aplikasi microservice tanpa status, aplikasi web Java, dan tugas komputasi-intensif. |
Performance-enhanced | performance | Cocok untuk skenario berkinerja-tinggi seperti pelatihan dan inferensi AI/ML berbasis CPU serta pemrosesan batch HPC. |
GPU-accelerated | gpu | Cocok untuk skenario komputasi heterogen seperti AI dan HPC, termasuk inferensi single-GPU atau multi-GPU serta komputasi paralel GPU. |
GPU-HPN | gpu-hpn | Cocok untuk skenario komputasi heterogen seperti AI dan HPC, termasuk pelatihan terdistribusi GPU, inferensi terdistribusi, dan komputasi berkinerja-tinggi yang dipercepat GPU. |
Anda dapat menentukan kelas komputasi pod dengan menambahkan label alibabacloud.com/compute-class ke pod tersebut. Contoh berikut menunjukkan deployment aplikasi Nginx dengan kelas komputasi yang diatur ke general-purpose, gpu, dan gpu-hpn.
General-purpose
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
alibabacloud.com/compute-class: general-purpose
spec:
containers:
- name: nginx
image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latestGPU-accelerated
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
# Set compute-class to gpu.
alibabacloud.com/compute-class: "gpu"
# Set GPU model to example-model. Replace with your actual GPU model, such as T4.
alibabacloud.com/gpu-model-series: "example-model"
spec:
containers:
- name: nginx
image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest
resources:
limits:
cpu: 4
memory: "8Gi"
nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
requests:
cpu: 4
memory: "8Gi"
nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.Untuk informasi lebih lanjut mengenai model dan spesifikasi GPU yang didukung oleh ACS, lihat Tipe instans komputasi dipercepat.
High-Performance Network GPU Type
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
# Set compute-class to gpu-hpn.
alibabacloud.com/compute-class: "gpu-hpn"
spec:
containers:
- name: nginx
image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest
resources:
limits:
cpu: 4
memory: "8Gi"
nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.
requests:
cpu: 4
memory: "8Gi"
nvidia.com/gpu: "1" # Specify the number of GPUs. Set the resource label and quantity based on your actual needs.Untuk menggunakan GPU HPN di ACS, Anda harus terlebih dahulu membuat reservasi kapasitas GPU-HPN.
Definisi kualitas daya komputasi
ACS menyediakan dua kelas kualitas komputasi yang berbeda dalam alokasi resource untuk menyesuaikan dengan skenario bisnis tertentu.
Kualitas komputasi | Label | Fitur | Skenario khas |
Default | default |
|
|
BestEffort | best-effort |
|
|
Anda dapat menentukan kualitas komputasi pod dengan menambahkan label alibabacloud.com/compute-qos ke pod tersebut. Contoh berikut menunjukkan deployment aplikasi Nginx dengan kualitas komputasi diatur ke default.
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
alibabacloud.com/compute-qos: default
spec:
containers:
- name: nginx
image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest Kelas kualitas komputasi ACS berbeda dari kelas QoS native Kubernetes. Kelas kualitas komputasi default di ACS setara dengan kelas QoS Guaranteed di Kubernetes.
Instans BestEffort menggunakan inventaris dinamis. Di lingkungan produksi, Anda dapat mengonfigurasi penjadwalan prioritas inventaris sehingga ACS secara otomatis beralih ke kelas default ketika inventaris BestEffort tidak tersedia. Untuk informasi selengkapnya, lihat Kebijakan penjadwalan resource kustom.
Pemetaan antara kelas komputasi dan kelas kualitas komputasi
Kelas komputasi (label) | Kualitas komputasi yang didukung (label) |
General-purpose (general-purpose) | Default (default), BestEffort (best-effort) |
Performance-enhanced (performance) | Default (default), BestEffort (best-effort) |
GPU-accelerated (gpu) | Default (default), BestEffort (best-effort) |
GPU-HPN (gpu-hpn) | Default (default) |
Menentukan vendor CPU
Untuk kelas komputasi general-purpose dan performance-enhanced, Anda dapat memilih antara CPU Intel dan AMD.
Untuk menentukan vendor CPU, Anda dapat menambahkan anotasi alibabacloud.com/cpu-vendors ke pod Anda atau mendefinisikan anotasi alibabacloud.com/cpu-vendors dalam templat pod workload Anda. Untuk menentukan CPU AMD, Anda harus mengajukan tiket untuk menambahkan akun Anda ke daftar putih. Penentuan merek CPU tidak didukung untuk tipe instans selain General-purpose dan Performance-enhanced. Nilai yang didukung untuk anotasi ini tercantum di bawah:
Kunci | Nilai | Deskripsi |
| intel (default) | Menentukan CPU Intel. Jika tidak ditentukan, nilai default-nya adalah intel. |
amd | Menentukan CPU AMD. | |
intel,amd | Mengizinkan CPU Intel atau AMD. ACS memilih vendor CPU berdasarkan inventaris saat ini. Anda tidak dapat menentukan urutan preferensi. |
Setelah instans dibuat, Anda dapat memeriksa label alibabacloud.com/cpu-vendor dalam YAML pod untuk memverifikasi vendor CPU yang digunakan.
Contoh berikut menunjukkan Deployment untuk aplikasi Nginx yang menentukan vendor CPU sebagai amd.
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
alibabacloud.com/compute-class: general-purpose
alibabacloud.com/compute-qos: default
annotations:
alibabacloud.com/cpu-vendors: amd
spec:
containers:
- name: nginx
image: registry.cn-hangzhou.aliyuncs.com/acs-sample/nginx:latest Jangan gunakan label sistem ACS, seperti alibabacloud.com/compute-class, alibabacloud.com/compute-qos, dan alibabacloud.com/cpu-vendor, dalam pemilih matchLabels controller workload Anda. Label-label ini dapat dimodifikasi oleh sistem, yang dapat menyebabkan controller sering membuat ulang pod dan memengaruhi stabilitas aplikasi.
Fitur inti
Fitur | Deskripsi |
Security isolation | Pod ACS berjalan di lingkungan kontainer arsitektur tanpa server yang aman dan andal. Setiap pod sepenuhnya diisolasi pada lapisan dasar menggunakan teknologi sandbox ringan, memastikan tidak ada gangguan antar pod. Selain itu, ACS menjadwalkan pod di mesin fisik yang berbeda sedapat mungkin untuk meningkatkan ketersediaan tinggi. |
CPU, memory, GPU, and ephemeral storage configuration |
|
Image | Secara default, setiap kali pod ACS dimulai, gambar kontainer ditarik melalui VPC yang terkait dengan pod tersebut. Jika gambarnya publik, Anda harus mengaktifkan gateway NAT untuk VPC tersebut. Kami merekomendasikan menyimpan gambar kontainer di Container Registry (ACR) Alibaba Cloud untuk mengurangi waktu pulling gambar melalui jaringan VPC. Selain itu, ACS menyediakan pulling gambar ACR tanpa kata sandi untuk gambar ACR privat. |
Storage | ACS mendukung empat jenis penyimpanan persisten: cloud disk, NAS, OSS, dan CPFS.
|
Network | Secara default, setiap pod ACS menggunakan alamat IP pod khusus dan menempati satu antarmuka jaringan elastis (ENI) dari vSwitch. Di kluster ACS, pod berkomunikasi menggunakan metode berikut:
|
Log collection | Konfigurasikan variabel lingkungan pod untuk mengumpulkan log |
Spesifikasi resource
Di kluster ACS, spesifikasi pod untuk kelas komputasi GPU dan GPU-HPN secara otomatis disesuaikan saat pod dikirimkan. Misalnya, pod kelas komputasi GPU disesuaikan ke kelas QoS Guaranteed, di mana requests sama dengan limits. Saat Anda menggunakan kapasitas GPU ACS secara elastis melalui saluran lain, seperti kluster ACK atau kluster ACK One, penyesuaian spesifikasi tidak tercermin dalam metadata pod. Untuk mencegah kegagalan pembaruan status pod, pastikan kelas QoS pod tetap tidak berubah sebelum dan sesudah pengiriman. Misalnya, pod kelas komputasi GPU harus dikirimkan dengan kelas QoS Guaranteed.
Kelas komputasi tujuan umum
Kelas komputasi tujuan umum
vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Lebar pita jaringan (dua arah) (Gbit/s) | Penyimpanan |
0,25 | 0,5; 1; 2 | N/A | 0,08 | Penyimpanan hingga 30 GiB gratis. Kapasitas di atas 30 GiB dikenai biaya untuk kelebihannya, dengan maksimum 512 GiB. Untuk memperluas penyimpanan, mount volume NAS atau jenis penyimpanan lainnya. |
0,5 | 1–4 | 1 | 0,08 | |
1 | 1–8 | 0,1 | ||
1,5 | 2–12 | 1 | ||
2 | 2–16 | |||
2,5 | 3–20 | 1,5 | ||
3 | 3–24 | |||
3,5 | 4–28 | |||
4 | 4–32 | |||
4,5 | 5–36 | |||
5 | 5–40 | |||
5,5 | 6–44 | |||
6 | 6–48 | |||
6,5 | 7–52 | 2,5 | ||
7 | 7–56 | |||
7,5 | 8–60 | |||
8 | 8–64 | |||
8,5 | 9–68 | |||
9 | 9–72 | |||
9,5 | 10–76 | |||
10 | 10–80 | |||
10,5 | 11–84 | |||
11 | 11–88 | |||
11,5 | 12–92 | |||
12 | 12–96 | |||
12,5 | 13–100 | 3 | ||
13 | 13–104 | |||
13,5 | 14–108 | |||
14 | 14–112 | |||
14,5 | 15–116 | |||
15 | 15–120 | |||
15,5 | 16–124 | |||
16 | 16–128 | |||
24 | 24; 48; 96; 192 | N/A | 4,5 | |
32 | 32; 64; 128; 256 | N/A | 6 | |
48 | 48; 96; 192; 384 | N/A | 12,5 | |
64 | 64; 128; 256; 512 | N/A | 20 |
Kelas komputasi performance-enhanced
vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Lebar pita jaringan (dua arah) (Gbit/s) | Penyimpanan |
0,25 | 0,5; 1; 2 | N/A | 0,1 | Penyimpanan hingga 30 GiB gratis. Kapasitas di atas 30 GiB dikenai biaya untuk kelebihannya, dengan maksimum 512 GiB. Untuk memperluas penyimpanan, mount volume NAS atau jenis penyimpanan lainnya. |
0,5 | 1–4 | 1 | 0,5 | |
1 | 1–8 | |||
1,5 | 2–12 | |||
2 | 2–16 | 1,5 | ||
2,5 | 3–20 | |||
3 | 3–24 | |||
3,5 | 4–28 | |||
4 | 4–32 | 2 | ||
4,5 | 5–36 | |||
5 | 5–40 | |||
5,5 | 6–44 | |||
6 | 6–48 | 2,5 | ||
6,5 | 7–52 | |||
7 | 7–56 | |||
7,5 | 8–60 | |||
8 | 8–64 | 3 | ||
8,5 | 9–68 | |||
9 | 9–72 | |||
9,5 | 10–76 | |||
10 | 10–80 | 3,5 | ||
10,5 | 11–84 | |||
11 | 11–88 | |||
11,5 | 12–92 | |||
12 | 12–96 | 4 | ||
12,5 | 13–100 | |||
13 | 13–104 | |||
13,5 | 14–108 | |||
14 | 14–112 | 4,5 | ||
14,5 | 15–116 | |||
15 | 15–120 | |||
15,5 | 16–124 | |||
16 | 16–128 | 6 | ||
24 | 24; 48; 96; 192 | N/A | 8 | |
32 | 32; 64; 128; 256 | N/A | 10 | |
48 | 48; 96; 192; 384 | N/A | 16 | |
64 | 64; 128; 256; 512 | N/A | 25 |
Untuk menggunakan pod ACS dengan lebih dari 16 vCPU atau 128 GiB memori, Anda harus mengajukan tiket.
Jika Anda tidak menentukan permintaan atau batas resource untuk kontainer (baik .resources.requests maupun .resources.limits), setiap pod secara default menggunakan 2 vCPU dan 4 GiB memori.
ACS secara otomatis menyesuaikan spesifikasi pod dengan membulatkan total .resources.requests atau .resources.limits kontainer ke spesifikasi yang didukung terdekat. Spesifikasi yang telah disesuaikan tersedia dalam anotasi alibabacloud.com/pod-use-spec. Jika spesifikasi dibulatkan ke atas, ACS menyesuaikan .resources.requests atau .resources.limits kontainer agar semua resource berbayar dimanfaatkan.
Logika penyesuaian spesifikasi pod ACS
Sebagai contoh, jika jumlah .resources.requests atau .resources.limits adalah 2 vCPU dan 3,5 GiB memori, ACS secara otomatis menyesuaikan spesifikasi pod menjadi 2 vCPU dan 4 GiB memori saat startup. Resource tambahan diterapkan ke kontainer pertama, dan pod menerima anotasi alibabacloud.com/pod-use-spec=2-4Gi. Contoh deklarasi resource:
apiVersion: v1
kind: Pod
metadata:
labels:
app: nginx
alibabacloud.com/compute-class: general-purpose
alibabacloud.com/compute-qos: default
name: nginx
spec:
containers:
- name: nginx
image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
ports:
- containerPort: 80
resources:
requests:
cpu: 2 # Request 2 vCPUs.
memory: "3.5Gi" # Request 3.5 GiB of memory.
ephemeral-storage: "30Gi" # Request 30 GiB of storage.Deklarasi resource yang telah disesuaikan:
apiVersion: v1
kind: Pod
metadata:
annotations:
alibabacloud.com/pod-use-spec: "2-4Gi"
labels:
app: nginx
alibabacloud.com/compute-class: general-purpose
alibabacloud.com/compute-qos: default
name: nginx
spec:
containers:
- name: nginx
image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
ports:
- containerPort: 80
resources:
requests:
cpu: 2 # Request 2 vCPUs.
memory: "4Gi" # Request 4 GiB of memory.
ephemeral-storage: "30Gi" # Request 30 GiB of storage.Menentukan spesifikasi pod menggunakan anotasi
Cakupan penerapan
Fitur ini hanya mendukung pod CPU dari kelas komputasi general-purpose dan performance-enhanced.
Spesifikasi maksimum yang didukung oleh anotasi adalah 64 vCPU dan 512 GiB memori, yang tunduk pada batasan yang dijelaskan dalam Spesifikasi kelas komputasi tujuan umum.
Penggunaan
Untuk skenario di mana kelas Quality of Service (QoS) pod adalah Burstable (.resources.limits > .resources.requests), Anda dapat mendeklarasikan spesifikasi resource target untuk pod dengan menentukan anotasi alibabacloud.com/pod-required-spec: "X-YGi". Spesifikasi resource harus dalam format <CPU>-<Memory>, di mana CPU ditentukan dalam core (misalnya, "2" merepresentasikan 2 vCPU) dan memori ditentukan dalam GiB (misalnya, "4Gi" merepresentasikan 4 GiB). Aturan penyesuaian dan penggunaan resource yang terperinci adalah sebagai berikut:
Jika format spesifikasi tidak valid (misalnya, tidak ada satuan, menggunakan Mi, atau urutannya salah), pod gagal dibuat.
Jika anotasi diatur tetapi tidak ada kontainer yang mendefinisikan
.resources, ACS secara ketat mengikuti nilai anotasi dan tidak kembali ke spesifikasi default (misalnya, 2 vCPU dan 4 GiB memori).Jika nilai anotasi kurang dari jumlah
.resources.requestssemua kontainer, pod gagal dibuat.Jika nilai anotasi melebihi jumlah
.resources.limitssemua kontainer, ACS menggunakan nilai anotasi sebagai spesifikasi target.Dalam pod multi-kontainer, kontainer pertama diidentifikasi sebagai kontainer utama. Selisih antara nilai anotasi dan jumlah
limitssaat ini dialokasikan ke.resources.limits(dan.resources.requestsjika perlu) kontainer utama sehingga total resource pod sesuai dengan spesifikasi target.
Contoh
Sebagai contoh, jika Anda mengatur anotasi ke alibabacloud.com/pod-required-spec: "2-4Gi" dan jumlah .resources.requests atau .resources.limits kontainer adalah 1 vCPU dan 2 GiB memori, ACS secara otomatis mengatur spesifikasi pod menjadi 2 vCPU dan 4 GiB memori saat meluncurkan pod. Resource tambahan diterapkan ke kontainer pertama, dan pod dianotasi dengan alibabacloud.com/pod-use-spec=2-4Gi.
Contoh deklarasi resource:
Dalam contoh ini, .resources.limits.memory adalah 3,5 GiB.apiVersion: v1
kind: Pod
metadata:
labels:
app: nginx
alibabacloud.com/compute-class: general-purpose
alibabacloud.com/compute-qos: default
annotations:
alibabacloud.com/pod-required-spec: "2-4Gi"
name: nginx
spec:
containers:
- name: nginx
image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
ports:
- containerPort: 80
resources:
requests:
cpu: 1 # Request 1 vCPU.
memory: "2Gi" # Request 2 GiB of memory.
ephemeral-storage: "30Gi" # Request 30 GiB of storage.
limits:
cpu: 2 # Request 2 vCPUs.
memory: "3.5Gi" # Request 3.5 GiB of memory.
ephemeral-storage: "30Gi" # Request 30 GiB of storage.Deklarasi resource yang telah disesuaikan:
Dalam deklarasi yang telah disesuaikan, .resources.limits.memory diubah dari 3,5 GiB menjadi 4 GiB.apiVersion: v1
kind: Pod
metadata:
annotations:
alibabacloud.com/pod-required-spec: "2-4Gi"
alibabacloud.com/pod-use-spec: "2-4Gi"
labels:
app: nginx
alibabacloud.com/compute-class: general-purpose
alibabacloud.com/compute-qos: default
name: nginx
spec:
containers:
- name: nginx
image: anolis-registry.cn-zhangjiakou.cr.aliyuncs.com/openanolis/nginx:1.14.1-8.6
ports:
- containerPort: 80
resources:
requests:
cpu: 1 # Request 1 vCPU.
memory: "2Gi" # Request 2 GiB of memory.
ephemeral-storage: "30Gi" # Request 30 GiB of storage.
limits:
cpu: 2 # Request 2 vCPUs.
memory: "4Gi" # Request 4 GiB of memory.
ephemeral-storage: "30Gi" # Request 30 GiB of storage.Kelas komputasi dipercepat
Model GPU berikut didukung oleh ACS. Spesifikasi bervariasi tergantung modelnya. Untuk mempelajari pemetaan spesifiknya, ajukan tiket.
GU8TF
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (96 GB Memori GPU) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
22 | 22; 32; 64; 128 | N/A | ||
2 (96 GB × 2 Memori GPU) | 16 | 16–128 | 1 | 30–512 |
32 | 32; 64; 128; 230 | N/A | ||
46 | 64, 128, 230 | N/A | ||
4 (96 GB × 4 Memori GPU) | 32 | 32; 64; 128; 256 | N/A | 30–1024 |
64 | 64; 128; 256; 460 | N/A | ||
92 | 128, 256, 460 | N/A | ||
8 (96 GB Memori GPU) | 64 | 64; 128; 256; 512 | N/A | 30–2048 |
128 | 128; 256; 512; 920 | N/A | ||
184 | 256; 512; 920 | N/A |
GU8TEF
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (141 GB Memori GPU) | 2 | 2–16 | 1 | 30–768 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–128 | 1 | ||
22 | 22; 32; 64; 128; 225 | N/A | ||
2 × 141 GB Memori GPU | 16 | 16–128 | 1 | 30–1536 |
32 | 32; 64; 128; 256 | N/A | ||
46 | 64; 128; 256; 450 | N/A | ||
4 (141 GB × 4 Memori GPU) | 32 | 32; 64; 128; 256 | N/A | 30–3072 |
64 | 64; 128; 256; 512 | N/A | ||
92 | 128, 256, 512, 900 | N/A | ||
8 × 141 GB Memori GPU | 64 | 64; 128; 256; 512 | N/A | 30–6144 |
128 | 128, 256, 512, 1.024 | N/A | ||
184 | 256; 512; 1024; 1800 | N/A |
L20 (GN8IS)
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (48 GB Memori GPU) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–120 | 1 | ||
2 (48 GB × 2 Memori GPU) | 16 | 16–128 | 1 | 30–512 |
32 | 32; 64; 128; 230 | N/A | ||
4 (48 GB × 4 Memori GPU) | 32 | 32; 64; 128; 256 | N/A | 30–1024 |
64 | 64; 128; 256; 460 | N/A | ||
8 (48 GB × 8 Memori GPU) | 64 | 64; 128; 256; 512 | N/A | 30–2048 |
128 | 128; 256; 512; 920 | N/A |
L20X (GX8SF)
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
8 (141 GB × 8 Memori GPU) | 184 | 1800 | N/A | 30–6144 |
P16EN
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (96 GB Memori GPU) | 2 | 2–16 | 1 | 30–384 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
2 (96 GB × 2 Memori GPU) | 4 | 4–32 | 1 | 30–768 |
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
16 | 16–128 | 1 | ||
22 | 32; 64; 128; 225 | N/A | ||
4 (96 GB × 4 Memori GPU) | 8 | 8–64 | 1 | 30–1536 |
16 | 16–128 | 1 | ||
32 | 32; 64; 128; 256 | N/A | ||
46 | 64; 128; 256; 450 | N/A | ||
8 (96 GB × 8 Memori GPU) | 16 | 16–128 | 1 | 30–3072 |
32 | 32; 64; 128; 256 | N/A | ||
64 | 64; 128; 256; 512 | N/A | ||
92 | 128; 256; 512; 900 | N/A | ||
16 × 96 GB Memori GPU | 32 | 32; 64; 128; 256 | N/A | 30–6144 |
64 | 64; 128; 256; 512 | N/A | ||
128 | 128; 256; 512; 1024 | N/A | ||
184 | 256; 512; 1024; 1800 | N/A |
G49E
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (48 GB Memori GPU) | 2 | 2–16 | 1 | 30–256 |
4 | 4–32 | 1 | ||
6 | 6–48 | 1 | ||
8 | 8–64 | 1 | ||
10 | 10–80 | 1 | ||
12 | 12–96 | 1 | ||
14 | 14–112 | 1 | ||
16 | 16–120 | 1 | ||
2 (48 GB × 2 Memori GPU) | 16 | 16–128 | 1 | 30–512 |
32 | 32; 64; 128; 230 | N/A | ||
4 (48 GB × 4 Memori GPU) | 32 | 32; 64; 128; 256 | N/A | 30–1024 |
64 | 64; 128; 256; 460 | N/A | ||
8 (48 GB × 8 Memori GPU) | 64 | 64; 128; 256; 512 | N/A | 30–2048 |
128 | 128; 256; 512; 920 | N/A |
T4
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (16 GB Memori GPU) | 2 | 2–8 | 1 | 30–1536 |
4 | 4–16 | 1 | ||
6 | 6–24 | 1 | ||
8 | 8–32 | 1 | ||
10 | 10–40 | 1 | ||
12 | 12–48 | 1 | ||
14 | 14–56 | 1 | ||
16 | 16–64 | 1 | ||
24 | 24; 48; 90 | N/A | 30–1536 | |
2 (16 GB × 2 Memori GPU) | 16 | 16–64 | 1 | |
24 | 24; 48; 96 | N/A | ||
32 | 32, 64, 128 | N/A | ||
48 | 48, 96, 180 | N/A |
A10
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) |
1 (24 GB Memori GPU) | 2 | 2–8 | 1 | 30–256 |
4 | 4–16 | 1 | ||
6 | 6–24 | 1 | ||
8 | 8–32 | 1 | ||
10 | 10–40 | 1 | ||
12 | 12–48 | 1 | ||
14 | 14–56 | 1 | ||
16 | 16–60 | 1 | ||
2 (24 GB × 2 Memori GPU) | 16 | 16–64 | 1 | 30–512 |
32 | 32, 64, 120 | N/A | ||
4 (24 GB × 4 Memori GPU) | 32 | 32; 64; 128 | N/A | 30–1024 |
64 | 64, 128, 240 | N/A | ||
8 (24 GB × 8 Memori GPU) | 64 | 64; 128; 256 | N/A | 30–2048 |
128 | 128; 256; 480 | N/A |
G59
GPU (kartu) | vCPU | Memori (GiB) | Ukuran langkah memori (GiB) | Penyimpanan (GiB) | Jaringan |
1 (32 GB Memori GPU) | 2 | 2–16 | 1 | 30–256 | 1 Gbps per vCPU |
4 | 4–32 | 1 | |||
6 | 6–48 | 1 | |||
8 | 8–64 | 1 | |||
10 | 10–80 | 1 | |||
12 | 12–96 | 1 | |||
14 | 14–112 | 1 | |||
16 | 16–128 | 1 | |||
22 | 22; 32; 64; 128 | N/A | |||
2 (32 GB × 2 Memori GPU) | 16 | 16–128 | 1 | 30–512 | |
32 | 32; 64; 128; 256 | N/A | |||
46 | 64; 128; 256; 360 | N/A | |||
4 (32 GB × 4 Memori GPU) | 32 | 32; 64; 128; 256 | N/A | 30–1024 | |
64 | 64; 128; 256; 512 | N/A | |||
92 | 128; 256; 512; 720 | N/A | |||
8 (32 GB × 8 Memori GPU) | 64 | 64; 128; 256; 512 | N/A | 30–2048 | |
128 | 128; 256; 512; 1024 | N/A | 100 Gbps | ||
184 | 256; 512; 1024; 1440 | N/A |
Semua model GPU memiliki spesifikasi yang sama di seluruh skenario bayar sesuai penggunaan, reservasi kapasitas, dan BestEffort. Secara khusus:
Untuk spesifikasi dengan memori 16 GiB atau kurang, overhead memori ditangani oleh ACS. Untuk spesifikasi dengan memori lebih dari 16 GiB, overhead memori dialokasikan ke pod yang sesuai. Pastikan Anda menyisihkan resource yang cukup untuk aplikasi Anda guna menjamin operasi yang stabil.
Disk sistem hingga 30 GiB, termasuk ukuran image, tidak dikenai biaya tambahan. Jika disk sistem lebih besar dari 30 GiB, Anda akan dikenai biaya untuk kelebihannya.
Penyesuaian spesifikasi otomatis
Jika Anda tidak menentukan spesifikasi, pod kontainer GPU menggunakan spesifikasi pod terkecil berdasarkan tipe GPU. Misalnya, 2 vCPU, 2 GiB memori, dan satu kartu GPU.
ACS secara otomatis menyesuaikan spesifikasi yang tidak didukung. Setelah penyesuaian, .resources.requests kontainer tetap tidak berubah, tetapi spesifikasi pod tersedia dalam anotasi alibabacloud.com/pod-use-spec. Jika batas resource yang ditentukan kontainer (resources.limits) melebihi spesifikasi pod, ACS mengatur batas resource kontainer ke spesifikasi pod.
Logika penyesuaian CPU dan memori: Jika total resource semua kontainer berjumlah 2 vCPU dan 3,5 GiB memori, ACS secara otomatis menyesuaikan pod menjadi 2 vCPU dan 4 GiB memori. Resource tambahan diterapkan ke kontainer pertama, dan pod menerima anotasi
alibabacloud.com/pod-use-spec=2-4Gi. Jika satu kontainer dalam pod menentukan batas resource 3 vCPU dan 5 GiB memori, batas resource kontainer tersebut disesuaikan menjadi 2 vCPU dan 5 GiB.Logika penyesuaian GPU: Jika jumlah GPU yang diminta tidak tercantum dalam tabel, pengiriman pod gagal.
Kelas komputasi GPU-HPN
Untuk kelas komputasi GPU-HPN, ACS menyelaraskan permintaan dan batas resource dengan mengatur limits sama dengan requests. Selain itu, spesifikasi pod dibatasi oleh kapasitas node. Jika spesifikasi melebihi kapasitas node, pod tetap dalam status pending karena resource tidak mencukupi. Untuk informasi lebih lanjut mengenai spesifikasi node tertentu, lihat dokumentasi spesifikasi pembelian.
Batasan aplikasi Kubernetes
ACS terintegrasi secara mulus dengan Kubernetes melalui node virtual. Pod ACS tidak ditempatkan pada node fisik terpusat, melainkan didistribusikan di kolam sumber daya Alibaba Cloud. Karena persyaratan keamanan cloud publik dan keterbatasan node virtual, ACS tidak mendukung fitur Kubernetes tertentu, seperti HostPath dan DaemonSet. Tabel berikut merinci batasan-batasan tersebut.
Batasan | Deskripsi | Kebijakan penanganan saat validasi gagal | Alternatif yang direkomendasikan |
DaemonSet | Workload DaemonSet tidak didukung. | Pod berjalan tetapi tidak berfungsi seperti yang diharapkan. | Gunakan pola sidecar untuk men-deploy beberapa kontainer dalam pod. |
NodePort service | Jenis layanan ini memetakan port host ke kontainer. | Pengiriman ditolak. | Gunakan Layanan |
HostNetwork | Pemetaan port host ke kontainer tidak didukung. | Nilai ditulis ulang menjadi | Opsional |
HostIPC | Komunikasi antar proses antara kontainer dan proses host tidak didukung. | Nilai ditulis ulang menjadi | Tidak diperlukan |
HostPID | Kontainer tidak dapat melihat namespace PID host. | Nilai ditulis ulang menjadi | Tidak diperlukan |
HostUsers | Membatasi namespace pengguna | Nilai ditulis ulang menjadi kosong. | Tidak diperlukan |
DNSPolicy | Membatasi penggunaan DNSPolicy tertentu Catatan
|
| Gunakan salah satu nilai yang diizinkan. |
Container environment variables | Selain batasan default dari server API Kubernetes, ACS mensyaratkan bahwa untuk kelas komputasi GPU dan GPU-HPN, nama variabel lingkungan terdiri dari huruf, angka, garis bawah, titik, atau tanda hubung. Nama tidak boleh diawali dengan angka. | Pod gagal dimulai. | Gunakan nama variabel lingkungan yang mengikuti format yang ditentukan. |
Penggunaan port
Tabel berikut mencantumkan port yang digunakan oleh ACS. Hindari menggunakan port-port ini saat men-deploy layanan.
Port | Deskripsi |
111, 10250, 10255 | Digunakan oleh kluster ACS untuk antarmuka exec, log, metrik, dan lainnya. |