Pemesanan kapasitas Pod GPU - Container Compute Service

Pemesanan kapasitas berbasis Pod menjamin ketersediaan resource untuk layanan elastis. Pemesanan kapasitas Pod GPU tidak perlu dihubungkan ke kluster. Saat membeli pemesanan, Anda menentukan properti seperti spesifikasi Pod, zona, dan durasi pemesanan. ACS kemudian menjamin bahwa Anda dapat menjalankan Pod dengan spesifikasi tersebut dalam hitungan menit. Pemesanan kapasitas Pod GPU memastikan ketersediaan resource dan lebih hemat biaya dibandingkan Pod pay-as-you-go. Topik ini menjelaskan fitur-fitur pemesanan kapasitas Pod GPU.

Fitur

Ketersediaan resource: Selama periode berlaku pemesanan kapasitas, sistem menjamin Anda dapat berhasil menjalankan resource tersebut.
Pengurangan biaya: Setelah Pod dijalankan, penagihan dilakukan berdasarkan tarif pay-as-you-go. Setelah Pod dihapus, Anda ditagih berdasarkan tarif pemesanan kapasitas. Anda dapat mengonfigurasi waktu pembuatan dan penghapusan Pod secara fleksibel sesuai dengan lalu lintas layanan Anda.
Fleksibilitas resource: Anda dapat membuat pemesanan kapasitas Pod GPU dengan spesifikasi berbeda untuk memenuhi berbagai kebutuhan bisnis.

Catatan

Pemesanan kapasitas Pod GPU tidak menjamin resource untuk Pod jenis daya komputasi BestEffort.
Pemesanan kapasitas Pod GPU mendukung rencana penghematan yang sesuai dengan properti pemesanan, seperti wilayah dan tipe.
Keberhasilan pembuatan pemesanan kapasitas Pod GPU bergantung pada ketersediaan inventaris.

Kasus penggunaan

Permintaan resource layanan real-time periodik: Lalu lintas layanan Anda menunjukkan pola pasang-surut harian atau mingguan, dan tugas harus dieksekusi serta diselesaikan secara real-time. Contohnya adalah layanan inferensi real-time.
Permintaan resource tinggi sesekali: Layanan Anda memiliki kebutuhan mendadak akan komputasi real-time yang memerlukan pengiriman resource cepat dan skala keluar untuk mencegah dampak pada bisnis. Contohnya adalah permintaan resource yang dipicu oleh event viral pada layanan Internet.

Contoh penagihan

Pemesanan kapasitas Pod GPU menggunakan metode penagihan bayar sesuai pemakaian. Selama periode berlaku pemesanan kapasitas, biaya Anda mencakup hal-hal berikut:

Biaya pay-as-you-go untuk pemesanan kapasitas yang tidak digunakan.
Biaya pay-as-you-go untuk Pod yang telah dijalankan.

Contoh ini menggunakan skenario di mana Anda membeli dua pemesanan kapasitas Pod GPU dan membuat dua Pod pay-as-you-go, yaitu Pod1 dan Pod2. Gambar berikut menunjukkan proses dan algoritma penagihan untuk setiap fase.

Fase 1: Pembelian dan pembuatan pemesanan kapasitas

Sebelum melakukan operasi berikut, Anda harus terlebih dahulu mengaktifkan pemesanan kapasitas GPU.

Di Konsol Container Compute Service, pilih Capacity Reservation > Create GPU Capacity Reservation, konfigurasikan parameter, lalu klik Create Capacity Reservation.

Item konfigurasi	Deskripsi
Capacity Reservation Name	Nama kustom untuk pemesanan kapasitas.
Reservation Type	Tipe kartu GPU.
Region	Wilayah tempat Anda ingin memesan resource.
Zone	Zona tempat Anda ingin memesan resource.
Resource Specification	Spesifikasi pemesanan kapasitas. Anda hanya perlu memilih jumlah GPU. Sistem secara otomatis mencocokkan spesifikasi CPU dan memori tertinggi yang tersedia untuk jumlah GPU tersebut.
Reservation Method	Pod reservation (tidak dapat diubah).
Billing Mode	Pay-as-you-go (tidak dapat diubah).
Quantity	Jumlah pemesanan kapasitas Pod GPU untuk spesifikasi ini.

Algoritma biaya untuk fase ini adalah sebagai berikut:

Fase	Biaya	Deskripsi
Fase 1	Tidak ada	Tidak ada pemesanan kapasitas yang dibuat.

Fase 2–6: Periode berlaku pemesanan kapasitas

Selama periode berlaku, Anda dapat membuat instans Pod kapan saja, asalkan tidak melebihi konfigurasi pemesanan. Sistem menjamin bahwa Pod berhasil dibuat dan mengurangi kuota pemesanan kapasitas yang sesuai. Agar pemesanan berlaku, GPU Pod (tipe dan jumlah kartu), CPU, dan memori tidak boleh melebihi spesifikasi yang dipesan. Jika ditemukan kecocokan, seluruh pemesanan diterapkan. Misalnya, jika Anda membeli satu pemesanan kapasitas (1 GPU, 10 vCPU, dan 80 GB memori) dan membuat Pod dengan spesifikasi 1 GPU, 1 vCPU, dan 2 GB memori, sistem menerapkan seluruh pemesanan kapasitas tersebut. Setelah Pod dihapus, kuota pemesanan kapasitas Pod GPU yang sesuai dipulihkan.

Algoritma biaya untuk fase-fase ini adalah sebagai berikut:

Fase	Biaya
Fase 2	2 × harga satuan pemesanan kapasitas × durasi Fase 2
Fase 3	1 × harga satuan pemesanan kapasitas × durasi Fase 3 + harga satuan pay-as-you-go Pod1 × durasi Fase 3
Fase 4	harga satuan pay-as-you-go Pod1 × durasi Fase 4 + harga satuan pay-as-you-go Pod2 × durasi Fase 4
Fase 5	1 × harga satuan pemesanan kapasitas × durasi Fase 5 + harga satuan pay-as-you-go Pod2 × durasi Fase 5
Fase 6	2 × harga satuan pemesanan kapasitas × durasi Fase 6

Harga satuan pemesanan kapasitas adalah biaya pay-as-you-go untuk pemesanan kapasitas yang tidak digunakan. Harga satuan pay-as-you-go untuk Pod1 dan Pod2 adalah tarif standar pay-as-you-go yang berlaku setelah Pod dijalankan.

Fase 7: Pemesanan kapasitas kedaluwarsa

Saat pemesanan kapasitas kedaluwarsa, sistem secara otomatis melepas pemesanan kapasitas Pod GPU.

Tipe pemesanan resource yang tersedia

Setelah Anda meningkatkan kuota untuk spesifikasi pemesanan kapasitas, pemesanan kapasitas mendukung tipe kartu dan spesifikasi berikut:

Tipe kartu	GPU	vCPU	Memori (GiB)
L20 (GN8IS)	1 (48 G Memori GPU)	16	128
	2 (48 G × 2 Memori GPU)	32	230
	4 (48 G × 4 Memori GPU)	64	460
	8 (48 G × 8 Memori GPU)	128	920
T4	1 (16 G Memori GPU)	24	90
T4	2 (16 G × 2 Memori GPU)	48	180
A10	1 (24 G Memori GPU)	16	60
	2 (24 G × 2 Memori GPU)	32	120
	4 (24 G × 4 Memori GPU)	64	240
	8 (24 G × 8 Memori GPU)	128	480
P16EN	1 (96 G Memori GPU)	10	80
	2 (96 G × 2 Memori GPU)	22	225
	4 (96 G × 4 Memori GPU)	46	450
	8 (96 G × 8 Memori GPU)	92	900
	16 (96 G × 16 Memori GPU)	184	1800
GU8TF	1 (96 G Memori GPU)	16	128
	2 (96 G × 2 Memori GPU)	46	230
	4 (96 G × 4 Memori GPU)	92	460
	8 (96 G × 8 Memori GPU)	184	920
GU8TEF	1 (141 G Memori GPU)	22	225
	2 (141 G × 2 Memori GPU)	46	450
	4 (141 G × 4 Memori GPU)	92	900
	8 (141 G × 8 Memori GPU)	184	1800
L20X (GX8SF)	1 (141 G Memori GPU)	22	225
	2 (141 G × 2 Memori GPU)	46	450
	4 (141 G × 4 Memori GPU)	92	900
	8 (141 G × 8 Memori GPU)	184	1800

Aturan pemotongan

Pemesanan kapasitas hanya diterapkan jika semua kondisi berikut terpenuhi:

Tipe kartu GPU Pod harus persis sama dengan tipe kartu yang dipesan. Misalnya, baik tipe kartu yang dipesan maupun tipe kartu Pod adalah L20.
Jumlah GPU harus persis sama dengan konfigurasi yang dipesan. Misalnya, baik jumlah GPU yang dipesan maupun jumlah GPU Pod adalah 1.
Jumlah vCPU Pod ≤ jumlah vCPU yang dipesan.
Memori Pod ≤ memori yang dipesan.

Skenario pencocokan berikut mengasumsikan bahwa tipe kartu Pod sama dengan tipe kartu yang dipesan:

Aturan Deduksi

Deskripsi skenario

Hasil dan deskripsi

Pencocokan eksak atau kompatibel mundur

Pemesanan: 1 × (1 GPU, 16 vCPU, 128 GB).

Pembuatan Pod: 1 × (1 GPU, 8 vCPU, 16 GB).

Hasil: $✓$ Pemesanan berhasil diterapkan.

Deskripsi: Resource yang dibutuhkan Pod (jumlah GPU, CPU, dan memori) tidak melebihi spesifikasi yang dipesan, sehingga ditemukan kecocokan. Pod ini menggunakan seluruh pemesanan kapasitas.

Spesifikasi terkecil terlebih dahulu

Pemesanan:

1 × (1 GPU, 10 vCPU, 80 GB).
1 × (1 GPU, 16 vCPU, 128 GB).

Pembuatan Pod: 1 × (1 GPU, 5 vCPU, 30 GB).

Hasil: $✓$ Pemesanan dengan spesifikasi 1 GPU, 10 vCPU, dan 80 GB diterapkan terlebih dahulu.

Deskripsi: Untuk memaksimalkan pemanfaatan resource, sistem memprioritaskan pemesanan terkecil yang paling sesuai dengan kebutuhan Pod.

Masuk pertama, keluar pertama (FIFO)

Pemesanan: 4 × (1 GPU, 10 vCPU, 80 GB), dibuat pada waktu berbeda.

Pembuatan Pod: 4 × (1 GPU, 5 vCPU, 30 GB).

Hasil: $✓$ Keempat Pod akan menggunakan pemesanan sesuai urutan kronologis berdasarkan waktu pembuatan pemesanan.

Deskripsi: Untuk pemesanan dengan spesifikasi yang sama, prinsip masuk pertama, keluar pertama diterapkan.

Atomicitas spesifikasi multi-GPU (tidak dapat dipisah)

Pemesanan: 1 × (4 GPU, 46 vCPU, 450 GB).

Pembuatan Pod: 4 × (1 GPU, 10 vCPU, 60 GB).

Hasil: $\times$ Pemesanan tidak diterapkan.

Deskripsi: Pemesanan multi-GPU merupakan unit atomik dan tidak dapat dipisah untuk mengakomodasi beberapa Pod single-GPU. Keempat Pod ini dibuat sebagai instans pay-as-you-go.

Pencocokan spesifikasi campuran

Pemesanan:

1 × (2 GPU, 22 vCPU, 225 GB).
1 × (4 GPU, 46 vCPU, 450 GB).

Pembuatan Pod:

2 × (1 GPU, 12 vCPU, 60 GB).
2 × (2 GPU, 20 vCPU, 120 GB).

Hasil: $\times$ Hanya satu Pod dengan 2 GPU, 20 vCPU, dan 120 GB yang berhasil menggunakan pemesanan untuk 2 GPU, 22 vCPU, dan 225 GB.

Deskripsi: Pod yang tersisa tidak dapat mencocokkan pemesanan 4-GPU yang tersisa dan dibuat sebagai instans pay-as-you-go.

Pencocokan dinamis real-time

Pod pay-as-you-go yang sudah ada: 1 × (1 GPU, 5 vCPU, 30 GB)

Pembelian pemesanan baru: 1 × (1 GPU, 10 vCPU, 80 GB)

Hasil: $✓$ Setelah pemesanan baru berhasil dibuat, pemesanan tersebut langsung dan otomatis diterapkan ke Pod pay-as-you-go yang sudah ada.

Deskripsi: Pemesanan kapasitas dapat diterapkan ke Pod pay-as-you-go yang sudah ada dan sesuai dengan spesifikasi pemesanan.