Pemesanan kapasitas berbasis Pod menjamin ketersediaan resource untuk layanan elastis. Pemesanan kapasitas Pod GPU tidak perlu dihubungkan ke kluster. Saat membeli pemesanan, Anda menentukan properti seperti spesifikasi Pod, zona, dan durasi pemesanan. ACS kemudian menjamin bahwa Anda dapat menjalankan Pod dengan spesifikasi tersebut dalam hitungan menit. Pemesanan kapasitas Pod GPU memastikan ketersediaan resource dan lebih hemat biaya dibandingkan Pod pay-as-you-go. Topik ini menjelaskan fitur-fitur pemesanan kapasitas Pod GPU.
Fitur
Ketersediaan resource: Selama periode berlaku pemesanan kapasitas, sistem menjamin Anda dapat berhasil menjalankan resource tersebut.
Pengurangan biaya: Setelah Pod dijalankan, penagihan dilakukan berdasarkan tarif pay-as-you-go. Setelah Pod dihapus, Anda ditagih berdasarkan tarif pemesanan kapasitas. Anda dapat mengonfigurasi waktu pembuatan dan penghapusan Pod secara fleksibel sesuai dengan lalu lintas layanan Anda.
Fleksibilitas resource: Anda dapat membuat pemesanan kapasitas Pod GPU dengan spesifikasi berbeda untuk memenuhi berbagai kebutuhan bisnis.
Pemesanan kapasitas Pod GPU tidak menjamin resource untuk Pod jenis daya komputasi BestEffort.
Pemesanan kapasitas Pod GPU mendukung rencana penghematan yang sesuai dengan properti pemesanan, seperti wilayah dan tipe.
Keberhasilan pembuatan pemesanan kapasitas Pod GPU bergantung pada ketersediaan inventaris.
Kasus penggunaan
Permintaan resource layanan real-time periodik: Lalu lintas layanan Anda menunjukkan pola pasang-surut harian atau mingguan, dan tugas harus dieksekusi serta diselesaikan secara real-time. Contohnya adalah layanan inferensi real-time.
Permintaan resource tinggi sesekali: Layanan Anda memiliki kebutuhan mendadak akan komputasi real-time yang memerlukan pengiriman resource cepat dan skala keluar untuk mencegah dampak pada bisnis. Contohnya adalah permintaan resource yang dipicu oleh event viral pada layanan Internet.
Contoh penagihan
Pemesanan kapasitas Pod GPU menggunakan metode penagihan bayar sesuai pemakaian. Selama periode berlaku pemesanan kapasitas, biaya Anda mencakup hal-hal berikut:
Biaya pay-as-you-go untuk pemesanan kapasitas yang tidak digunakan.
Biaya pay-as-you-go untuk Pod yang telah dijalankan.
Contoh ini menggunakan skenario di mana Anda membeli dua pemesanan kapasitas Pod GPU dan membuat dua Pod pay-as-you-go, yaitu Pod1 dan Pod2. Gambar berikut menunjukkan proses dan algoritma penagihan untuk setiap fase.
Fase 1: Pembelian dan pembuatan pemesanan kapasitas
Sebelum melakukan operasi berikut, Anda harus terlebih dahulu mengaktifkan pemesanan kapasitas GPU.
Di Konsol Container Compute Service, pilih Capacity Reservation > Create GPU Capacity Reservation, konfigurasikan parameter, lalu klik Create Capacity Reservation.
Item konfigurasi | Deskripsi |
Capacity Reservation Name | Nama kustom untuk pemesanan kapasitas. |
Reservation Type | Tipe kartu GPU. |
Region | Wilayah tempat Anda ingin memesan resource. |
Zone | Zona tempat Anda ingin memesan resource. |
Resource Specification | Spesifikasi pemesanan kapasitas. Anda hanya perlu memilih jumlah GPU. Sistem secara otomatis mencocokkan spesifikasi CPU dan memori tertinggi yang tersedia untuk jumlah GPU tersebut. |
Reservation Method | Pod reservation (tidak dapat diubah). |
Billing Mode | Pay-as-you-go (tidak dapat diubah). |
Quantity | Jumlah pemesanan kapasitas Pod GPU untuk spesifikasi ini. |
Algoritma biaya untuk fase ini adalah sebagai berikut:
Fase | Biaya | Deskripsi |
Fase 1 | Tidak ada | Tidak ada pemesanan kapasitas yang dibuat. |
Fase 2–6: Periode berlaku pemesanan kapasitas
Selama periode berlaku, Anda dapat membuat instans Pod kapan saja, asalkan tidak melebihi konfigurasi pemesanan. Sistem menjamin bahwa Pod berhasil dibuat dan mengurangi kuota pemesanan kapasitas yang sesuai. Agar pemesanan berlaku, GPU Pod (tipe dan jumlah kartu), CPU, dan memori tidak boleh melebihi spesifikasi yang dipesan. Jika ditemukan kecocokan, seluruh pemesanan diterapkan. Misalnya, jika Anda membeli satu pemesanan kapasitas (1 GPU, 10 vCPU, dan 80 GB memori) dan membuat Pod dengan spesifikasi 1 GPU, 1 vCPU, dan 2 GB memori, sistem menerapkan seluruh pemesanan kapasitas tersebut. Setelah Pod dihapus, kuota pemesanan kapasitas Pod GPU yang sesuai dipulihkan.
Algoritma biaya untuk fase-fase ini adalah sebagai berikut:
Fase | Biaya |
Fase 2 | 2 × harga satuan pemesanan kapasitas × durasi Fase 2 |
Fase 3 | 1 × harga satuan pemesanan kapasitas × durasi Fase 3 + harga satuan pay-as-you-go Pod1 × durasi Fase 3 |
Fase 4 | harga satuan pay-as-you-go Pod1 × durasi Fase 4 + harga satuan pay-as-you-go Pod2 × durasi Fase 4 |
Fase 5 | 1 × harga satuan pemesanan kapasitas × durasi Fase 5 + harga satuan pay-as-you-go Pod2 × durasi Fase 5 |
Fase 6 | 2 × harga satuan pemesanan kapasitas × durasi Fase 6 |
Harga satuan pemesanan kapasitas adalah biaya pay-as-you-go untuk pemesanan kapasitas yang tidak digunakan. Harga satuan pay-as-you-go untuk Pod1 dan Pod2 adalah tarif standar pay-as-you-go yang berlaku setelah Pod dijalankan.
Fase 7: Pemesanan kapasitas kedaluwarsa
Saat pemesanan kapasitas kedaluwarsa, sistem secara otomatis melepas pemesanan kapasitas Pod GPU.
Tipe pemesanan resource yang tersedia
Setelah Anda meningkatkan kuota untuk spesifikasi pemesanan kapasitas, pemesanan kapasitas mendukung tipe kartu dan spesifikasi berikut:
Tipe kartu | GPU | vCPU | Memori (GiB) |
L20 (GN8IS) | 1 (48 G Memori GPU) | 16 | 128 |
2 (48 G × 2 Memori GPU) | 32 | 230 | |
4 (48 G × 4 Memori GPU) | 64 | 460 | |
8 (48 G × 8 Memori GPU) | 128 | 920 | |
T4 | 1 (16 G Memori GPU) | 24 | 90 |
2 (16 G × 2 Memori GPU) | 48 | 180 | |
A10 | 1 (24 G Memori GPU) | 16 | 60 |
2 (24 G × 2 Memori GPU) | 32 | 120 | |
4 (24 G × 4 Memori GPU) | 64 | 240 | |
8 (24 G × 8 Memori GPU) | 128 | 480 | |
P16EN | 1 (96 G Memori GPU) | 10 | 80 |
2 (96 G × 2 Memori GPU) | 22 | 225 | |
4 (96 G × 4 Memori GPU) | 46 | 450 | |
8 (96 G × 8 Memori GPU) | 92 | 900 | |
16 (96 G × 16 Memori GPU) | 184 | 1800 | |
GU8TF | 1 (96 G Memori GPU) | 16 | 128 |
2 (96 G × 2 Memori GPU) | 46 | 230 | |
4 (96 G × 4 Memori GPU) | 92 | 460 | |
8 (96 G × 8 Memori GPU) | 184 | 920 | |
GU8TEF | 1 (141 G Memori GPU) | 22 | 225 |
2 (141 G × 2 Memori GPU) | 46 | 450 | |
4 (141 G × 4 Memori GPU) | 92 | 900 | |
8 (141 G × 8 Memori GPU) | 184 | 1800 | |
L20X (GX8SF) | 1 (141 G Memori GPU) | 22 | 225 |
2 (141 G × 2 Memori GPU) | 46 | 450 | |
4 (141 G × 4 Memori GPU) | 92 | 900 | |
8 (141 G × 8 Memori GPU) | 184 | 1800 |
Aturan pemotongan
Pemesanan kapasitas hanya diterapkan jika semua kondisi berikut terpenuhi:
Tipe kartu GPU Pod harus persis sama dengan tipe kartu yang dipesan. Misalnya, baik tipe kartu yang dipesan maupun tipe kartu Pod adalah L20.
Jumlah GPU harus persis sama dengan konfigurasi yang dipesan. Misalnya, baik jumlah GPU yang dipesan maupun jumlah GPU Pod adalah 1.
Jumlah vCPU Pod ≤ jumlah vCPU yang dipesan.
Memori Pod ≤ memori yang dipesan.
Skenario pencocokan berikut mengasumsikan bahwa tipe kartu Pod sama dengan tipe kartu yang dipesan:
Aturan Deduksi | Deskripsi skenario | Hasil dan deskripsi |
Pencocokan eksak atau kompatibel mundur | Pemesanan: 1 × (1 GPU, 16 vCPU, 128 GB). Pembuatan Pod: 1 × (1 GPU, 8 vCPU, 16 GB). | Hasil: Deskripsi: Resource yang dibutuhkan Pod (jumlah GPU, CPU, dan memori) tidak melebihi spesifikasi yang dipesan, sehingga ditemukan kecocokan. Pod ini menggunakan seluruh pemesanan kapasitas. |
Spesifikasi terkecil terlebih dahulu | Pemesanan:
Pembuatan Pod: 1 × (1 GPU, 5 vCPU, 30 GB). | Hasil: Deskripsi: Untuk memaksimalkan pemanfaatan resource, sistem memprioritaskan pemesanan terkecil yang paling sesuai dengan kebutuhan Pod. |
Masuk pertama, keluar pertama (FIFO) | Pemesanan: 4 × (1 GPU, 10 vCPU, 80 GB), dibuat pada waktu berbeda. Pembuatan Pod: 4 × (1 GPU, 5 vCPU, 30 GB). | Hasil: Deskripsi: Untuk pemesanan dengan spesifikasi yang sama, prinsip masuk pertama, keluar pertama diterapkan. |
Atomicitas spesifikasi multi-GPU (tidak dapat dipisah) | Pemesanan: 1 × (4 GPU, 46 vCPU, 450 GB). Pembuatan Pod: 4 × (1 GPU, 10 vCPU, 60 GB). | Hasil: Deskripsi: Pemesanan multi-GPU merupakan unit atomik dan tidak dapat dipisah untuk mengakomodasi beberapa Pod single-GPU. Keempat Pod ini dibuat sebagai instans pay-as-you-go. |
Pencocokan spesifikasi campuran | Pemesanan:
Pembuatan Pod:
| Hasil: Deskripsi: Pod yang tersisa tidak dapat mencocokkan pemesanan 4-GPU yang tersisa dan dibuat sebagai instans pay-as-you-go. |
Pencocokan dinamis real-time | Pod pay-as-you-go yang sudah ada: 1 × (1 GPU, 5 vCPU, 30 GB) Pembelian pemesanan baru: 1 × (1 GPU, 10 vCPU, 80 GB) | Hasil: Deskripsi: Pemesanan kapasitas dapat diterapkan ke Pod pay-as-you-go yang sudah ada dan sesuai dengan spesifikasi pemesanan. |