全部产品
Search
文档中心

Container Compute Service:Pemesanan Kapasitas GPU-HPN

更新时间:Nov 09, 2025

Pemesanan kapasitas GPU-HPN untuk kluster Alibaba Cloud Container Service for Serverless Kubernetes (ACS) adalah jenis pemesanan sumber daya yang mendukung daya komputasi GPU pada Jaringan Berperforma Tinggi (HPN). Anda dapat mengaitkan pemesanan ini dengan node virtual dalam kluster ACS, memungkinkan penjadwalan berbasis afinitas untuk daya komputasi kontainer GPU dan penggunaan sumber daya secara efisien. Topik ini menjelaskan cara membuat pemesanan kapasitas GPU-HPN serta mengaitkannya dengan kluster.

Informasi latar belakang

Kluster ACS tidak mengharuskan Anda untuk mengelola node. Namun, untuk menjaga kompatibilitas dengan Kubernetes asli, node virtual tetap terlihat di dalam kluster. Node virtual menyediakan kapasitas besar sumber daya komputasi, memberikan elastisitas tinggi pada kluster ACS untuk menangani lonjakan tiba-tiba dalam lalu lintas layanan. Node virtual default dibuat berdasarkan vSwitchIds di acs-profile ConfigMap dan tidak mengonsumsi sumber daya komputasi apa pun.

Tentang pemesanan kapasitas GPU-HPN

Pemesanan kapasitas GPU-HPN saat ini hanya mendukung metode penagihan langganan. Setelah pemesanan berhasil, sumber daya akan tersedia sepanjang periode langganan. Jika Anda memesan beberapa instans sekaligus, Anda dapat mengaitkannya dengan beberapa kluster secara bersamaan. Node yang dipesan dapat dialokasikan sebagai instans pod dengan jumlah dan spesifikasi yang berbeda. Sebagai contoh, dalam skenario seperti pelatihan model besar dan fine-tuning yang memerlukan HPN untuk komunikasi terdistribusi antar kartu GPU, pemesanan kapasitas GPU-HPN memungkinkan pengurangan tagihan berdasarkan seluruh kartu GPU. Jumlah kartu ditentukan oleh spesifikasi pod, tanpa batasan pada ukuran CPU dan memori.

Penagihan dan batasan

Pemesanan kapasitas ditagih per detik dan mengikuti standar bayar sesuai penggunaan. Siklus penagihan untuk pemesanan kapasitas adalah sebagai berikut:

Mulai Penagihan: Penagihan dimulai ketika pemesanan berhasil dibuat dan statusnya berubah menjadi aktif.

Akhir Penagihan: Penagihan berhenti setelah kapasitas yang dipesan kedaluwarsa dan dilepaskan secara otomatis.

Penting
  • Anda harus mengajukan tiket untuk mengaktifkan pemesanan kapasitas GPU-HPN.

  • Kluster ACS hanya mendukung pengurangan pemesanan kapasitas untuk jenis sumber daya GPU yang sama. Jika Anda membeli jenis kartu GPU yang berbeda, biayanya tidak dapat saling dikompensasi. ACS akan menagih Anda berdasarkan harga jenis kartu yang Anda beli.

  • Node dari pemesanan kapasitas GPU-HPN hanya dapat digunakan oleh pod dengan tipe komputasi diatur ke Jaringan Berperforma Tinggi GPU (gpu-hpn).

Buat pemesanan kapasitas GPU-HPN

  1. Masuk ke Konsol ACS. Di panel navigasi di sebelah kiri, klik Resource Management.

  2. Di halaman Capacity Reservation, klik Create GPU-HPN Resource Reservation dan masukkan informasi berikut.

    Item Konfigurasi

    Deskripsi

    Region

    Pilih wilayah tempat pemesanan sumber daya berada.

    Zone

    Pilih zona tempat pemesanan sumber daya berada.

    Form

    Saat ini, hanya Instance yang didukung.

    Classification

    Saat ini, hanya GPU yang didukung.

    HPN Zone

    Pilih Zona HPN tempat pemesanan sumber daya berada.

    Node Type

    Lihat opsi yang ditampilkan di Konsol.

    Subscription Duration

    1 Bulan, 1 Tahun, 3 Tahun.

    Down Payment Ratio (%)

    0% pembayaran awal. Gunakan layanan segera setelah pembelian.

    Discount Information

    Bervariasi berdasarkan durasi langganan. Langganan 1 bulan memiliki No Discount. Langganan 1 tahun memiliki 12-month Bulk Purchase Discount. Langganan 3 tahun memiliki 36-month Bulk Purchase Discount.

    Billing Cycle

    Monthly.

    Number Of Installments

    Tergantung pada durasi langganan. Sebagai contoh, langganan 1 bulan memiliki 1 Installment, dan langganan 1 tahun memiliki 12 Installments.

    Quantity

    Jumlah instans yang ingin dibeli.

    Setelah Anda menyelesaikan konfigurasi, klik Buy Now. Di halaman Konfirmasi Pesanan, klik Go To Payment. Di halaman pembayaran, klik Order untuk menyelesaikan pembelian.

Asosiasikan kluster

  1. Masuk ke Konsol ACS. Di panel navigasi di sebelah kiri, klik Resource Management.

  2. Di halaman Capacity Reservation, temukan pemesanan kapasitas yang ingin Anda asosiasikan dengan kluster. Di bilah status pemesanan, klik Associate Cluster.

    Penting

    Hanya kluster ACS, kluster ACK yang dikelola, kluster terdaftar ACK One, dan kluster alur kerja terdistribusi Argo ACK One yang dapat diasosiasikan. Jenis kluster lainnya tidak didukung.

  3. Di kotak dialog Resource Association, pilih atau masukkan ID kluster dan jumlah instans untuk diasosiasikan. Lalu, klik Confirm.

    Penting

    Di kotak dialog Resource Association, daftar drop-down Associate Cluster hanya menampilkan ID kluster ACS dan kluster ACK yang dikelola. Untuk kluster terdaftar ACK One dan kluster alur kerja terdistribusi Argo ACK One, Anda harus memasukkan ID kluster secara langsung.

    image

Kueri sumber daya yang dialokasikan dalam pemesanan kapasitas GPU-HPN

Pemesanan kapasitas GPU-HPN direpresentasikan sebagai node Kubernetes di dalam kluster. Anda dapat menggunakan alat kubectl untuk melihat sumber daya yang dialokasikan untuk node tersebut.

  1. Jalankan perintah berikut untuk melihat node GPU-HPN berdasarkan labelnya.

    kubectl get node -l alibabacloud.com/node-type=reserved

    Output yang Diharapkan:

    NAME                                      STATUS   ROLES   AGE   VERSION
    cn-wulanchabu-c.cr-rkccqmu0xz8rea1*****   Ready    agent   20m   v1.28.3-aliyun
  2. Jalankan perintah berikut untuk menanyakan sumber daya yang dialokasikan dalam pemesanan kapasitas GPU-HPN. Ganti nama node dalam perintah dengan nama node GPU-HPN yang Anda peroleh di langkah sebelumnya.

    kubectl describe node cn-wulanchabu-c.cr-rkccqmu0xz8rea1***** | grep Allocated -A 10

    Output yang Diharapkan:

    Allocated resources:
      (Total limits may be over 100 percent, i.e., overcommitted.)
      Resource              Requests    Limits
      --------              --------    ------
      cpu                   16 (8%)     16 (8%)
      memory                128Gi (7%)  128Gi (7%)
      ephemeral-storage     30Gi (0%)   30Gi (0%)
      nvidia.com/gpu        1           1
    Events:                 <none>

    Baris 5 hingga 8 menunjukkan jumlah yang dialokasikan dan laju alokasi untuk CPU, memori, penyimpanan sementara, dan GPU, masing-masing.