全部产品
Search
文档中心

Container Service for Kubernetes:Tambahkan node yang dipercepat GPU

更新时间:Jul 02, 2025

Container Service for Kubernetes (ACK) Edge clusters memungkinkan pengelolaan sumber daya GPU lokal di dalam pool node edge. Topik ini menjelaskan cara menambahkan node yang dipercepat GPU ke pool node edge di ACK Edge cluster.

Prasyarat

Batasan

Prosedur

Kubernetes 1.26 atau yang lebih baru

Saat menambahkan node yang dipercepat GPU dengan GPU NVIDIA ke ACK Edge cluster yang menjalankan Kubernetes 1.26 atau yang lebih baru, Anda tidak perlu mengonfigurasi parameter gpuVersion. Sistem secara otomatis memeriksa model GPU dan menginstal komponen terkait.

Langkah-langkah untuk menambahkan node yang dipercepat GPU mirip dengan langkah-langkah untuk menambahkan node edge. Untuk informasi lebih lanjut, lihat Tambahkan node edge.

Catatan

ACK Edge cluster yang menjalankan Kubernetes 1.26 atau yang lebih baru mendukung semua seri GPU produksi kelas atas dari NVIDIA, termasuk Tesla, Hopper, Ada Lovelace, dan L.

Versi Kubernetes lebih awal dari 1.26

Saat menambahkan node yang dipercepat GPU ke ACK Edge cluster yang menjalankan versi Kubernetes lebih lama dari 1.26, model GPU harus memenuhi persyaratan dalam tabel berikut. Jika ingin menggunakan model GPU yang tidak memenuhi persyaratan berikut, submit a ticket.

Arsitektur OS

Model GPU

Versi Kubernetes

AMD64/x86_64

Nvidia_Tesla_T4

≥1.16.9-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_P4

≥1.16.9-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_P100

≥1.16.9-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_V100

≥1.18.8-aliyunedge.1

AMD64/x86_64

Nvidia_Tesla_A10

≥1.20.11-aliyunedge.1

AMD64/x86_64

Nvidia_L40

≥1.26.3-aliyun.1

  1. Masuk ke ACK console. Di panel navigasi di sebelah kiri, klik Clusters.

  2. Di halaman Clusters, temukan kluster yang ingin dikelola dan klik namanya. Di panel navigasi di sebelah kiri, pilih Nodes > Node Pools.

  3. Di halaman Node Pools, temukan pool node yang ingin dikelola dan pilih 图标 > Add Existing Node di kolom Actions.

  4. Di halaman Add Existing ECS Instance, pilih Manual sebagai Method dan kemudian pilih instance yang ada.

  5. Klik Next Step untuk masuk ke langkah Specify Instance Information. Anda dapat mengatur parameter yang digunakan untuk menambahkan node. Untuk informasi lebih lanjut tentang parameter, lihat Parameters.

    image

    Catatan
    • Anda harus mengonfigurasi parameter gpuVersion dalam skrip untuk menghubungkan node ke cloud. Untuk informasi lebih lanjut tentang model GPU yang didukung, lihat Batasan.

    • Setelah mengonfigurasi parameter, alat koneksi secara otomatis menginstal nvidia-containerd-runtime. Untuk informasi lebih lanjut, lihat nvidia-containerd-runtime.

  6. Setelah mengatur parameter, klik Next Step. Di langkah Complete, klik Copy untuk menyalin skrip ke node edge yang ingin ditambahkan. Kemudian, jalankan skrip pada node tersebut.

    Jika hasil berikut dikembalikan, node telah berhasil ditambahkan ke kluster.

    sukses

Referensi

  • Jika Anda mengalami masalah saat menambahkan node edge, lihat Diagnosis masalah node edge.

  • Untuk informasi lebih lanjut tentang cara menghapus node edge, lihat Hapus node edge.

  • ACK Edge clusters mendukung otonomi node edge. Otonomi node edge memastikan bahwa aplikasi pada node edge tetap dapat berjalan seperti yang diharapkan ketika node edge terputus dari cloud. Untuk informasi lebih lanjut, lihat Konfigurasi otonomi node edge.