All Products
Search
Document Center

Container Service for Kubernetes:Ikhtisar komputasi heterogen

Last Updated:Jun 17, 2026

Container Service for Kubernetes (ACK) Alibaba Cloud mengelola dan menjadwalkan sumber daya heterogen seperti GPU, ASIC, dan eRDMA untuk meningkatkan pemanfaatan kluster.

Resource heterogen yang didukung

ACK menyediakan penjadwalan dan manajemen terpadu untuk sumber daya heterogen, seperti GPU, Application-Specific Integrated Circuits (ASIC), dan elastic Remote Direct Memory Access (eRDMA).

Heterogeneous resource

Description

GPU

Buat kluster dengan kartu GPU utama seperti T4, P100, dan V100.

  • Mendukung permintaan resource untuk GPU individual.

  • Mendukung auto scaling berdasarkan metrik GPU.

  • Mendukung GPU sharing dan computing power fencing. GPU sharing Alibaba Cloud menjalankan beberapa beban kerja inferensi pada satu GPU, sehingga mengurangi biaya. cGPU melakukan pemagaran memori GPU dan daya komputasi tanpa modifikasi kontainer, meningkatkan stabilitas aplikasi. Kebijakan alokasi yang didukung:

    • Single-pod-single-GPU sharing: umumnya digunakan untuk inferensi model.

    • Single-pod-multi-GPU sharing: umumnya digunakan untuk pengembangan pelatihan terdistribusi.

    • Binpack: menjadwalkan beberapa pod ke kartu GPU yang sama secara preferensial untuk meningkatkan pemanfaatan.

    • Spread: mendistribusikan pod ke berbagai kartu GPU bila memungkinkan untuk mencapai ketersediaan tinggi (HA).

  • Mendukung topology-aware GPU scheduling. Penjadwal mengambil topologi resource dari node untuk mengoptimalkan penempatan terkait NVLink, PCIe Switch, QPI, dan NIC RDMA.

  • Mendukung pemantauan resource GPU di tingkat node dan aplikasi, dengan deteksi otomatis terhadap anomali serta peringatan untuk GPU dedicated maupun shared.

ASIC

ACK mendukung kluster dengan perangkat ASIC NETINT dan permintaan resource untuk kartu ASIC individual.

eRDMA

Buat kluster dengan perangkat eRDMA.

  • Kirim pekerjaan pelatihan pembelajaran mendalam terdistribusi dengan perangkat eRDMA melalui Arena.

  • Mendukung pekerjaan berbandwidth tinggi seperti pelatihan pembelajaran mendalam terdistribusi.

Tipe instans GPU yang didukung oleh ACK

Pilih dari keluarga instans ECS berikut untuk menambahkan node GPU ke kluster ACK.

Instans confidential computing tidak didukung. Tipe instans ini mengandung bidang -tee, seperti ecs.gn8v-tee.4xlarge.
Catatan

Anda tidak dapat memilih instans yang dipercepat vGPU sebagai node kluster di konsol ACK. Lihat Apakah ACK mendukung instans yang dipercepat vGPU?.

Tipe instans ASIC yang didukung oleh ACK

Untuk menambahkan node ASIC ke kluster ACK, pilih tipe instans ecs.video-trans.26xhevc.

Tipe instans eRDMA yang didukung oleh ACK

Pilih dari keluarga instans ECS berikut untuk menambahkan node eRDMA. Lihat Aktifkan eRDMA pada instans tingkat enterprise dan Aktifkan eRDMA pada instans yang dipercepat GPU.