全部产品
Search
文档中心

Container Service for Kubernetes:ack-kube-queue

更新时间:Jul 02, 2025

ack-kube-queue adalah komponen kube-queue yang disediakan oleh suite AI cloud-native. Komponen ini bekerja sama dengan penjadwal dan sistem kuota untuk mengelola antrian pekerjaan, menjadwalkan pekerjaan berdasarkan prioritas, serta menggunakan kuota elastis. ack-kube-queue dapat mengoptimalkan pengelolaan dan penjadwalan beban kerja AI/pembelajaran mesin (ML) dan beban kerja batch di Kubernetes. Topik ini memperkenalkan ack-kube-queue serta menjelaskan catatan penggunaan dan rilisnya.

Pengenalan

Pekerjaan AI/ML atau pekerjaan batch di Kubernetes sering kali membuat sejumlah besar pod, yang meningkatkan beban penjadwal. Selain itu, pekerjaan dari pengguna yang berbeda mungkin saling mengganggu. ack-kube-queue menyediakan semua fitur kube-queue untuk mengelola beban kerja AI/ML dan beban kerja batch di Kubernetes. Komponen ini memungkinkan administrator sistem menyesuaikan pengelolaan antrian pekerjaan guna meningkatkan fleksibilitas antrian. Dikombinasikan dengan sistem kuota, ack-kube-queue dapat mengotomatiskan dan mengoptimalkan pengelolaan beban kerja serta kuota sumber daya untuk memaksimalkan pemanfaatan sumber daya dalam kluster Kubernetes.

Catatan Penggunaan

Hanya kluster Container Service for Kubernetes (ACK) Pro, kluster ACK Serverless Pro, dan kluster ACK Edge Pro dengan versi Kubernetes 1.18 ke atas yang mendukung ack-kube-queue.

Anda dapat menginstal ack-kube-queue saat menerapkan suite AI cloud-native atau setelah suite tersebut diterapkan. Setelah instalasi, Anda dapat menggunakan fitur seperti antrian pemblokiran dan penjadwalan prioritas ketat. Untuk informasi lebih lanjut tentang cara menginstal dan menggunakan ack-kube-queue, lihat Gunakan ack-kube-queue untuk mengelola beban kerja AI dan pembelajaran mesin.

Deskripsi

Januari 2024

Versi

Deskripsi

Tanggal rilis

Dampak

v0.3.4

Masalah head-of-line blocking yang kadang terjadi dalam mode blokir saat Anda menghapus tugas pertama dalam antrian telah diperbaiki.

2024-01-04

Pembaruan ini tidak berdampak pada beban kerja.

Desember 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.3.3

Pengaturan antrian pemblokiran secara global menggunakan variabel lingkungan memperbarui mode antrian pemblokiran untuk semua antrian.

2023-12-26

Pembaruan ini tidak berdampak pada beban kerja.

September 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.3.1

Kesalahan antrian yang kadang terjadi selama penghapusan QueueUnit telah diperbaiki.

2023-09-13

Pembaruan ini tidak berdampak pada beban kerja.

v0.3.0

Informasi urutan pekerjaan dapat diambil dari antrian.

2023-09-13

Pembaruan ini tidak berdampak pada beban kerja.

Agustus 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.2.1

Masalah bahwa NodeSelector dalam template mencegah penjadwalan pada node pekerja telah diperbaiki.

2023-08-31

Pembaruan ini tidak berdampak pada beban kerja.

v0.2.0

  • Pekerjaan Message Passing Interface (MPI) dapat dikirim menggunakan Arena.

  • Argo Workflows dapat di-antrikan.

  • Jumlah pekerjaan yang didequeue secara bersamaan dapat dibatasi menggunakan kube-queue/max-jobs sebagai nama sumber daya dalam ElasticQuotaTree.

  • Log untuk kegagalan dequeue pekerjaan dioptimalkan.

2023-08-29

Pembaruan ini tidak berdampak pada beban kerja.

Juli 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.13

Masalah fungsi yang mungkin terjadi jika bidang LastUpdateTime hilang telah diperbaiki.

2023-07-26

Pembaruan ini tidak berdampak pada beban kerja.

v0.1.12

Saklar ditambahkan untuk mengonfigurasi fitur antrian pemblokiran untuk antrian yang berbeda. Anda dapat menonaktifkan fitur re-queuing dengan mengatur parameter timeout di ekstensi menjadi 0.

2023-07-20

Pembaruan ini tidak berdampak pada beban kerja.

Juni 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.11

Status Queueunit disinkronkan saat tugas diperbarui.

2023-06-30

Pembaruan ini tidak berdampak pada beban kerja.

v0.1.10

Node berbasis ARM didukung oleh komponen seperti kube-queue-controller, tf-operator-extension, dan pytorch-operator-extension.

2023-06-14

Pembaruan ini tidak berdampak pada beban kerja.

Mei 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.9

Pekerjaan yang tetap tertunda untuk jangka waktu lama dapat dikirim ulang ke antrian pekerjaan dan multi-antrian fair queuing didukung. Jika pod yang dibuat oleh pekerjaan tetap tertunda untuk jangka waktu lama karena penjadwalan sadar topologi, afinitas node, atau fragmen sumber daya, ack-kube-queue mengambil kembali pekerjaan tersebut dan mengirim ulang pekerjaan ke antrian. Ini membantu melepaskan kuota sumber daya yang ditempati oleh pekerjaan dan meningkatkan pemanfaatan kuota sumber daya secara keseluruhan.

2023-05-16

Pembaruan ini tidak berdampak pada beban kerja.

April 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.8

Antrian pemblokiran dan penjadwalan prioritas ketat didukung. Untuk informasi lebih lanjut, lihat Gunakan ack-kube-queue untuk mengelola beban kerja AI dan pembelajaran mesin dan Gunakan ack-kube-queue untuk mengelola beban kerja AI dan pembelajaran mesin.

2023-04-25

Pembaruan ini tidak berdampak pada beban kerja.

Maret 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.6

Masalah bahwa status pekerjaan TensorFlow tidak ditampilkan telah diperbaiki.

2023-03-15

Pembaruan ini tidak berdampak pada beban kerja.

Februari 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.5

Masalah bahwa ack-kube-queue kadang gagal menghapus pekerjaan telah diperbaiki.

2023-02-28

Pembaruan ini tidak berdampak pada beban kerja.

v0.1.4

Masalah bahwa informasi Used kadang hilang setelah unit antrian pekerjaan didequeue telah diperbaiki.

2023-02-14

Pembaruan ini tidak berdampak pada beban kerja.

Januari 2023

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.3

Masalah bahwa unit antrian pekerjaan kadang hilang telah diperbaiki.

2023-01-12

Pembaruan ini tidak berdampak pada beban kerja.

v0.1.2

Masalah bahwa pekerjaan tidak dapat didequeue untuk jangka waktu lama yang kadang terjadi telah diperbaiki.

2023-01-12

Pembaruan ini tidak berdampak pada beban kerja.

v0.1.1

Multi-antrian didukung. Pekerjaan dengan kuota sumber daya yang berbeda dikirim ke antrian yang berbeda untuk menghindari kemacetan.

2023-01-10

Pembaruan ini tidak berdampak pada beban kerja.

Oktober 2022

Versi

Deskripsi

Tanggal rilis

Dampak

v0.1.0

Ini adalah rilis pertama.

2022-10-15

Pembaruan ini tidak berdampak pada beban kerja