All Products
Search
Document Center

Platform For AI:Kebijakan preemption

Last Updated:Mar 27, 2026

Platform for AI (PAI) menyediakan fitur kuota multi-level yang memungkinkan Anda membagi resource komputasi ke dalam hierarki untuk manajemen dan alokasi yang fleksibel. Anda juga dapat mengaktifkan preemption tingkat diri sendiri (self-level) atau preemption tingkat anak (child-level), sehingga job yang dikirimkan ke suatu kuota dapat merebut resource komputasi dari kuota pada tingkat yang sama atau dari kuota tingkat anak guna memaksimalkan pemanfaatan resource.

Hierarki kuota

PAI memungkinkan Anda membagi resource komputasi menjadi kuota tingkat induk (parent-level) dan kuota tingkat anak (child-level) sesuai dengan struktur organisasi Anda. Pendekatan ini membentuk hierarki berupa pohon, yang dikenal sebagai QuotaTree, sehingga memungkinkan manajemen dan alokasi resource yang lebih fleksibel serta detail halus. Model hierarkis ini menyelaraskan manajemen resource dengan kebutuhan bisnis Anda serta meningkatkan efisiensi dan fleksibilitas pemanfaatan resource.

image

Seperti yang ditunjukkan pada gambar di atas, resource komputasi dibagi menjadi hierarki tiga tingkat:

  • Akar | Quota adalah kuota tingkat induk. Quota-1, Quota-2, ..., Quota-n merupakan kuota tingkat anaknya dan berada pada tingkat yang sama.

  • Quota-1 adalah kuota tingkat induk untuk Quota-1.1 dan Quota-1.2. Quota-1.1 dan Quota-1.2 adalah kuota tingkat anak dari Quota-1 dan berada pada tingkat yang sama. Struktur serupa berlaku untuk Quota-2 hingga Quota-n.

Anda dapat membagi dan menggunakan kuota berdasarkan organisasi atau Proyek untuk mengelola job dan resource secara lebih efektif. Selama periode konflik sumber daya, Anda dapat membuat struktur kuota multi-level dan mengaktifkan kebijakan preemption guna memaksimalkan pemanfaatan resource:

  • Aktifkan self-level preemption:

    • Kasus penggunaan: Job prioritas tinggi perlu dijalankan, tetapi kuota yang ditetapkan tidak memiliki resource yang tersedia secara mencukupi (misalnya, Quota-1, Quota-2, atau Quota-n).

    • Cara kerja: Sistem merebut resource komputasi dari kuota tingkat yang sama lainnya untuk menyediakan resource yang diperlukan bagi job kritis.

    • Contoh: Jika Anda mengaktifkan self-level preemption untuk Quota-1, job yang sedang dalam antrian di kuota ini dapat merebut resource dari job yang sedang Berjalan di kuota tingkat yang sama ketika terjadi kekurangan resource.

  • Aktifkan child-level preemption:

    • Kasus penggunaan: Resource di kuota tingkat induk tidak mencukupi untuk menjalankan suatu job.

    • Cara kerja: Sistem menarik kembali resource komputasi dari job di kuota tingkat anak untuk menjalankan job kritis di tingkat induk.

    • Contoh: Jika Anda mengaktifkan child-level preemption untuk Quota-1, job yang dikirimkan ke Quota-1 dapat merebut resource dari Quota-1.1 dan Quota-1.2 ketika resource komputasi tidak mencukupi.

Aktifkan self-level preemption

Prosedur

Aktifkan self-level preemption saat Anda membuat atau mengedit kuota.image

Ketika beberapa job dikirimkan ke kuota ini, sistem menggunakan kebijakan berikut untuk merebut resource komputasi dari kuota tingkat yang sama:

Kebijakan Preemption

Deskripsi

High priority

Prioritas job yang dapat merebut resource komputasi dari kuota tingkat yang sama. Nilai valid: [1,9], mendukung Single Selection atau pemilihan berdasarkan Range. Angka yang lebih tinggi menunjukkan prioritas yang lebih tinggi.

Low preemption priority

Prioritas job yang resource komputasinya dapat direbut. Nilai valid: [1,9], mendukung Single Selection atau pemilihan berdasarkan Range. Angka yang lebih tinggi menunjukkan prioritas yang lebih tinggi.

Catatan

Low preemption priority harus lebih rendah daripada high priority.

Preemptible module

Menentukan modul di kuota tingkat yang sama dari mana sistem dapat merebut resource ketika resource kuota saat ini tidak mencukupi. Modul yang didukung meliputi Deep Learning Containers (DLC), Data Science Workshop (DSW), dan Elastic Algorithm Service (EAS).

Contoh

  • Konfigurasi:

    Konfigurasikan kebijakan preemption seperti yang ditunjukkan pada gambar di bawah:image

    • High Priority: Atur ke rentang 6 hingga 9.

    • Low Preemption Priority: Atur ke nilai tunggal 4.

    • Preemptible module: Pilih DLC dan DSW.

  • Hasil:

    Ketika job dengan prioritas antara 6 hingga 9 dikirimkan ke kuota ini dan resource komputasi tidak mencukupi, sistem dapat merebut resource komputasi dari job DLC atau DSW dengan prioritas 4 di kuota tingkat yang sama.

Aktifkan pengambilalihan paksa tingkat anak

Prosedur

Aktifkan child-level preemption saat Anda membuat atau mengedit kuota.imageJika kuota tingkat induk tidak memiliki resource yang cukup untuk job yang dikirimkan, sistem akan menarik kembali resource dari job di kuota tingkat anaknya. Proses ini diatur oleh pengaturan kebijakan yang dijelaskan dalam tabel di bawah, sehingga memastikan job tingkat induk dapat dijalankan.

Kebijakan preemption

Deskripsi

Preemptible priority

Prioritas job yang dapat direbut di kuota tingkat anak. Nilai valid berupa rentang dari 1 hingga 9. Angka yang lebih tinggi menunjukkan prioritas yang lebih tinggi.

Preemptible module

Menentukan modul di kuota tingkat anak dari mana sistem dapat merebut resource ketika kuota tingkat induk tidak memiliki resource yang mencukupi. Modul yang didukung meliputi DLC, DSW, dan EAS.

Contoh

  • Konfigurasi:

    Konfigurasikan kebijakan preemption seperti yang ditunjukkan pada gambar di bawah:image

    • Preemptible priority: Atur ke rentang 1 hingga 3.

    • Preemptible module: Pilih DLC dan DSW.

  • Hasil:

    Ketika job dikirimkan ke kuota tingkat induk dan resource komputasinya tidak mencukupi, sistem dapat merebut resource dari job DLC atau DSW dengan prioritas antara 1 hingga 3 di salah satu kuota tingkat anaknya.

Dokumen terkait

Job untuk pelatihan terdistribusi (DLC) yang dibuat dalam kuota langganan dapat menggunakan resource idle. Untuk informasi selengkapnya, lihat Use idle resources.