Platform for AI (PAI) menyediakan sistem kuota multi-level yang memungkinkan pembagian sumber daya komputasi ke dalam level berbeda untuk manajemen dan alokasi yang fleksibel. Anda dapat mengaktifkan fitur penyerobotan tingkat anak atau tingkat diri sendiri, sehingga pekerjaan yang menggunakan kuota sumber daya saat ini dapat menyerobot sumber daya dari pekerjaan pada kuota tingkat yang sama atau tingkat anak. Hal ini memastikan pemanfaatan sumber daya komputasi secara optimal.
Tingkat kuota
PAI memungkinkan pembagian sumber daya komputasi menjadi kuota berbasis struktur induk-anak sesuai dengan organisasi perusahaan. Gambar berikut mengilustrasikan kuota sumber daya komputasi dalam bentuk struktur pohon, yang memungkinkan pengelolaan dan alokasi sumber daya secara fleksibel dan terperinci. Hirarki ini membuat manajemen sumber daya lebih sesuai dengan kebutuhan nyata perusahaan, meningkatkan efisiensi dan fleksibilitas pemanfaatan sumber daya.
Sumber daya komputasi dibagi menjadi tiga level, seperti ditunjukkan pada gambar di atas.
Root Quota adalah kuota tingkat induk, sedangkan Quota-1, Quota-2, ..., Quota-n adalah kuota tingkat anak dari Root Quota. Kuota tingkat anak dianggap sebagai kuota tingkat yang sama.
Quota-1 adalah kuota tingkat induk dari Quota-1.1 dan Quota-1.2. Quota-1.1 dan Quota-1.2 adalah kuota tingkat anak dari Quota-1. Kuota tingkat anak dianggap sebagai kuota tingkat yang sama. Aturan yang sama berlaku untuk Quota-2, ..., Quota-n.
Anda dapat membagi dan menggunakan kuota berdasarkan organisasi atau proyek untuk mengelola pekerjaan dan sumber daya secara lebih efisien. Jika sumber daya tidak mencukupi, Anda dapat membuat kuota di beberapa level dan mengaktifkan kebijakan penyerobotan yang disediakan oleh produk untuk memaksimalkan pemanfaatan sumber daya:
Aktifkan penyerobotan tingkat diri sendiri:
Skenario: Pekerjaan yang dibuat menggunakan kuota tingkat yang sama, seperti Quota-1, Quota-2, atau Quota-n, perlu diprioritaskan untuk dijalankan tetapi sumber daya tidak mencukupi.
Mekanisme pemrosesan: Sistem menyediakan mekanisme penjadwalan sumber daya yang fleksibel untuk menjadwalkan sumber daya komputasi tingkat yang sama, memastikan ketersediaan sumber daya untuk pekerjaan penting.
Example: Mengaktifkan preemption daya komputasi intra-kuota untuk Quota-1 memungkinkan job yang sedang dalam antrian melakukan preemption terhadap resource dari job yang sedang berjalan dalam kuota resource yang sama ketika resource langka.
Aktifkan penyerobotan tingkat anak:
Skenario: Kuota tingkat yang sama tidak mencukupi dan tidak dapat memenuhi persyaratan pekerjaan.
Mekanisme pemrosesan: Sistem menyediakan mekanisme penjadwalan sumber daya yang fleksibel untuk menjadwalkan sumber daya komputasi tingkat anak, memastikan ketersediaan sumber daya untuk pekerjaan penting.
Contoh: Aktifkan penyerobotan tingkat anak untuk Quota-1. Saat Anda membuat pekerjaan menggunakan Quota-1 dan sumber daya komputasi tidak mencukupi, sumber daya Quota-1.1 dan Quota-1.2 dapat diserobot.
Aktifkan penyerobotan tingkat diri sendiri
Prosedur
Aktifkan penyerobotan tingkat diri sendiri saat Anda membuat atau memodifikasi kuota.
Saat beberapa pekerjaan dijalankan pada kuota secara bersamaan, sistem mengalokasikan sumber daya komputasi pada level saat ini berdasarkan kebijakan penyerobotan optimal. Tabel berikut menjelaskan konfigurasi penyerobotan.
Kebijakan penyerobotan | Deskripsi |
Prioritas Tinggi | Pekerjaan yang menyerobot sumber daya komputasi pada level saat ini diprioritaskan untuk dijalankan. Nilai valid: 1 hingga 9. Anda dapat memilih Pilihan Tunggal atau Rentang. Angka yang lebih besar menunjukkan prioritas yang lebih tinggi. Angka yang lebih kecil menunjukkan prioritas yang lebih rendah. |
Low Preemption Priority | Pekerjaan yang sumber daya komputasinya diserobot diprioritaskan untuk dijalankan. Nilai valid: 1 hingga 9. Anda dapat memilih Pilihan Tunggal atau Rentang. Angka yang lebih besar menunjukkan prioritas yang lebih tinggi. Angka yang lebih kecil menunjukkan prioritas yang lebih rendah. Catatan Nilai Prioritas Penyerobotan Rendah harus lebih kecil dari nilai Prioritas Tinggi. |
Modul yang Dapat Diserobot | Saat sumber daya komputasi kuota tidak mencukupi, sistem dapat menyerobot sumber daya komputasi modul yang berjalan pada kuota tingkat yang sama, seperti Deep Learning Containers (DLC), Data Science Workshop (DSW), dan Elastic Algorithm Service (EAS) modul. |
Contoh
Konfigurasi Preemption:
Gambar berikut menunjukkan konfigurasi penyerobotan:

High Priority: Setel nilainya menjadi 6 hingga 9.
Low Preemption Priority: Pilih Single Selection dan atur nilainya menjadi 4.
Preemptible Module: Pilih DLC dan DSW.
Efek:
Jika prioritas pekerjaan yang dibuat menggunakan kuota ini adalah 6 hingga 9 dan sumber daya komputasi tidak mencukupi, sistem dapat menyerobot sumber daya komputasi modul DLC atau DSW dengan prioritas 4 yang menggunakan kuota tingkat yang sama.
Aktifkan penyerobotan tingkat anak
Prosedur
Aktifkan penyerobotan tingkat anak saat Anda membuat atau memodifikasi kuota.
Saat pekerjaan berjalan pada kuota tingkat induk dan sumber daya komputasi tidak mencukupi, sistem mengambil kembali sumber daya komputasi kuota tingkat anak tempat pekerjaan dijalankan berdasarkan kebijakan penyerobotan optimal. Hal ini memastikan berjalannya pekerjaan yang menggunakan kuota tingkat induk. Tabel berikut menjelaskan konfigurasi penyerobotan.
Kebijakan penyerobotan | Deskripsi |
Preemptible Priority | Prioritas pekerjaan yang sumber daya komputasinya diserobot dan dibuat menggunakan kuota tingkat anak. Nilai valid: 1 hingga 9. Anda dapat menentukan rentang. Angka yang lebih besar menunjukkan prioritas yang lebih tinggi. Angka yang lebih kecil menunjukkan prioritas yang lebih rendah. |
Preemptible Module | Saat sumber daya komputasi kuota tingkat induk tidak mencukupi, sistem dapat menyerobot sumber daya komputasi modul yang berjalan pada kuota tingkat anak, seperti modul DLC, DSW, dan EAS. |
Prosedur
Konfigurasi Penyerobotan:
Gambar berikut menunjukkan konfigurasi penyerobotan:

Preemptible Priority: Setel nilainya menjadi 1 hingga 3.
Preemptible Module: Pilih DLC dan DSW.
Efek:
Jika pekerjaan dibuat menggunakan kuota tingkat induk dan sumber daya komputasi tidak mencukupi, sistem dapat menyerobot sumber daya komputasi modul DLC atau DSW dengan prioritas 1 hingga 3 yang menggunakan kuota tingkat anak.
Referensi
Anda dapat menggunakan sumber daya idle saat mengirimkan pekerjaan pelatihan menggunakan kuota langganan di DLC. Untuk informasi lebih lanjut, lihat Gunakan Sumber Daya Idle.