Hubungkan kluster Container Service for Kubernetes (ACK) yang sudah ada ke Platform for AI (PAI) untuk digunakan sebagai sumber daya komputasi dalam pengembangan Data Science Workshop (DSW) dan pekerjaan pelatihan Deep Learning Containers (DLC).
Prasyarat
Hubungi PDSA Anda untuk menyelesaikan persiapan berikut:
Kluster ACK siap digunakan di PAI.
Akun Anda termasuk dalam daftar izin (allowlist).
Konfigurasikan sumber daya komputasi yang dikelola sendiri
Langkah 1: Buat kelompok sumber daya
Pertama, buat kelompok sumber daya di PAI dan petakan ke kluster ACK yang ditentukan.
Masuk ke konsol PAI. Di pojok kiri atas, pilih wilayah tempat kluster ACK Anda berada.
Di panel navigasi sebelah kiri, pilih AI Computing Resources > Resource Pool.
Klik tab Self-managed compute, lalu klik Create Resource Group. Di kotak dialog, pilih kluster ACK Anda dari daftar drop-down.
Langkah 2: Tambahkan kuota sumber daya
Setelah membuat kelompok sumber daya, konfigurasikan kuota sumber daya untuknya. Kuota ini menyediakan isolasi dan manajemen sumber daya tanpa dikenai biaya.
Untuk instruksi lengkap, lihat Add a resource quota.
Di halaman Resource Quota, klik tab Self-managed compute, lalu klik Add a resource quota di pojok kiri atas.
Gunakan sumber daya komputasi yang dikelola sendiri
Setelah konfigurasi selesai, Anda dapat menggunakan sumber daya komputasi yang dikelola sendiri di berbagai komponen PAI.
Gunakan di instans DSW
Di bagian Resource Information, atur Resource Type menjadi Resource Quota, lalu pilih kuota sumber daya untuk sumber daya komputasi yang dikelola sendiri Anda dari daftar drop-down.
Bagian Resource Overview kemudian menampilkan tipe GPU (misalnya, V100) dan tag Intelligent Policy. Tabel spesifikasi di bawah mencantumkan detail kuota, seperti nama spesifikasi, jumlah total node, model GPU, jumlah GPU, core vCPU, dan memori.
Gunakan di DLC
Saat membuat pekerjaan DLC, atur Resource Type menjadi Self-managed compute dan Source menjadi Resource Quota. Kemudian, pilih kuota sumber daya untuk sumber daya komputasi yang dikelola sendiri Anda dari daftar drop-down.
Antarmuka kemudian menampilkan spesifikasi kuota sumber daya yang dipilih, termasuk nama spesifikasi, model GPU, jumlah GPU, core vCPU, dan memori.
Penggunaan sumber daya
Anda dapat melihat penggunaan sumber daya komputasi yang dikelola sendiri di halaman Resource Overview, yang terletak di tab Overview.
Klik tab Self-managed compute untuk melihat detail sumber daya komputasi yang dikelola sendiri Anda, seperti nama, status, jumlah node, dan jumlah GPU.