Topik ini menjelaskan cara mengonfigurasi dataset dan repositori kode sumber untuk pekerjaan pelatihan.
Prasyarat
AI Developer Console dan scheduling component dari suite AI berbasis cloud-native telah diinstal di kluster ACK Pro. Kluster tersebut menjalankan Kubernetes versi 1.20 atau yang lebih baru.
Seorang pengguna Resource Access Management (RAM) telah dibuat di konsol RAM oleh administrator kluster. Grup kuota telah ditambahkan dan dikaitkan dengan pengguna RAM. Untuk informasi lebih lanjut, lihat Langkah 1: Buat Grup Kuota untuk Pengguna RAM.
Buat klaim volume persisten (PVC). Untuk informasi lebih lanjut, lihat Pasang Volume NAS yang Disediakan secara Statis di Konsol dan Gunakan Konsol untuk Memasang Volume OSS yang Disediakan secara Statis.
CatatanDalam banyak kasus, data yang digunakan untuk melatih model disimpan dalam volume Object Storage Service (OSS) atau File Storage NAS (NAS).
Konfigurasikan dataset
Masuk ke AI Developer Console. Untuk informasi lebih lanjut, lihat Langkah 2: Masuk ke Konsol Pengembang AI.
Di panel navigasi sisi kiri Konsol Pengembang AI, klik Data Config.
Di halaman Data Config, klik New Data Configuration.
Di halaman New Data Configuration, atur Name, Namespace, dan Persistent Volume Claim untuk dataset serta tentukan local directory sesuai kebutuhan Anda.
Untuk informasi lebih lanjut tentang PVC, lihat Buat PVC.
Saat kluster ACK menjalankan pekerjaan, kluster ACK memasang direktori lokal ke kontainer tempat pekerjaan tersebut berjalan. Ini memungkinkan pekerjaan untuk mengakses data dan model yang disimpan di direktori lokal.
Klik Submit.
Setelah menyelesaikan konfigurasi, Anda dapat melihat informasi rinci tentang dataset di tab Data pada halaman Data Config.
Konfigurasikan repositori kode sumber
Di panel navigasi sisi kiri Konsol Pengembang AI, klik Data Config.
Di halaman Data Config, klik New Git configuration.
Di kotak dialog New Code Configuration, atur Name, Git Repository, dan Default Branch untuk repositori kode sumber serta tentukan local directory sesuai kebutuhan Anda. Saat kluster ACK menjalankan pekerjaan, kluster ACK memasang direktori lokal ke kontainer tempat pekerjaan tersebut berjalan. Ini memungkinkan pekerjaan untuk mengakses kode sumber yang disimpan di direktori lokal.
Klik Submit.
Setelah menyelesaikan konfigurasi, Anda dapat melihat informasi rinci tentang dataset di tab Data pada halaman Data Config.