Siapkan sumber daya komputasi, gambar kontainer, set data, dan kode sumber untuk Pekerjaan DLC.
Prasyarat
Jika Anda menggunakan OSS untuk penyimpanan, berikan izin yang diperlukan kepada DLC agar dapat mengakses OSS. Tanpa izin yang tepat, akan terjadi error I/O saat mengakses data dari Bucket OSS yang dipasang. Untuk informasi selengkapnya, lihat Ketergantungan produk cloud dan otorisasi: DLC.
Langkah 1: Siapkan sumber daya
Siapkan sumber daya komputasi untuk Pelatihan AI. Jenis sumber daya berikut tersedia:
-
Public resources
Lengkapi otorisasi DLC. Sumber daya publik kemudian tersedia di halaman Create Job tanpa perlu menambahkan kelompok sumber daya.
-
General computing resources
Buat kelompok sumber daya khusus, beli sumber daya komputasi tujuan umum, lalu buat kuota sumber daya untuk mengalokasikan sumber daya tersebut. Kaitkan kuota sumber daya dengan ruang kerja agar dapat mengirimkan pekerjaan pelatihan. Untuk informasi selengkapnya, lihat Kuota sumber daya komputasi umum.
-
Lingjun resources
Siapkan sumber daya komputasi cerdas Lingjun dan kaitkan dengan ruang kerja Anda. Untuk informasi selengkapnya, lihat Buat kuota sumber daya.
Langkah 2: Siapkan gambar
Siapkan gambar kontainer untuk lingkungan pelatihan. Opsi gambar berikut didukung:
-
Official image: PAI menyediakan gambar resmi berdasarkan berbagai framework. Gambar-gambar ini dioptimalkan untuk Layanan Alibaba Cloud guna memberikan kompatibilitas dan kinerja yang lebih baik. Buka halaman Images page of AI Asset Management di Konsol PAI. Di halaman Image:, pada tab Alibaba Cloud Images, Anda dapat mengatur Modules ke DLC untuk melihat gambar yang mendukung Pekerjaan DLC.
-
Custom image: Jika pekerjaan pelatihan Anda memerlukan lingkungan atau dependensi tertentu, gunakan custom image. Tambahkan gambar tersebut sebagai aset AI PAI di halaman ruang kerja Anda agar dapat digunakan kembali di beberapa pekerjaan pelatihan. Untuk informasi selengkapnya, lihat Custom images.
PentingJika Anda menggunakan custom image dengan sumber daya Lingjun, lihat RDMA: Gunakan jaringan berkinerja-tinggi untuk pelatihan terdistribusi untuk pertimbangan terkait.
-
Image address: Tentukan alamat custom image atau official image saat mengirimkan pekerjaan pelatihan. Lihat alamat gambar di halaman Images page of AI Asset Management di Konsol PAI.
Langkah 3: Siapkan set data
Unggah data pelatihan ke OSS, NAS, atau CPFS dan buat set data, atau langsung pasang data dari Bucket OSS atau dataset publik.
Jenis set data yang didukung
PAI mendukung set data yang disimpan di OSS, General-purpose NAS, Extreme NAS, CPFS, dan Lingjun CPFS. Akselerasi set data didukung untuk semua jenis kecuali Lingjun CPFS.
Buat set data
Untuk langkah-langkah detail, lihat Buat dan kelola set data. Perhatikan batasan berikut:
-
Batasan OSS: OSS adalah layanan penyimpanan objek terdistribusi, bukan sistem file. Setelah memasang Bucket OSS, Anda tidak dapat menambahkan data ke file yang ada atau menimpa file tersebut.
-
Persyaratan VPC untuk CPFS: Konfigurasikan pekerjaan pelatihan agar menggunakan VPC yang sama dengan sistem file CPFS. Ketidaksesuaian VPC menyebabkan pekerjaan tetap dalam status Preparing environment tanpa henti.
Mengaktifkan akselerasi set data
Aktifkan akselerasi set data untuk meningkatkan efisiensi pembacaan data. Untuk detailnya, lihat Gunakan Dataset Accelerator di PAI.
Langkah 4: Siapkan kode sumber
Tambahkan kode pelatihan Anda sebagai aset AI di halaman ruang kerja Anda agar dapat digunakan kembali di beberapa pekerjaan pelatihan. Untuk informasi selengkapnya, lihat Konfigurasi kode.
Langkah berikutnya
Setelah menyelesaikan persiapan ini, buat pekerjaan pelatihan. Untuk informasi selengkapnya, lihat Buat pekerjaan pelatihan.