Object Storage Service (OSS) Connector untuk AI/ML adalah pustaka Python yang digunakan untuk mengakses dan menyimpan data OSS secara efisien dalam pekerjaan pelatihan PyTorch.
Manfaat
Item | Jangan gunakan OSS Connector untuk AI/ML | Gunakan OSS Connector untuk AI/ML |
Kinerja | Anda harus mengoptimalkan kinerja secara manual, yang mungkin tidak efisien. | OSS Connector untuk AI/ML secara otomatis mengoptimalkan kinerja unduhan data OSS dan penyimpanan checkpoint. |
Metode pemuatan data | Anda harus mengunduh data terlebih dahulu, yang meningkatkan biaya dan beban kerja manajemen. | OSS Connector untuk AI/ML mendukung stream load untuk mengurangi biaya dan kompleksitas manajemen. |
Akses data | Anda harus membaca dan menulis data menggunakan adaptor, yang meningkatkan kompleksitas akses. | OSS Connector untuk AI/ML langsung membaca dan menulis data di OSS untuk menyederhanakan akses. |
Tingkat kesulitan konfigurasi | Anda harus mengompilasi kode, yang membuat konfigurasi sulit. | OSS Connector untuk AI/ML menyediakan item konfigurasi sederhana untuk meningkatkan efisiensi pengembangan. |
Cara kerjanya
Gambar berikut menunjukkan cara OSS Connector untuk AI/ML menjalankan pekerjaan pelatihan PyTorch dengan menggunakan data di OSS.
Deskripsi fitur
Tabel berikut menjelaskan fitur utama dari OSS Connector untuk AI/ML.
Item | Fitur | Kelas | Metode |
Dataset gaya peta | Cocok untuk akses acak untuk memfasilitasi akses cepat ke data tertentu selama pelatihan. | Kelas OssMapDataset dan OssIterableDataset menyediakan metode yang sama untuk membangun dataset.
| |
Dataset gaya iterable | Cocok untuk pembacaan streaming berurutan dan memungkinkan Anda memproses sejumlah besar aliran data kontinu secara efisien. | ||
Operasi API checkpoint | Memuat checkpoint dari OSS selama pelatihan model dan menyimpan checkpoint ke OSS setelah pelatihan model periodik. Dengan cara ini, alur kerja disederhanakan. |
|
Prosedur
Sebelum mengakses dan menyimpan data di OSS dalam pekerjaan pelatihan PyTorch, Anda harus menginstal dan mengonfigurasi OSS Connector untuk AI/ML. Untuk informasi lebih lanjut, lihat Instal OSS Connector untuk AI/ML dan Konfigurasikan OSS Connector untuk AI/ML.
Setelah menginstal dan mengonfigurasi OSS Connector untuk AI/ML, Anda dapat melakukan operasi berikut dalam pekerjaan pelatihan PyTorch:
Gunakan OssMapDataset untuk membangun dataset gaya peta yang cocok untuk pembacaan acak. Untuk informasi lebih lanjut, lihat Gunakan data di OSS untuk membangun dataset peta yang cocok untuk pembacaan acak.
Gunakan OssIterableDataset untuk membangun dataset gaya iterable yang cocok untuk pembacaan streaming berurutan. Untuk informasi lebih lanjut, lihat Gunakan data di OSS untuk membangun dataset iterable yang cocok untuk pembacaan streaming berurutan.
Gunakan OssCheckpoint untuk menyimpan dan mengakses checkpoint. Untuk informasi lebih lanjut, lihat Simpan dan akses checkpoint di OSS.
- Catatan
Data dalam dataset gaya peta dan iterable serta checkpoint memiliki tipe yang sama. Untuk informasi lebih lanjut tentang metode yang didukung oleh tipe data tersebut, lihat Tipe data di OSS Connector untuk AI/ML.
Casus penggunaan
Jika ingin dengan cepat mempelajari cara menggunakan data OSS untuk menjalankan pekerjaan pelatihan PyTorch dan menyimpan hasil pelatihan ke OSS, kami menyediakan demo yang menggunakan OSS Connector untuk AI/ML untuk melatih model pengenalan digit tulisan tangan. Untuk informasi lebih lanjut, lihat Mulai dengan OSS Connector untuk AI/ML.
Untuk lebih meningkatkan kinerja OSS Connector untuk AI/ML, disarankan menggunakan titik akhir dipercepat dari Akselerator OSS daripada titik akhir internal OSS. Untuk informasi lebih lanjut tentang perbandingan kinerja antara OSS Connector untuk AI/ML yang menggunakan titik akhir internal OSS dan yang menggunakan titik akhir dipercepat dari Akselerator OSS, lihat Pengujian kinerja.
Jika ingin menggunakan OSS Connector untuk AI/ML dalam lingkungan terkontainerisasi, Anda dapat menggunakan gambar Docker yang berisi lingkungan OSS Connector untuk AI/ML. Untuk informasi lebih lanjut tentang cara membangun gambar Docker, lihat Bangun gambar Docker yang berisi lingkungan OSS Connector untuk AI/ML.