Cloud Parallel File Storage (CPFS) untuk Lingjun mendukung tugas dataflow batch dan streaming. Anda dapat memilih tipe tugas sesuai dengan kebutuhan bisnis Anda.
Tugas Batch
Tugas batch memungkinkan Anda mengimpor semua file dari satu direktori ke direktori lain secara bersamaan. Tipe tugas ini cocok untuk memuat dataset sebelum pelatihan dimulai.
Tugas Streaming
Tugas streaming memungkinkan Anda mengimpor file dari satu direktori ke direktori lain satu per satu. Tipe tugas ini cocok untuk membaca dan menulis beberapa file checkpoint secara terus-menerus selama komputasi pelatihan model.
Hanya CPFS untuk Lingjun V2.6.0 dan versi lebih baru yang mendukung tugas streaming.
Anda hanya dapat menggunakan tugas streaming dengan memanggil operasi API. Untuk informasi lebih lanjut, lihat Praktik Terbaik Tugas Dataflow Streaming.
Deskripsi Tugas
Tugas dataflow diklasifikasikan menjadi tipe berikut: Impor, Ekspor, StreamImpor, dan StreamEkspor berdasarkan operasi data.
Tipe | Deskripsi |
Impor | Mengimpor data dari Bucket Object Storage Service (OSS) sumber ke sistem file CPFS untuk Lingjun sekaligus.
|
Ekspor | Mengekspor data yang ditentukan dari sistem file CPFS untuk Lingjun ke bucket OSS sekaligus. Path ekspor adalah path sebuah file atau direktori dalam sistem file CPFS untuk Lingjun. Tugas dataflow mengekspor data dari path file atau direktori dalam sistem file CPFS untuk Lingjun ke bucket OSS. Peringatan
|
StreamImpor | Mengimpor objek yang ditentukan dari bucket OSS sumber ke sistem file CPFS untuk Lingjun satu per satu. Anda hanya dapat menggunakan tugas StreamImpor dengan memanggil operasi API.
|
StreamEkspor | Mengekspor file yang ditentukan dari sistem file CPFS untuk Lingjun ke bucket OSS satu per satu. Anda hanya dapat menggunakan tugas StreamEkspor dengan memanggil operasi API. Path ekspor adalah path sebuah file atau direktori dalam sistem file CPFS untuk Lingjun. Tugas dataflow mengekspor data dari path file atau direktori dalam sistem file CPFS untuk Lingjun ke bucket OSS. |