Algoritma pengeditan gambar LVM menyediakan fitur seperti pembersihan gambar, penyaringan konten, ekstraksi informasi dasar gambar, dan pembuatan keterangan gambar. Anda dapat menggabungkan berbagai algoritma untuk menyaring data gambar dan menghasilkan deskripsi teks. Proses ini memberikan data gambar berkualitas tinggi untuk melatih model pembuatan gambar. Topik ini menjelaskan cara menggunakan templat preset penyaringan gambar-teks di Machine Learning Designer.
Batasan
Templat preset penyaringan gambar-teks hanya tersedia di Wilayah Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), dan Tiongkok (Shenzhen).
Siapkan data gambar
PAI menyediakan data sampel yang dapat Anda gunakan:
Unduh file metadata gambar dan file gambar.
File metadata gambar: image_meta.jsonl. File ini digunakan sebagai input untuk algoritma gambar-teks.
File gambar: data.zip. File ini digunakan sebagai input untuk algoritma pengeditan gambar umum.
Ekstrak paket tersebut dan unggah file gambar ke OSS. Untuk informasi lebih lanjut, lihat Unggah Sederhana.
Modifikasi file metadata gambar.
Ganti konfigurasi
oss://bucket_name.oss-cn-hangzhou.aliyuncs.com/image_algorithm_test/image_data/dalam file metadata gambar dengan direktori OSS tempat Anda mengunggah gambar.
Unggah file metadata gambar ke Bucket OSS yang sama tempat Anda mengunggah file gambar. Untuk informasi lebih lanjut, lihat Unggah Sederhana.
Buat dan jalankan pipeline
Buka halaman Machine Learning Designer.
Masuk ke Konsol PAI.
Di pojok kiri atas, pilih wilayah yang diinginkan.
Di panel navigasi sebelah kiri, klik Workspace List, lalu klik nama ruang kerja yang ingin Anda kelola.
Di panel navigasi sebelah kiri, pilih Model Development And Training > Machine Learning Designer.
Buat pipeline.
Di tab Preset Templates, pilih Business Domain > Multimodal Large Model, lalu klik Create pada templat Image-Text Filtering.

Konfigurasikan parameter alur kerja dan klik OK. Anda dapat menggunakan nilai default.
Dalam daftar alur kerja, pilih alur kerja yang telah dibuat dan klik Enter Pipeline.
Konfigurasikan pipeline.
Konfigurasikan komponen Baca Data OSS. Klik komponen Baca Data OSS. Pada tab Pengaturan Bidang di panel sebelah kanan, atur Jalur Data OSS ke direktori OSS tempat file data gambar disimpan.
Konfigurasikan grup LLMDataProcessGroup1. Klik tombol Pengaturan
dan konfigurasikan Direktori Output Data OSS. File output akan disimpan di direktori ini. Untuk informasi lebih lanjut tentang konfigurasi komponen algoritma pra-pemrosesan gambar LVM, lihat Operator Pra-Pemrosesan Gambar.
Jalankan alur kerja. Setelah proses selesai, Anda dapat melihat file yang dihasilkan:
File meta.jsonl: Selama proses berlangsung, file metadata gambar meta.jsonl dihasilkan di direktori induk dari jalur yang ditentukan untuk Jalur Data Gambar OSS.
File hasil: Anda dapat melihat file hasil di direktori yang Anda tentukan untuk Jalur File Output OSS.
Untuk informasi lebih lanjut tentang file hasil, lihat deskripsi parameter Jalur File Output OSS di Operator Pra-Pemrosesan Gambar.