Komponen LVM-Image-Text-Similarity Filter (DLC) digunakan untuk menyaring data gambar dengan kesamaan teks-gambar yang terlalu rendah.
Sumber daya komputasi yang didukung
Algoritma
Komponen LVM-Image-Text-Similarity Filter (DLC) menghitung kesamaan antara teks deskripsi gambar dan teks deskripsi dalam data pelatihan berdasarkan clip-vit-base-patch32. Dengan cara ini, komponen menyaring data gambar dengan kesamaan teks-gambar yang terlalu rendah untuk memastikan kualitas gambar. Teks deskripsi dalam data pelatihan adalah konten yang mengikuti bidang <__dj__video> dalam file data pelatihan. Umumnya, komponen ini digunakan untuk pelatihan lanjutan model pembuatan gambar.
Input berupa file JSONL. Bidang <__dj__image> merupakan penanda awal teks deskripsi, sedangkan bidang <|__dj__eoc|> adalah penanda akhir teks deskripsi.

Bidang gambar adalah jalur OSS dari gambar.
Bidang teks adalah teks deskripsi.
Input dan output
Port input
Komponen Read File Data digunakan untuk membaca jalur OSS tempat data pelatihan disimpan.
Anda dapat mengonfigurasi parameter Image Data OSS Path untuk memilih file data pelatihan.
Untuk informasi lebih lanjut tentang file data pelatihan, lihat Algoritma.
Port output
Hasil penyaringan. Untuk informasi lebih lanjut, lihat deskripsi parameter di bagian berikutnya.
Konfigurasikan komponen
Anda dapat mengonfigurasi parameter komponen LVM-Image-Text-Similarity Filter (DLC) di Machine Learning Designer. Tabel berikut menjelaskan parameter tersebut.
Tab | Parameter | Diperlukan | Deskripsi | Nilai default | |
Pengaturan Bidang | Image Data OSS Path | Tidak | File data pelatihan. Untuk informasi lebih lanjut, lihat Algoritma. | Tidak ada nilai default | |
Output File OSS Path | Ya | Direktori OSS tempat hasil penyaringan disimpan. Hasilnya mencakup file berikut:
| Tidak ada nilai default | ||
Output Filename | Ya | Nama file dari hasil penyaringan. | result.jsonl | ||
Pengaturan Parameter | Skor Kesamaan Minimum Teks-Gambar | Ya | Kesamaan teks-gambar minimum. | 0,1 | |
Skor Kesamaan Maksimum Teks-Gambar | Ya | Kesamaan teks-gambar maksimum. Dalam kebanyakan kasus, atur parameter ini ke 1. | 1 | ||
Pengaturan Eksekusi | Pilih Grup Sumber Daya | Grup Sumber Daya Publik | Tidak | Jenis instans (CPU atau GPU) dan virtual private cloud (VPC) yang ingin Anda gunakan. Anda harus memilih jenis instans GPU untuk algoritma ini. | Tidak ada nilai default |
Grup sumber daya khusus | Tidak | Jumlah inti CPU, memori, memori bersama, dan jumlah GPU yang ingin Anda gunakan. | Tidak ada nilai default | ||
Durasi Maksimum Berjalan (detik) | Tidak | Periode waktu maksimum selama komponen dapat berjalan. Jika periode waktu yang ditentukan terlampaui, pekerjaan dihentikan. | Tidak ada nilai default | ||