Bangun pipeline filter pasangan gambar-teks dengan LVM-Image-Text-Matching - Platform for AI

Komponen Filter Pencocokan Teks-Gambar LVM (DLC) digunakan untuk menyaring data gambar dengan skor pencocokan teks-gambar yang terlalu rendah.

Sumber daya komputasi yang didukung

Deep Learning Containers (DLC)

Algoritma

Komponen Filter Pencocokan Teks-Gambar LVM (DLC) membandingkan deskripsi teks suatu gambar dengan deskripsi teks dalam data pelatihan dan menghitung skor pencocokan berdasarkan blip-itm-base-coco. Dengan cara ini, komponen menyaring data gambar dengan skor pencocokan teks-gambar yang terlalu rendah untuk memastikan kualitas gambar. Deskripsi teks dalam data pelatihan adalah konten yang mengikuti bidang <__dj__video> dalam file data pelatihan. Komponen ini biasanya digunakan untuk pelatihan lebih lanjut model generasi gambar.

Inputnya adalah file JSONL. Bidang <__dj__image> menandai awal deskripsi teks, sedangkan bidang <|__dj__eoc|> menandai akhir deskripsi teks.

Bidang gambar adalah jalur OSS dari gambar.
Bidang teks adalah deskripsi teks.

Input dan output

Port input

Komponen Read File Data digunakan untuk membaca jalur OSS tempat data pelatihan disimpan.
Anda dapat mengonfigurasi parameter Image Data OSS Path untuk memilih file data pelatihan.

Untuk informasi lebih lanjut tentang file data pelatihan, lihat Algoritma.

Port keluaran

Hasil penyaringan. Untuk detail lebih lanjut, lihat deskripsi parameter di bagian berikutnya.

Konfigurasikan komponen

Anda dapat mengonfigurasi parameter komponen LVM-Image-Text-Matching Filter (DLC) di Machine Learning Designer. Tabel berikut menjelaskan parameter tersebut.

Tab	Parameter		Diperlukan	Deskripsi	Nilai default
Pengaturan Bidang	Jalur OSS Data Gambar		Tidak	File data pelatihan. Untuk informasi lebih lanjut, lihat Algoritma.	Tidak ada nilai default
	Jalur OSS File Output		Ya	Direktori OSS tempat hasil penyaringan disimpan. Hasil termasuk file berikut: {name}.jsonl: file output. Anda dapat mengonfigurasi parameter Output Filename untuk menentukan file output. {name}_stats.jsonl: file status. dj_run_yaml.yaml: file konfigurasi parameter yang digunakan saat algoritma dijalankan.	Tidak ada nilai default
	Nama File Output		Ya	Nama file hasil penyaringan.	result.jsonl
Pengaturan Parameter	Skor Pencocokan Teks-Bingkai Minimum		Ya	Skor pencocokan teks-gambar minimum.	0,1
Pengaturan Parameter	Skor Pencocokan Teks-Bingkai Maksimum		Ya	Skor pencocokan teks-gambar maksimum. Dalam kebanyakan kasus, atur parameter ini menjadi 1.	1
Penyesuaian Eksekusi	Pilih Grup Sumber Daya	Grup Sumber Daya Publik	Tidak	Tipe instans (CPU atau GPU) dan virtual private cloud (VPC) yang ingin Anda gunakan. Anda harus memilih tipe instans GPU untuk algoritma ini.	Tidak ada nilai default
	Pilih Grup Sumber Daya	Grup sumber daya khusus	Tidak	Jumlah inti CPU, memori, memori bersama, dan jumlah GPU yang ingin Anda gunakan.	Tidak ada nilai default
	Durasi Maksimum Berjalan (detik)		Tidak	Periode waktu maksimum selama komponen dapat berjalan. Jika periode waktu yang ditentukan terlampaui, pekerjaan dihentikan.	Tidak ada nilai default