全部产品
Search
文档中心

Platform For AI:Filter Pencocokan Teks-Gambar LVM (DLC)

更新时间:Jun 22, 2025

Komponen Filter Pencocokan Teks-Gambar LVM (DLC) digunakan untuk menyaring data gambar dengan skor pencocokan teks-gambar yang terlalu rendah.

Sumber daya komputasi yang didukung

Deep Learning Containers (DLC)

Algoritma

Komponen Filter Pencocokan Teks-Gambar LVM (DLC) membandingkan deskripsi teks suatu gambar dengan deskripsi teks dalam data pelatihan dan menghitung skor pencocokan berdasarkan blip-itm-base-coco. Dengan cara ini, komponen menyaring data gambar dengan skor pencocokan teks-gambar yang terlalu rendah untuk memastikan kualitas gambar. Deskripsi teks dalam data pelatihan adalah konten yang mengikuti bidang <__dj__video> dalam file data pelatihan. Komponen ini biasanya digunakan untuk pelatihan lebih lanjut model generasi gambar.

Inputnya adalah file JSONL. Bidang <__dj__image> menandai awal deskripsi teks, sedangkan bidang <|__dj__eoc|> menandai akhir deskripsi teks.

image

  • Bidang gambar adalah jalur OSS dari gambar.

  • Bidang teks adalah deskripsi teks.

Input dan output

Port input

  • Komponen Read File Data digunakan untuk membaca jalur OSS tempat data pelatihan disimpan.

  • Anda dapat mengonfigurasi parameter Image Data OSS Path untuk memilih file data pelatihan.

Untuk informasi lebih lanjut tentang file data pelatihan, lihat Algoritma.

Port keluaran

Hasil penyaringan. Untuk detail lebih lanjut, lihat deskripsi parameter di bagian berikutnya.

Konfigurasikan komponen

Anda dapat mengonfigurasi parameter komponen LVM-Image-Text-Matching Filter (DLC) di Machine Learning Designer. Tabel berikut menjelaskan parameter tersebut.

Tab

Parameter

Diperlukan

Deskripsi

Nilai default

Pengaturan Bidang

Jalur OSS Data Gambar

Tidak

File data pelatihan. Untuk informasi lebih lanjut, lihat Algoritma.

Tidak ada nilai default

Jalur OSS File Output

Ya

Direktori OSS tempat hasil penyaringan disimpan. Hasil termasuk file berikut:

  • {name}.jsonl: file output. Anda dapat mengonfigurasi parameter Output Filename untuk menentukan file output.

  • {name}_stats.jsonl: file status.

  • dj_run_yaml.yaml: file konfigurasi parameter yang digunakan saat algoritma dijalankan.

Tidak ada nilai default

Nama File Output

Ya

Nama file hasil penyaringan.

result.jsonl

Pengaturan Parameter

Skor Pencocokan Teks-Bingkai Minimum

Ya

Skor pencocokan teks-gambar minimum.

0,1

Skor Pencocokan Teks-Bingkai Maksimum

Ya

Skor pencocokan teks-gambar maksimum. Dalam kebanyakan kasus, atur parameter ini menjadi 1.

1

Penyesuaian Eksekusi

Pilih Grup Sumber Daya

Grup Sumber Daya Publik

Tidak

Tipe instans (CPU atau GPU) dan virtual private cloud (VPC) yang ingin Anda gunakan. Anda harus memilih tipe instans GPU untuk algoritma ini.

Tidak ada nilai default

Grup sumber daya khusus

Tidak

Jumlah inti CPU, memori, memori bersama, dan jumlah GPU yang ingin Anda gunakan.

Tidak ada nilai default

Durasi Maksimum Berjalan (detik)

Tidak

Periode waktu maksimum selama komponen dapat berjalan. Jika periode waktu yang ditentukan terlampaui, pekerjaan dihentikan.

Tidak ada nilai default