全部产品
Search
文档中心

Platform For AI:Filter Rasio-Teks LVM (DLC)

更新时间:Jun 22, 2025

Komponen Filter Rasio-Teks LVM (DLC) dari Platform for AI (PAI) digunakan untuk menyaring data video yang memiliki terlalu banyak teks. Hanya video MP4 yang dapat diproses. Komponen ini sangat cocok untuk skenario pengeditan video dan peninjauan konten, membantu pengguna secara otomatis mengidentifikasi dan memproses segmen video yang mengandung teks berlebihan, sehingga meningkatkan efisiensi kerja.

Sumber daya komputasi yang didukung

Deep Learning Containers (DLC)

Algoritma

Komponen Filter Rasio-Teks LVM (DLC) menghitung proporsi area teks pada frame video yang diambil sampelnya untuk mengukur proporsi teks dari seluruh video. Dengan cara ini, komponen dapat menyaring data video yang memiliki terlalu banyak teks guna memastikan kualitas video. Umumnya, komponen ini digunakan untuk pelatihan lebih lanjut model pembangkitan video.

Input dan output

Port input

  • Komponen Read File Data digunakan untuk membaca jalur Object Storage Service (OSS) tempat data pelatihan disimpan.

  • Anda dapat mengonfigurasi parameter OSS Data Path untuk memilih direktori OSS tempat data video disimpan atau memilih file metadata video. Untuk informasi lebih lanjut, lihat deskripsi parameter di bagian berikutnya.

  • Anda dapat menggunakan komponen apa pun dari Pemrosesan Data LVM (DLC) sebagai input.

Port keluaran

Hasil penyaringan. Untuk informasi lebih lanjut, lihat deskripsi parameter di bagian berikutnya.

Konfigurasikan komponen

Anda dapat mengonfigurasi parameter komponen LVM-Text-Ratio Filter (DLC) di Machine Learning Designer. Tabel berikut menjelaskan parameter tersebut.

Tab

Parameter

Diperlukan

Deskripsi

Nilai default

Pengaturan Bidang

Jalur OSS Data Video

Tidak

Jika tidak ada komponen hulu yang ada saat pertama kali Anda menjalankan komponen ini, Anda harus secara manual memilih direktori OSS tempat data video disimpan. Saat komponen dijalankan, file metadata video video_meta.jsonl dibuat di direktori tingkat atas dari direktori yang ditentukan oleh parameter ini. Saat Anda menggunakan komponen untuk memproses data video nanti, Anda dapat langsung memilih file video_meta.jsonl.

Tidak ada nilai default

Jalur OSS File Output

Ya

Direktori OSS tempat hasil penyaringan disimpan. Hasil termasuk file berikut:

  • {name}.jsonl: file output. Anda dapat mengonfigurasi parameter Output Filename untuk menentukan file output.

  • {name}_stats.jsonl: file status.

  • dj_run_yaml.yaml: file konfigurasi parameter yang digunakan saat algoritma dijalankan.

Tidak ada nilai default

Nama File Output

Ya

Nama file hasil penyaringan.

result.jsonl

Pengaturan Parameter

Rasio Area Teks Minimum

Ya

Rasio minimum area teks.

0

Rasio Area Teks Maksimum

Ya

Rasio maksimum area teks.

1

Jumlah Frame yang Diambil Sampelnya

Ya

Jumlah frame video yang diambil sampelnya. Sistem mengumpulkan frame dalam video secara merata untuk analisis berdasarkan durasi video.

1

Pengaturan Eksekusi

Jumlah Proses

Ya

Jumlah proses.

4

Pilih Grup Sumber Daya

Grup Sumber Daya Publik

Tidak

Tipe instans (CPU atau GPU) dan virtual private cloud (VPC) yang ingin Anda gunakan. Anda harus memilih tipe instans GPU untuk algoritma ini.

Tidak ada nilai default

Grup sumber daya khusus

Tidak

Jumlah vCPU, memori, memori bersama, dan jumlah GPU yang ingin Anda gunakan.

Tidak ada nilai default

Durasi Maksimum Berjalan (detik)

Tidak

Periode waktu maksimum selama komponen dapat berjalan. Jika periode waktu yang ditentukan dilampaui, pekerjaan dihentikan.

Tidak ada nilai default