Hasilkan caption video secara otomatis dengan LVM-Caption di DLC - Platform for AI

Komponen Pemeta LVM-Caption-Video (DLC) dari Platform for AI (PAI) digunakan untuk menghasilkan teks video. Hanya video MP4 yang dapat diproses.

Sumber daya komputasi yang didukung

Deep Learning Containers (DLC)

Algoritma

Komponen Pemeta LVM-Caption-Video (DLC) menggunakan model VideoBLIP untuk menghasilkan teks video berdasarkan frame video yang diambil sampelnya.

Input dan output

Port input

Komponen Read File Data digunakan untuk membaca jalur Object Storage Service (OSS) tempat data pelatihan disimpan.
Anda dapat mengonfigurasi parameter OSS Data Path untuk memilih direktori OSS tempat data video disimpan atau memilih file metadata video. Untuk informasi lebih lanjut, lihat deskripsi parameter pada bagian berikutnya.
Anda dapat menggunakan komponen apa pun dari LVM Data Processing (DLC) sebagai input.

Port keluaran

Hasil output. Untuk informasi lebih lanjut, lihat deskripsi parameter pada bagian berikutnya.

Konfigurasikan komponen

Anda dapat mengonfigurasi parameter komponen LVM-Caption-Video Mapper (DLC) di Machine Learning Designer. Tabel berikut menjelaskan parameter-parameter tersebut.

Tab	Parameter		Diperlukan	Deskripsi	Nilai default
Pengaturan Bidang	Jalur OSS Data Video		Tidak	Jika tidak ada komponen hulu saat pertama kali menjalankan komponen ini, Anda harus secara manual memilih direktori OSS tempat data video disimpan. Saat komponen dijalankan, file metadata video video_meta.jsonl dihasilkan di direktori tingkat atas dari direktori yang ditentukan oleh parameter ini. Saat Anda menggunakan komponen untuk memproses data video nanti, Anda dapat langsung memilih file video_meta.jsonl.	Tidak ada nilai default
	Jalur OSS File Output		Ya	Direktori OSS tempat hasil disimpan. Hasil mencakup file berikut: {name}.jsonl: file output. File output ditentukan oleh parameter Output Filename. dj_run_yaml.yaml: file konfigurasi parameter yang digunakan saat algoritma dijalankan.	Tidak ada nilai default
	Nama File Output		Ya	Nama file hasil.	result.jsonl
Pengaturan Parameter	Jumlah Caption Kandidat		Ya	Jumlah teks kandidat yang dihasilkan.	1
Pengaturan Parameter	Jumlah Frame yang Diambil Sampel		Ya	Jumlah frame video yang diambil sampelnya. Sistem mengumpulkan frame dalam video secara merata untuk analisis berdasarkan durasi video.	3
Pengaturan Eksekusi	Pilih Grup Sumber Daya	Grup Sumber Daya Publik	Tidak	Tipe instans (CPU atau GPU) dan virtual private cloud (VPC) yang ingin Anda gunakan. Anda harus memilih tipe instans GPU untuk algoritma ini.	Tidak ada nilai default
	Pilih Grup Sumber Daya	Grup sumber daya khusus	Tidak	Jumlah vCPU, memori, memori bersama, dan jumlah GPU yang ingin Anda gunakan.	Tidak ada nilai default
	Durasi Maksimum Berjalan (detik)		Tidak	Periode maksimum waktu selama komponen dapat berjalan. Jika periode waktu yang ditentukan terlampaui, pekerjaan dihentikan.	Tidak ada nilai default