全部产品
Search
文档中心

Platform For AI:Pemeta LVM-Caption-Video (DLC)

更新时间:Jun 22, 2025

Komponen Pemeta LVM-Caption-Video (DLC) dari Platform for AI (PAI) digunakan untuk menghasilkan teks video. Hanya video MP4 yang dapat diproses.

Sumber daya komputasi yang didukung

Deep Learning Containers (DLC)

Algoritma

Komponen Pemeta LVM-Caption-Video (DLC) menggunakan model VideoBLIP untuk menghasilkan teks video berdasarkan frame video yang diambil sampelnya.

Input dan output

Port input

  • Komponen Read File Data digunakan untuk membaca jalur Object Storage Service (OSS) tempat data pelatihan disimpan.

  • Anda dapat mengonfigurasi parameter OSS Data Path untuk memilih direktori OSS tempat data video disimpan atau memilih file metadata video. Untuk informasi lebih lanjut, lihat deskripsi parameter pada bagian berikutnya.

  • Anda dapat menggunakan komponen apa pun dari LVM Data Processing (DLC) sebagai input.

Port keluaran

Hasil output. Untuk informasi lebih lanjut, lihat deskripsi parameter pada bagian berikutnya.

Konfigurasikan komponen

Anda dapat mengonfigurasi parameter komponen LVM-Caption-Video Mapper (DLC) di Machine Learning Designer. Tabel berikut menjelaskan parameter-parameter tersebut.

Tab

Parameter

Diperlukan

Deskripsi

Nilai default

Pengaturan Bidang

Jalur OSS Data Video

Tidak

Jika tidak ada komponen hulu saat pertama kali menjalankan komponen ini, Anda harus secara manual memilih direktori OSS tempat data video disimpan. Saat komponen dijalankan, file metadata video video_meta.jsonl dihasilkan di direktori tingkat atas dari direktori yang ditentukan oleh parameter ini. Saat Anda menggunakan komponen untuk memproses data video nanti, Anda dapat langsung memilih file video_meta.jsonl.

Tidak ada nilai default

Jalur OSS File Output

Ya

Direktori OSS tempat hasil disimpan. Hasil mencakup file berikut:

  • {name}.jsonl: file output. File output ditentukan oleh parameter Output Filename.

  • dj_run_yaml.yaml: file konfigurasi parameter yang digunakan saat algoritma dijalankan.

Tidak ada nilai default

Nama File Output

Ya

Nama file hasil.

result.jsonl

Pengaturan Parameter

Jumlah Caption Kandidat

Ya

Jumlah teks kandidat yang dihasilkan.

1

Jumlah Frame yang Diambil Sampel

Ya

Jumlah frame video yang diambil sampelnya. Sistem mengumpulkan frame dalam video secara merata untuk analisis berdasarkan durasi video.

3

Pengaturan Eksekusi

Pilih Grup Sumber Daya

Grup Sumber Daya Publik

Tidak

Tipe instans (CPU atau GPU) dan virtual private cloud (VPC) yang ingin Anda gunakan. Anda harus memilih tipe instans GPU untuk algoritma ini.

Tidak ada nilai default

Grup sumber daya khusus

Tidak

Jumlah vCPU, memori, memori bersama, dan jumlah GPU yang ingin Anda gunakan.

Tidak ada nilai default

Durasi Maksimum Berjalan (detik)

Tidak

Periode maksimum waktu selama komponen dapat berjalan. Jika periode waktu yang ditentukan terlampaui, pekerjaan dihentikan.

Tidak ada nilai default