全部产品
Search
文档中心

Platform For AI:Pembersihan dan pelabelan data video

更新时间:Jul 02, 2025

Machine Learning Designer dari Platform for AI (PAI) menyediakan berbagai komponen algoritma model visi besar (LVM) untuk membantu Anda memproses tugas video dengan mudah, seperti pembersihan data video, penyaringan konten, ekstraksi informasi dasar, klasifikasi, dan pembuatan teks. Anda dapat menggabungkan berbagai komponen algoritma untuk menyaring data video berkualitas tinggi dan menghasilkan teks video yang dapat digunakan untuk melatih model video generatif. Topik ini menjelaskan cara menggunakan template preset yang disediakan oleh Machine Learning Designer untuk pembersihan dan pelabelan data video.

Batasan

Template preset untuk pembersihan dan pelabelan data video hanya tersedia di wilayah China (Hangzhou), China (Shanghai), China (Beijing), dan China (Shenzhen).

Siapkan data video

Unggah file video ke Bucket Object Storage Service (OSS). File harus memenuhi persyaratan berikut:

  • File dalam format MP4.

  • Nama file tidak mengandung karakter Cina.

Buat dan jalankan pipeline

  1. Buka halaman Pemodelan Visual (Designer).

    1. Masuk ke Konsol PAI.

    2. Di pojok kiri atas, pilih wilayah sesuai kebutuhan bisnis Anda.

    3. Di panel navigasi sisi kiri, klik Workspaces. Di halaman Workspaces, klik nama workspace yang ingin Anda gunakan.

    4. Di dalam workspace, pilih Model Training > Visualized Modeling (Designer) di panel navigasi sisi kiri.

  2. Buat sebuah pipeline.

    1. Di halaman Pemodelan Visual (Designer), klik tab Preset Templates, pilih Business Area dari daftar drop-down, klik tab Multi-modal LLM, lalu klik Create di kartu Video Data Filtering and Labeling untuk membuat pipeline.

      image

    2. Konfigurasikan parameter pipeline. Anda bisa mempertahankan nilai default, lalu klik OK.

    3. Klik tab Pipelines. Dalam daftar pipeline, klik pipeline yang telah Anda buat, lalu klik Open.

  3. Konfigurasikan pipeline.

    image

    Di panel sebelah kanan, konfigurasikan parameter dari komponen berikut:

    • Komponen Baca Data File: Atur parameter OSS Data Path ke direktori yang Anda tentukan saat mengunggah file video ke bucket OSS. Untuk informasi lebih lanjut, lihat bagian "Siapkan Data Video" dari topik ini.

    • Komponen Algoritma LVM: Untuk informasi tentang cara mengonfigurasi komponen algoritma model visi besar (LVM), lihat Operator Pra-pemrosesan Video.

  4. Jalankan pipeline. Setelah pipeline dijalankan, Anda dapat melihat file yang dihasilkan berikut:

    • File metadata video bernama video_meta.jsonl dihasilkan di direktori level atas dari path yang ditentukan oleh parameter Video Data OSS Path.

    • File output dihasilkan di path yang ditentukan oleh parameter Output File OSS Path.

    Untuk informasi lebih lanjut tentang file output, lihat deskripsi parameter di bagian "Output File OSS Path" dalam topik Operator Pra-pemrosesan Video.

Referensi

Operator Pra-pemrosesan Video