All Products
Search
Document Center

Platform For AI:Filtering gambar-teks

Last Updated:Apr 23, 2026

Algoritma pemrosesan gambar Large Vision Model (LVM) menyediakan fitur seperti pembersihan gambar, penyaringan konten, ekstraksi informasi, dan pembuatan keterangan (caption). Anda dapat menggabungkan algoritma-algoritma ini untuk menyaring data gambar dan menghasilkan deskripsi teks, sehingga membantu menyiapkan data berkualitas tinggi untuk pelatihan model generasi gambar. Topik ini menjelaskan cara menggunakan templat preset Image-Text Filtering di Visualized Modeling (Designer).

Limitations

Templat preset Image-Text Filtering hanya tersedia di wilayah China (Hangzhou), China (Shanghai), China (Beijing), dan China (Shenzhen).

Prepare image data

PAI menyediakan data sampel untuk memulai.

  1. Unduh file metadata gambar dan file gambar.

    • File metadata gambar: image_meta.jsonl, digunakan sebagai input untuk algoritma gambar-teks.

    • File gambar: data.zip, digunakan sebagai input untuk algoritma pemrosesan gambar umum.

  2. Ekstrak file data.zip dan unggah gambarnya ke OSS. Untuk detailnya, lihat Simple upload.

  3. Modifikasi file metadata gambar.

    Pada file metadata gambar, ganti oss://bucket_name.oss-cn-hangzhou.aliyuncs.com/image_algorithm_test/image_data/ dengan direktori Bucket OSS tempat Anda mengunggah gambar.

    image

  4. Unggah file metadata gambar yang telah dimodifikasi ke Bucket OSS yang digunakan pada langkah 2. Untuk detailnya, lihat Simple upload.

Create and run a workflow

  1. Buka halaman Designer.

    1. Masuk ke Konsol PAI.

    2. Di pojok kiri atas, pilih wilayah yang diperlukan.

    3. Di panel navigasi sebelah kiri, klik Workspaces. Pada halaman Workspaces, klik nama ruang kerja Anda.

    4. Di panel navigasi sebelah kiri, pilih Model Training > Visualized Modeling (Designer) untuk membuka halaman Designer.

  2. Buat alur kerja.

    1. Pada tab Preset Templates, pilih Business Areas > Multi-modal LLM, lalu klik Create pada kartu templat Image-Text Filtering.

      image

    2. Konfigurasikan parameter alur kerja (atau gunakan pengaturan default), lalu klik Confirm.

    3. Pada daftar alur kerja, pilih alur kerja yang telah Anda buat, lalu klik Open.

  3. Konfigurasikan alur kerja.

    • Konfigurasikan komponen Read OSS Data: Klik komponen Read OSS Data. Di panel kanan, pada tab Field Settings, atur OSS Data Path ke direktori Bucket OSS yang berisi file data gambar Anda.

    • Konfigurasikan kelompok LLMDataProcessGroup1: Klik ikon pengaturan image dan atur Data Output OSS Directory. Direktori ini menyimpan file hasil dari eksekusi alur kerja berikutnya. Untuk informasi lebih lanjut tentang komponen algoritma pra-pemrosesan gambar LVM, lihat Image preprocessing operators.

      image

  4. Jalankan alur kerja. Setelah eksekusi selesai, lihat file yang dihasilkan:

    • File meta.jsonl: Selama eksekusi, alur kerja menghasilkan file metadata gambar bernama meta.jsonl di direktori induk dari path yang ditentukan untuk OSS Path of Image Data.

    • File hasil: Lihat file ini di direktori yang ditentukan untuk OSS Path of Output File.

    Untuk detail tentang file hasil, lihat penjelasan parameter OSS Path of Output File di Image preprocessing operators.

Related topics

Image preprocessing components