All Products
Search
Document Center

Platform For AI:Prediksi ringkasan teks

Last Updated:Mar 07, 2026

Uji model ringkasan teks yang telah dilatih dan evaluasi performa inferensi berdasarkan hasil prediksi.

Prasyarat

OSS telah diaktifkan, dan Machine Learning Studio telah diberi izin untuk mengakses OSS. Untuk informasi selengkapnya, lihat Aktifkan OSS dan Berikan izin.

Batasan

Hanya resource komputasi DLC yang didukung.

Konfigurasikan parameter komponen di UI

Di Designer, konfigurasikan parameter komponen melalui antarmuka pengguna (UI).

  • Input

    Port masukan (dari kiri ke kanan)

    Tipe

    Komponen hulu yang direkomendasikan

    Wajib

    Prediction data

    OSS

    Read OSS Data

    Yes

    Prediction model

    Component output

    Text Summarization Train

    No

  • Konfigurasi komponen

    Tab

    Parameter

    Deskripsi

    Field Settings

    Input data format

    Kolom teks dari file input. Nilai default adalah target:str:1,source:str:1.

    Source text column

    Nama kolom teks sumber dalam tabel input. Nilai default adalah source.

    Appended output columns

    Kolom teks tertentu dari file input yang ditambahkan ke kolom teks output. Pisahkan beberapa nama kolom dengan koma (,). Nilai default adalah source.

    Output columns

    Nama kolom untuk tabel sink. Nilai default adalah predictions,beams.

    Prediction data output

    Jalur Bucket OSS tempat file hasil prediksi disimpan.

    Use custom model

    Apakah akan menggunakan model PAI default untuk prediksi langsung. Nilai yang valid:

    • Yes

    • No (default)

    Is Megatron model

    Hanya model pra-latih dengan awalan `mg` yang tercantum di komponen Text Summarization Train yang didukung. Nilai yang valid:

    • Yes

    • No (default)

    Model path

    Diperlukan hanya ketika Use custom model diatur ke Yes.

    Jalur penyimpanan model kustom di Bucket OSS.

    Parameter Settings

    Batch size

    Ukuran pemrosesan batch selama pelatihan. Ini bertipe INT. Nilai default adalah 8.

    Untuk server multi-GPU, parameter ini menentukan ukuran batch untuk setiap GPU.

    Maximum text length

    Panjang maksimum seluruh sekuens. Ini bertipe INT. Nilainya harus berada dalam rentang (1, 512). Nilai default adalah 512.

    Language

    Bahasa untuk pemrosesan teks:

    • zh: Chinese.

    • en: English.

    Copy text from source

    Apakah akan menggunakan mekanisme copy. Nilai yang valid:

    • false (default)

    • true

    Minimum decoder length

    Panjang minimum decoder. Ini bertipe INT. Nilai default adalah 12. Panjang output model harus lebih besar dari nilai ini.

    Maximum decoder length

    Panjang maksimum decoder. Ini bertipe INT. Nilai default adalah 32. Panjang output model harus kurang dari nilai ini.

    Minimal Unique Field

    Ukuran segmen non-pengulangan (n-gram). Ini bertipe INT. Nilai default adalah 2.

    Beam search size

    Ukuran beam search. Ini bertipe INT. Nilai default adalah 5.

    Number of returned candidates

    Jumlah hasil yang dikembalikan. Ini bertipe INT. Nilai default adalah 5.

    Penting

    Parameter ini harus sama dengan Beam search size.

    Execution Tuning

    GPU type

    Tipe GPU dari resource komputasi. Nilai default adalah gn5-c8g1.2xlarge.

Contoh

Buat alur kerja menggunakan komponen Text Summarization Predict. Tersedia dua metode:

  • Metode 1: Gunakan model yang telah disesuaikan oleh komponen Text Summarization Train.Using a text summarization training model

  • Metode 2: Gunakan model kustom.Using a custom model

Konfigurasikan komponen dan jalankan alur kerja:

  1. Buat alur kerja. Untuk informasi selengkapnya, lihat bagian Contoh pada topik Text Summarization Train.

  2. Siapkan data yang akan diringkas (predict_data.txt) dan unggah ke bucket OSS. Data uji dalam contoh ini berupa file TXT yang dipisahkan dengan tab.

    File CSV juga didukung. Gunakan perintah Tunnel dari klien MaxCompute untuk mengunggah set data ke MaxCompute. Untuk informasi selengkapnya tentang cara menginstal dan mengonfigurasi klien MaxCompute, lihat Hubungkan ke MaxCompute menggunakan klien (odpscmd). Untuk informasi selengkapnya tentang perintah Tunnel, lihat Perintah Tunnel.

  3. Baca set data uji menggunakan komponen Read OSS Data-3 pada Metode 1 atau komponen Read OSS Data-1 pada Metode 2. Atur parameter OSS Data Path ke jalur OSS tempat set data uji disimpan.

  4. Hubungkan file model dan set data uji ke komponen Text Summarization Predict dan konfigurasikan parameternya. Untuk informasi selengkapnya, lihat Konfigurasikan parameter komponen di UI.

    • Untuk model yang telah disesuaikan oleh komponen Text Summarization Train, hubungkan port output model dari komponen Text Summarization Train ke port input model dari komponen Text Summarization Predict.

    • Untuk model kustom, pada tab Field Settings, atur parameter Use custom model ke Yes dan atur parameter Model path ke jalur OSS tempat model disimpan.

  5. Klik tombol image.png untuk menjalankan alur kerja. Setelah eksekusi berhasil, lihat ringkasan output di jalur OSS yang ditentukan untuk parameter Prediction data output pada komponen Text Summarization Predict.

Referensi

  • Untuk informasi selengkapnya tentang cara mengonfigurasi komponen Text Summarization Train, lihat Text Summarization Train.