Uji model ringkasan teks yang telah dilatih dan evaluasi performa inferensi berdasarkan hasil prediksi.
Prasyarat
OSS telah diaktifkan, dan Machine Learning Studio telah diberi izin untuk mengakses OSS. Untuk informasi selengkapnya, lihat Aktifkan OSS dan Berikan izin.
Batasan
Hanya resource komputasi DLC yang didukung.
Konfigurasikan parameter komponen di UI
Di Designer, konfigurasikan parameter komponen melalui antarmuka pengguna (UI).
-
Input
Port masukan (dari kiri ke kanan)
Tipe
Komponen hulu yang direkomendasikan
Wajib
Prediction data
OSS
Yes
Prediction model
Component output
No
-
Konfigurasi komponen
Tab
Parameter
Deskripsi
Field Settings
Input data format
Kolom teks dari file input. Nilai default adalah target:str:1,source:str:1.
Source text column
Nama kolom teks sumber dalam tabel input. Nilai default adalah source.
Appended output columns
Kolom teks tertentu dari file input yang ditambahkan ke kolom teks output. Pisahkan beberapa nama kolom dengan koma (,). Nilai default adalah source.
Output columns
Nama kolom untuk tabel sink. Nilai default adalah predictions,beams.
Prediction data output
Jalur Bucket OSS tempat file hasil prediksi disimpan.
Use custom model
Apakah akan menggunakan model PAI default untuk prediksi langsung. Nilai yang valid:
-
Yes
-
No (default)
Is Megatron model
Hanya model pra-latih dengan awalan `mg` yang tercantum di komponen Text Summarization Train yang didukung. Nilai yang valid:
-
Yes
-
No (default)
Model path
Diperlukan hanya ketika Use custom model diatur ke Yes.
Jalur penyimpanan model kustom di Bucket OSS.
Parameter Settings
Batch size
Ukuran pemrosesan batch selama pelatihan. Ini bertipe INT. Nilai default adalah 8.
Untuk server multi-GPU, parameter ini menentukan ukuran batch untuk setiap GPU.
Maximum text length
Panjang maksimum seluruh sekuens. Ini bertipe INT. Nilainya harus berada dalam rentang (1, 512). Nilai default adalah 512.
Language
Bahasa untuk pemrosesan teks:
-
zh: Chinese.
-
en: English.
Copy text from source
Apakah akan menggunakan mekanisme copy. Nilai yang valid:
-
false (default)
-
true
Minimum decoder length
Panjang minimum decoder. Ini bertipe INT. Nilai default adalah 12. Panjang output model harus lebih besar dari nilai ini.
Maximum decoder length
Panjang maksimum decoder. Ini bertipe INT. Nilai default adalah 32. Panjang output model harus kurang dari nilai ini.
Minimal Unique Field
Ukuran segmen non-pengulangan (n-gram). Ini bertipe INT. Nilai default adalah 2.
Beam search size
Ukuran beam search. Ini bertipe INT. Nilai default adalah 5.
Number of returned candidates
Jumlah hasil yang dikembalikan. Ini bertipe INT. Nilai default adalah 5.
PentingParameter ini harus sama dengan Beam search size.
Execution Tuning
GPU type
Tipe GPU dari resource komputasi. Nilai default adalah gn5-c8g1.2xlarge.
-
Contoh
Buat alur kerja menggunakan komponen Text Summarization Predict. Tersedia dua metode:
-
Metode 1: Gunakan model yang telah disesuaikan oleh komponen Text Summarization Train.

-
Metode 2: Gunakan model kustom.

Konfigurasikan komponen dan jalankan alur kerja:
-
Buat alur kerja. Untuk informasi selengkapnya, lihat bagian Contoh pada topik Text Summarization Train.
-
Siapkan data yang akan diringkas (predict_data.txt) dan unggah ke bucket OSS. Data uji dalam contoh ini berupa file TXT yang dipisahkan dengan tab.
File CSV juga didukung. Gunakan perintah Tunnel dari klien MaxCompute untuk mengunggah set data ke MaxCompute. Untuk informasi selengkapnya tentang cara menginstal dan mengonfigurasi klien MaxCompute, lihat Hubungkan ke MaxCompute menggunakan klien (odpscmd). Untuk informasi selengkapnya tentang perintah Tunnel, lihat Perintah Tunnel.
-
Baca set data uji menggunakan komponen Read OSS Data-3 pada Metode 1 atau komponen Read OSS Data-1 pada Metode 2. Atur parameter OSS Data Path ke jalur OSS tempat set data uji disimpan.
-
Hubungkan file model dan set data uji ke komponen Text Summarization Predict dan konfigurasikan parameternya. Untuk informasi selengkapnya, lihat Konfigurasikan parameter komponen di UI.
-
Untuk model yang telah disesuaikan oleh komponen Text Summarization Train, hubungkan port output model dari komponen Text Summarization Train ke port input model dari komponen Text Summarization Predict.
-
Untuk model kustom, pada tab Field Settings, atur parameter Use custom model ke Yes dan atur parameter Model path ke jalur OSS tempat model disimpan.
-
-
Klik tombol
untuk menjalankan alur kerja. Setelah eksekusi berhasil, lihat ringkasan output di jalur OSS yang ditentukan untuk parameter Prediction data output pada komponen Text Summarization Predict.
Referensi
-
Untuk informasi selengkapnya tentang cara mengonfigurasi komponen Text Summarization Train, lihat Text Summarization Train.