Lakukan pelatihan model ringkasan teks untuk tugas pembuatan konten otomatis, seperti merangkum dokumen dan menghasilkan judul berita.
Batasan
Komponen ini hanya dapat dijalankan pada resource komputasi DLC.
Arsitektur model
Komponen ini menggunakan arsitektur Transformer standar dengan struktur encoder-decoder. Selama pelatihan, model menerima artikel asli sebagai input dan judul target sebagai output.
Prasyarat
Sambungkan komponen Sentence Split di hulu untuk memisahkan teks menjadi satu kalimat per baris.
Konfigurasikan parameter komponen
Konfigurasikan parameter komponen di antarmuka Designer.
-
Port input
Port input (dari kiri ke kanan)
Tipe data
Komponen hulu yang direkomendasikan
Wajib
Input data pelatihan
OSS
Ya
Input data validasi
OSS
Ya
-
Parameter komponen
Tab
Parameter
Deskripsi
Field Settings
Input data format
Kolom teks dalam file input. Default: target:str:1,source:str:1.
Source column
Nama kolom untuk teks sumber dalam tabel input. Default: source.
Summary Column Selection
Nama kolom untuk teks ringkasan dalam tabel input. Default: target.
Model save path
Direktori Bucket OSS untuk menyimpan file model yang telah dilatih.
Parameter Settings
Pre-trained model
Model pra-latih yang akan digunakan. Pilih dari tab Parameter Settings. Default: alibaba-pai/mt5-title-generation-zh.
Batch size
Ukuran batch selama pelatihan. Tipe INT. Default: 16.
Untuk server multi-GPU, nilai ini menentukan ukuran batch per GPU.
Maximum text length
Panjang maksimum urutan yang diproses. Tipe INT. Rentang valid: 1–512. Default: 512.
Number of epochs
Total epoch pelatihan. Tipe INT. Default: 3.
Learning rate
Laju pembelajaran untuk pelatihan model. Tipe FLOAT. Default: 3e-5.
Steps to Save a Model File
Jumlah langkah pelatihan yang memicu evaluasi dan penyimpanan model terbaik. Nilai default: 150.
Language
Bahasa yang didukung:
-
zh: Chinese
-
en: English
Copy text from source
Apakah segmen teks dari sumber akan disalin ke output:
-
false: (Default) Tidak menyalin teks
-
true: Menyalin teks
Minimum decoder length
Panjang output minimum. Tipe INT. Default: 12.
Maximum decoder length
Panjang output maksimum. Tipe INT. Default: 32.
Minimum non-repeated n-gram
n-gram minimum yang tidak boleh berulang dalam output. Tipe INT. Default: 2. Misalnya, jika diatur ke 1, kata berulang seperti "day day" akan dicegah.
Beam search size
Ukuran ruang pencarian saat menghasilkan kandidat jawaban. Tipe INT. Default: 5. Nilai yang lebih besar memperlambat prediksi.
Number of returned candidates
Jumlah kandidat peringkat teratas yang dikembalikan. Tipe INT. Default: 5.
Execution Tuning
GPU machine type
Tipe instans GPU untuk resource komputasi. Default: gn5-c8g1.2xlarge.
-
-
Port output
Port output
Tipe data
Komponen hilir yang direkomendasikan
Wajib
Output model
Jalur OSS yang ditentukan dalam parameter Model save path pada tab Field Settings. Model yang telah dilatih, dalam format SavedModel, disimpan di sini.
Tidak
Contoh penggunaan
Alur kerja berikut menunjukkan cara menggunakan komponen Text Summarization Training.
Konfigurasikan dan jalankan alur kerja sebagai berikut:
-
Siapkan set data pelatihan (cn_train.txt) dan set data validasi (cn_dev.txt), lalu unggah ke bucket OSS. Contoh ini berupa file TXT dengan bidang yang dipisahkan tab.
File CSV juga didukung. Gunakan perintah Tunnel di klien MaxCompute untuk mengunggah set data ke MaxCompute. Untuk informasi selengkapnya, lihat Connect using the client (odpscmd) dan Tunnel commands.
-
Gunakan komponen Read OSS Data-1 dan Read OSS Data-2 untuk membaca set data pelatihan dan validasi. Atur parameter OSS Data Path ke jalur OSS tempat set data disimpan.
-
Sambungkan set data pelatihan dan validasi ke komponen Text Summarization Training-1. Konfigurasikan parameter seperti yang dijelaskan dalam Konfigurasikan parameter komponen.
-
Klik
untuk menjalankan alur kerja. Setelah alur kerja berhasil selesai, lihat model ringkasan output. Model disimpan ke jalur OSS yang ditentukan dalam parameter Model save path pada komponen Text Summarization Training-1.