iTAG mendukung pre-labeling data melalui Konfigurasi Intelligent Labeling. Anda kemudian dapat melakukan pelabelan formal berdasarkan hasil pre-labeling tersebut. Selama pelabelan formal, Anda hanya perlu memverifikasi dan mengoreksi hasilnya, sehingga efisiensi pelabelan meningkat secara signifikan. iTAG mendukung dua metode pre-labeling: pre-labeling offline dan pre-labeling layanan online. Pre-labeling offline dilakukan dengan mengimpor data yang telah berisi hasil pre-labeling, sedangkan pre-labeling layanan online menggunakan API online untuk memberikan label awal secara otomatis pada data. Topik ini menjelaskan persyaratan format file untuk pre-labeling, pengaturan konfigurasi utama untuk pekerjaan pelabelan, serta contoh hasilnya.
Limitations
Saat ini, iTAG hanya mendukung pre-labeling untuk tugas klasifikasi, seperti image classification dan text classification.
Offline pre-labeling
Offline pre-labeling file format
Siapkan file manifest pre-labeling offline, seperti prelabel_offline.manifest, lalu gunakan file tersebut untuk membuat dataset OSS.
Setiap entri dalam file manifest harus mengikuti format berikut. File tersebut harus berisi bidang
sourcedan minimal satu bidang kustom yang menyimpan hasil pre-labeling. Anda dapat menambahkan beberapa bidang kustom.{ "data": { "label": "label_2", "source": "Alibaba Group celebrates its 10th anniversary and establishes Alibaba Cloud" } }Keterangan:
label: Hasil pre-labeling yang dihasilkan secara offline.source: Data asli.
Untuk persyaratan format lengkap berdasarkan jenis pelabelan, lihat Create a dataset for a labeling job. Jika file manifest tidak diformat dengan benar, hasil pre-labeling mungkin tidak ditampilkan dengan tepat.
Anda harus membuat dataset dari file manifest pre-labeling offline sebagai dataset OSS. Untuk informasi lebih lanjut, lihat Create and manage datasets.
Offline pre-labeling job configuration
Saat membuat pekerjaan pelabelan, konfigurasikan parameter berikut pada halaman wizard Intelligent Labeling Configurations.
Pada bagian Service Configurations, konfigurasikan parameter berikut.
Parameter
Description
Labeling Method
Pilih metode pelabelan:
Do Not Use: Menonaktifkan intelligent labeling.
Use Offline Prelabeling Result: Dataset yang diunggah sudah berisi hasil pre-labeling. iTAG menampilkan hasil tersebut agar pekerja dapat meninjaunya.
Online Service Prediction: Dataset yang diunggah tidak berisi hasil pre-labeling. iTAG memanggil layanan prediksi online untuk menghasilkan label awal pada dataset tersebut.
Mapping between Predicted Result and Topic
Memetakan kolom yang berisi hasil pre-labeling dalam file manifest Anda ke nama topik.
Untuk melabeli beberapa topik, klik + Add Mapping between Predicted Result and Topic untuk mengaitkan lebih banyak kolom hasil dengan nama topik.
Pada bagian Service Configuration, atur parameter Effective Process ke salah satu opsi berikut:
Prelabeling: Hasil pre-labeling hanya berlaku pada tahap pre-labeling. Pekerja tetap melakukan pelabelan formal, yaitu meninjau dan mengoreksi hasil pre-labeling tersebut.
Formal Labeling: Hasil pre-labeling langsung diterapkan pada tahap pelabelan formal. Pekerja dapat melewati pelabelan manual dan langsung melanjutkan ke tahap verifikasi atau penerimaan.
Offline pre-labeling: Result example
Halaman pelabelan menampilkan hasil pre-labeling untuk setiap pertanyaan.