iTAG memungkinkan Anda menggunakan konfigurasi pelabelan cerdas untuk melakukan pra-pelabelan data. Setelah menyelesaikan pra-pelabelan, Anda dapat melanjutkan dengan pelabelan formal berdasarkan hasil tersebut. Pada pelabelan formal, tugas Anda hanya memverifikasi dan memperbaiki hasil pra-pelabelan, sehingga meningkatkan efisiensi proses. iTAG mendukung pra-pelabelan offline dan online. Dalam pra-pelabelan offline, Anda harus mengunggah data dalam format yang sesuai untuk pemrosesan otomatis. Dalam pra-pelabelan online, sistem menggunakan Operasi API untuk mengotomatiskan proses. Topik ini menjelaskan format dataset pra-pelabelan offline, pertimbangan pembuatan pekerjaan pra-pelabelan, serta menyediakan contoh hasil pra-pelabelan.
Batasan
Pra-pelabelan di iTAG hanya mendukung skenario klasifikasi, seperti klasifikasi gambar atau klasifikasi teks.
Pra-pelabelan offline
Format dataset yang digunakan untuk pra-pelabelan offline
Siapkan file pra-pelabelan offline bernama prelabel_offline.manifest dan buat dataset di Bucket OSS dari file tersebut.
Blok kode berikut menunjukkan format dataset pra-pelabelan offline. Dataset harus mencakup bidang kustom dan bidang sumber. Anda dapat menentukan satu atau lebih bidang kustom dalam dataset.
{ "data": { "label": "label_2", "source": "Alibaba Group's 10th anniversary and the founding of Alibaba Cloud Computing" } }Parameter:
label: hasil pra-pelabelan yang dihasilkan secara offline.
source: data sumber.
Untuk informasi lebih lanjut tentang persyaratan format berbagai jenis file yang digunakan untuk pelabelan, lihat Buat Dataset untuk Pekerjaan Pelabelan. Jika dataset pra-pelabelan offline tidak memenuhi persyaratan format, hasil pra-pelabelan mungkin tidak ditampilkan dengan benar.
Untuk informasi lebih lanjut tentang cara membuat dataset di Bucket OSS dari file pra-pelabelan offline, lihat Buat dan Kelola Dataset.
Pertimbangan untuk membuat pekerjaan pra-pelabelan offline
Saat membuat pekerjaan pelabelan, Anda dapat mengonfigurasi parameter berikut di halaman panduan Intelligent Labeling Configurations.
Di bagian Service Configurations, Anda dapat mengonfigurasi parameter berikut.
Parameter
Deskripsi
Labeling Method
Opsi yang tersedia:
Do Not Use: Jika Anda memilih opsi ini, pelabelan cerdas tidak akan digunakan.
Use Offline Prelabeling Result: Jika dataset yang Anda unggah berisi hasil pra-pelabelan, Anda dapat memilih opsi ini untuk menampilkan hasil pra-pelabelan di konsol iTAG.
Online Service Prediction: Jika dataset yang Anda unggah tidak berisi hasil pra-pelabelan, Anda dapat memilih opsi ini untuk memanggil layanan prediksi online untuk memproses dataset. Hasil prediksi ditampilkan sebagai hasil pra-pelabelan di konsol iTAG.
Mapping between Predicted Result and Topic
Petakan kolom hasil pra-pelabelan dalam dataset pra-pelabelan offline ke topik. Dengan cara ini, Anda dapat menentukan hasil pra-pelabelan untuk topik yang berbeda.
Jika Anda ingin melabeli data untuk beberapa topik, klik Add Mapping between Predicted Result and Topic untuk menambahkan lebih banyak pemetaan.
Di bagian Service Configuration, Anda dapat memilih salah satu opsi berikut untuk Effective Process:
Prelabeling: Jika memilih opsi ini, hasil pra-pelabelan hanya berlaku di tahap pra-pelabelan. Pekerja harus memverifikasi dan memperbaiki hasil tersebut di tahap pelabelan formal.
Formal Labeling: Jika memilih opsi ini, hasil pra-pelabelan berlaku di tahap pelabelan formal. Pekerja tidak perlu melabeli ulang data dan dapat langsung melanjutkan ke tahap verifikasi atau penerimaan.
Contoh hasil pra-pelabelan offline
Hasil pra-pelabelan untuk topik berbeda ditampilkan di halaman hasil pelabelan, seperti yang ditunjukkan pada gambar berikut.