Setelah membuat dataset, gunakan iTAG untuk memulai pekerjaan pelabelan. PAI menyediakan templat umum untuk tujuan ini. Jika templat tersebut tidak memenuhi kebutuhan Anda, Anda dapat membuat templat kustom dengan menggabungkan komponen konten dan komponen topik. Topik ini menjelaskan cara membuat pekerjaan pelabelan menggunakan templat umum yang telah disediakan.
Prasyarat
-
Anda telah mengaktifkan PAI dan membuat ruang kerja.
Anda dapat menggunakan ruang kerja default atau membuat yang baru sesuai rencana bisnis Anda. Untuk informasi selengkapnya tentang cara membuat ruang kerja default, lihat Aktifkan PAI dan buat ruang kerja default. Untuk informasi selengkapnya tentang cara membuat ruang kerja lainnya, lihat Buat dan kelola ruang kerja.
-
Anda telah mengaktifkan Alibaba Cloud OSS, mengunggah file data yang akan dilabeli ke OSS, dan membuat dataset. Untuk informasi selengkapnya, lihat Buat dataset untuk pelabelan data.
Batasan
Hanya administrator atau administrator anotasi yang dapat melakukan operasi pelabelan. Jika Anda tidak memiliki izin yang diperlukan, mintalah administrator untuk memberikannya kepada Anda. Untuk informasi selengkapnya, lihat Kelola anggota ruang kerja.
Prosedur
-
Buka halaman iTAG.
-
Masuk ke PAI console.
-
Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.
-
Di panel navigasi sebelah kiri, pilih .
-
-
Di halaman iTAG, pada tab Jobs, klik Create Task.
-
Di halaman Create Labeling Job, konfigurasikan parameter utama seperti yang ditunjukkan dalam tabel berikut. Konfigurasikan parameter lain sesuai kebutuhan.
Parameter
Deskripsi
Task Name
Nama harus terdiri dari 1 hingga 100 karakter. Nama harus dimulai dengan huruf, angka, atau karakter Tionghoa, dan boleh mengandung garis bawah (_) atau tanda hubung (-).
Input Dataset
Pilih dataset yang dibuat di PAI.
Template type
iTAG mendukung jenis templat berikut:
-
General Template: Templat preset yang disediakan oleh platform.
-
Custom Template: Buat templat kustom untuk skenario tertentu dengan menggabungkan Content Components dan Topic Components berdasarkan petunjuk di layar.
Templat kustom cocok untuk skenario khusus. Untuk informasi selengkapnya tentang format data input dan output templat kustom, lihat Custom templates.
Template
Saat Template Type diatur ke General Template, pilih salah satu templat berikut:
-
Image
Untuk informasi selengkapnya tentang kasus penggunaan dan format data untuk jenis templat ini, lihat Image.
-
OCR: Mengenali teks dalam area yang dipilih pada gambar.
-
Object Detection: Mendeteksi dan menentukan lokasi objek tertentu dalam gambar.
-
Image Classification: Mengklasifikasikan gambar berdasarkan label preset.
-
PDF: Melakukan OCR dan klasifikasi label pada file PDF.
-
Moderation and Matting: Melakukan moderasi dan matting pada gambar.
-
Table Recognition: Menggunakan algoritma untuk mengenali elemen kunci dalam tabel secara awal. Anda dapat mengedit hasilnya sesuai kebutuhan.
-
-
Text
Untuk informasi selengkapnya tentang kasus penggunaan dan format data untuk jenis templat ini, lihat Text.
-
Entity Recognition: Menetapkan hubungan antar entitas teks.
-
Text Classification: Mengklasifikasikan teks berdasarkan label preset. Templat ini mendukung klasifikasi label tunggal dan multi-label.
-
Entity relationship: Menentukan hubungan antar entitas teks untuk skenario graf pengetahuan.
-
-
Video
Untuk informasi selengkapnya tentang kasus penggunaan dan format data untuk jenis templat ini, lihat Video.
-
Video Classification: Mengklasifikasikan video berdasarkan label preset. Templat ini mendukung klasifikasi label tunggal dan multi-label.
-
-
Audio
Untuk informasi selengkapnya tentang kasus penggunaan dan format data untuk jenis templat ini, lihat Audio.
-
Audio Classification: Mengklasifikasikan audio berdasarkan label preset. Templat ini mendukung klasifikasi label tunggal dan multi-label.
-
Audio segmentation: Memotong konten dataset audio dan menambahkan label ke segmen-segmennya.
-
Audio Recognition: Mentranskripsikan teks dari konten audio.
-
OCR recognition results configuration
Parameter ini hanya tersedia saat Anda mengatur Template ke Image > OCR.
Secara default, OCR Recognition Results dipilih, yang menunjukkan bahwa OCR dilakukan pada teks dalam area yang dipilih pada gambar.
Label Configuration
Masukkan nama-nama label untuk pekerjaan ini. Tekan tombol Enter setelah memasukkan setiap nama label.
Sebagai contoh, untuk mengidentifikasi kucing dalam gambar, Anda dapat menambahkan label seperti "Cat", "American Shorthair", dan "British Shorthair". Hal ini membantu pelabel menerapkan label pada sampel.
Anda juga dapat menentukan apakah satu pilihan dapat memiliki satu atau beberapa label.
-
Jika hanya satu label yang dapat diterapkan pada suatu pilihan, atur opsi ini untuk label tersebut ke Single Choice.
-
Jika beberapa label dapat diterapkan pada suatu pilihan, atur opsi ini untuk label tersebut ke Multiple Choice.
Sebagai contoh, saat mengidentifikasi kucing dalam gambar, jika mode pemilihan label diatur ke Multiple Choice, pelabel dapat memilih seekor kucing dalam sampel dan menerapkan label "Cat" dan "American Shorthair" sekaligus.
CatatanOpsi Single Choice dan Multiple Choice menentukan jumlah label yang dapat diterapkan pada satu pilihan dalam sampel, bukan jumlah pilihan yang dapat dibuat pada sampel tersebut.
Enable Intelligent Labeling
Untuk detail konfigurasi, lihat Data pre-labeling: Intelligent labeling configurations.
Task Description
Deskripsi singkat tentang pekerjaan pelabelan untuk membedakannya dari pekerjaan lain.
Assign Subtask Packages
iTAG mengumpulkan semua tugas pelabelan dari dataset ke dalam paket subtugas berdasarkan aturan tertentu. Selama proses pelabelan, anggota tim dapat mengklaim paket-paket ini untuk mengerjakan tugas di dalamnya.
Aturan berikut didukung untuk mengalokasikan paket subtugas:
-
Fixed size: Setiap paket subtugas berisi jumlah tetap tugas pelabelan.
Saat Anda memilih opsi ini, rentang yang diizinkan untuk jumlah tugas dalam paket subtugas bergantung pada ukuran dataset:
-
Jika dataset berisi 0 hingga 20.000 item, ukuran paket subtugas dapat berkisar antara 1 hingga 200.
-
Jika dataset berisi 20.000 hingga 100.000 item, ukuran paket subtugas dapat berkisar antara 5 hingga 200.
-
Jika dataset berisi 100.000 hingga 500.000 item, ukuran paket subtugas dapat berkisar antara 25 hingga 200.
-
Jika dataset berisi 500.000 hingga 1.000.000 item, ukuran paket subtugas dapat berkisar antara 50 hingga 200.
-
-
Press Import Fields: Mengelompokkan data ke dalam paket subtugas berdasarkan bidang yang dipilih dalam dataset. Semua item dengan nilai bidang yang sama ditempatkan dalam satu paket.
-
Targeted Assignment: Menetapkan paket subtugas kepada pelabel atau tim tertentu.
Check Proportion
Jika Task Workflow yang Anda pilih mencakup langkah pemeriksaan, seperti Marking-Check atau Marking-Inspection-Acceptance, Anda harus mengonfigurasi rasio sampling untuk proses pemeriksaan. Nilai default adalah 100%.
User Configuration
Bergantung pada Task Workflow yang dipilih, tetapkan anggota atau kelompok yang sesuai ke peran seperti pelabel, pemeriksa, penerima, atau administrator tugas. Anda dapat berkolaborasi dengan beberapa anggota ruang kerja untuk menyelesaikan pekerjaan pelabelan. Untuk informasi selengkapnya tentang izin peran di iTAG, lihat iTAG overview.
-
-
Setelah mengonfigurasi parameter, klik Create.
Lihat dan kelola pekerjaan pelabelan
Setelah dibuat, semua pekerjaan pelabelan, pemeriksaan, dan penerimaan tercantum di halaman Task Center di iTAG. Di sini, Anda dapat memeriksa status pekerjaan dan menggunakan kolom Actions untuk melihat detail paket subtugas, mengekspor hasil pelabelan, atau melakukan operasi lainnya.

|
Area |
Task |
Description |
|
① |
Process labeling tasks |
Klik Go to the iTAG Page di pojok kanan atas untuk menuju halaman pelabelan iTAG. Anda dapat mengklaim dan memproses task pelabelan, pemeriksaan, serta penerimaan yang tertunda. Untuk informasi selengkapnya, lihat Process labeling tasks. |
|
② |
View the job status |
Anda dapat melihat status semua job pada halaman Task Center. |
|
③ |
Subtask package details |
Untuk job yang belum selesai, Anda dapat mengklik Subtask Details untuk melihat status penyelesaian paket subtask-nya. Untuk paket subtask yang belum selesai, klik Transfer untuk menugaskannya ke pengguna lain, atau klik Release agar tersedia untuk diklaim siapa saja. |
|
④ |
Export labeling result View export progress |
Untuk job yang telah selesai, Anda dapat mengklik Export Labeling Result dan ikuti petunjuk di layar untuk mengekspor hasil pelabelan. Klik Obtain Data Record untuk melihat progres dan hasil ekspor. Untuk informasi selengkapnya, lihat Export labeling result data. |
|
⑤ |
More operations |
Klik ikon More ( |
Langkah selanjutnya
Anda dapat mengklaim pekerjaan pelabelan dan memprosesnya. Untuk informasi selengkapnya, lihat Process labeling tasks.
) di kolom Actions suatu job untuk melakukan operasi management, seperti menjadikannya offline atau online kembali.