Setelah membuat dataset untuk anotasi data, Anda dapat menggunakan iTAG untuk membuat pekerjaan pelabelan. Platform for AI (PAI) menyediakan templat umum guna mempermudah pembuatan pekerjaan pelabelan. Jika templat umum tidak sesuai dengan kebutuhan Anda, Anda dapat membuat templat kustom dengan menggabungkan komponen konten dan komponen topik sesuai skenario yang diinginkan. Topik ini menjelaskan cara membuat pekerjaan pelabelan menggunakan templat umum yang telah ditentukan sebelumnya.
Prasyarat
PAI telah diaktifkan dan ruang kerja telah dibuat.
Anda dapat menggunakan ruang kerja default atau membuat yang baru. Untuk informasi selengkapnya tentang pembuatan ruang kerja default, lihat Aktifkan PAI dan buat ruang kerja default. Untuk informasi selengkapnya tentang pembuatan ruang kerja lainnya, lihat Buat dan kelola ruang kerja.
Alibaba Cloud Object Storage Service (OSS) telah diaktifkan. File data yang akan dianotasi telah diunggah ke OSS dan dataset telah dibuat. Untuk informasi selengkapnya, lihat Buat dataset untuk anotasi data.
Batasan
Hanya administrator atau administrator pelabelan yang dapat melakukan operasi pelabelan. Jika akun Anda tidak memiliki izin yang diperlukan, hubungi administrator untuk memberikan izin administrator pelabelan kepada akun Anda. Untuk informasi selengkapnya, lihat Kelola anggota ruang kerja.
Prosedur
Buka halaman iTAG.
-
Masuk ke Konsol PAI.
-
Di panel navigasi sebelah kiri, klik Workspaces. Pada halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.
-
Di panel navigasi sebelah kiri, pilih .
-
Pada halaman iTAG, buka tab Jobs dan klik Create Task.
Pada halaman Create Labeling Job, konfigurasikan parameter utama yang dijelaskan dalam tabel berikut. Konfigurasikan parameter lainnya sesuai kebutuhan.
Parameter
Deskripsi
Task Name
Panjangnya harus antara 1 hingga 100 karakter. Harus dimulai dengan huruf kecil, huruf kapital, angka, atau karakter Tionghoa, serta boleh mencakup garis bawah (_) atau tanda hubung (-).
Input Dataset
Pilih dataset yang telah dibuat di manajemen dataset PAI.
Template Type
Mendukung tipe model berikut:
General Template: Templat yang telah ditentukan sebelumnya di platform.
Custom Template: Buat templat kustom untuk skenario spesifik Anda. Gabungkan Content Components dan Topic Components sesuai petunjuk di halaman.
Templat kustom cocok untuk skenario khusus. Untuk informasi selengkapnya tentang format data input dan output templat kustom, lihat Custom templates.
Template
Jika Anda menetapkan Template Type ke General Template, Anda dapat memilih jenis templat umum tertentu. Jenis berikut didukung:
Image
Untuk informasi selengkapnya tentang skenario aplikasi serta format data input dan output untuk jenis templat ini, lihat Image.
OCR: Melakukan Optical Character Recognition (OCR) pada teks dalam area yang dipilih dari gambar.
Object Detection: Menentukan lokasi objek tertentu dalam gambar.
Image Classification: Mengklasifikasikan gambar berdasarkan tag yang telah ditentukan.
PDF: Melakukan OCR dan klasifikasi tag pada file PDF.
Moderation and Matting: Melakukan moderasi dan matting pada gambar.
Table Recognition: Menggunakan algoritma untuk melakukan pra-pengenalan elemen inti dalam tabel. Anda dapat mengedit hasilnya sesuai kebutuhan.
Text
Untuk informasi selengkapnya tentang skenario aplikasi serta format data input dan output untuk jenis templat ini, lihat Text.
Entity Recognition: Mengenali entitas bernama dalam teks.
Text Classification: Mengklasifikasikan teks berdasarkan tag yang telah ditentukan. Klasifikasi satu tag maupun multi-tag didukung.
Entity relationship: Mengidentifikasi hubungan antar entitas teks untuk skenario graf pengetahuan.
Video
Untuk informasi selengkapnya tentang skenario aplikasi serta format data input dan output untuk jenis templat ini, lihat Video.
Video Classification: Mengklasifikasikan video berdasarkan tag yang telah ditentukan. Klasifikasi satu tag maupun multi-tag didukung.
Audio
Untuk informasi selengkapnya tentang skenario aplikasi serta format data input dan output untuk jenis templat ini, lihat Audio.
Audio Classification: Mengklasifikasikan file audio berdasarkan tag yang telah ditentukan. Klasifikasi satu tag maupun multi-tag didukung.
Audio segmentation: Memotong konten dataset audio dan menambahkan tag pada setiap segmen.
Audio Recognition: Mengenali dan mentranskripsikan teks dari konten audio.
OCR recognition results configuration
Parameter ini hanya tersedia ketika Anda menetapkan Template ke Image dan memilih OCR.
Secara default, OCR Recognition Results dipilih. Ini memungkinkan OCR dilakukan pada teks dalam area yang dipilih dari gambar.
Label Configuration
Masukkan nama tag yang perlu dikenali, dipilih, dan diterapkan oleh pelabel dalam tugas ini. Tekan tombol Enter setelah setiap nama tag untuk menambahkannya.
Sebagai contoh, untuk mengenali kucing dalam gambar, Anda dapat menambahkan tag seperti "Cat", "American Shorthair", dan "British Shorthair". Hal ini membantu pelabel memberi label pada sampel.
Anda juga dapat menentukan apakah pelabel dapat menerapkan satu atau beberapa tag pada objek yang dipilih dalam satu anotasi.
Jika hanya satu tag yang dapat diterapkan, atur opsi ke Single Choice.
Jika beberapa tag dapat diterapkan, atur opsi ke Multiple Choice.
Sebagai contoh, jika Anda mengatur opsi ke Multiple Choice untuk tugas pengenalan kucing, pelabel dapat memilih seekor kucing dalam sampel dan menerapkan kedua tag "Cat" dan "American Shorthair".
CatatanOpsi Single Choice dan Multiple Choice mengacu pada apakah satu atau beberapa tag dapat ditambahkan ke objek yang dipilih dalam satu waktu. Opsi ini tidak mengacu pada jumlah kali sampel dapat dipilih dan diberi label.
Enable Intelligent Labeling
Untuk informasi selengkapnya tentang konfigurasi, lihat Data pre-labeling: Intelligent labeling configurations.
Task Description
Deskripsi singkat tentang pekerjaan pelabelan untuk membedakannya dari pekerjaan lain.
Assign Subtask Packages
iTAG mengelompokkan semua tugas anotasi dalam dataset menjadi paket subtask berdasarkan aturan tertentu. Selama proses anotasi, pekerja dapat mengambil paket subtask tersebut untuk memproses semua tugas anotasi di dalamnya.
Aturan berikut didukung untuk mengalokasikan paket subtask:
Fixed size: Setiap paket subtask berisi jumlah tetap tugas anotasi.
Ketika Anda menetapkan ukuran tetap, hubungan antara ukuran dataset dan rentang tugas dalam paket subtask adalah sebagai berikut:
Jika dataset berisi 0 hingga 20.000 catatan data, ukuran paket subtask dapat berkisar antara 1 hingga 200.
Jika dataset berisi 20.000 hingga 100.000 catatan data, ukuran paket subtask dapat berkisar antara 5 hingga 200.
Jika dataset berisi 100.000 hingga 500.000 catatan data, ukuran paket subtask dapat berkisar antara 25 hingga 200.
Jika dataset berisi 500.000 hingga 1.000.000 catatan data, ukuran paket subtask dapat berkisar antara 50 hingga 200.
Press Import Fields: Paket subtask dibagi berdasarkan bidang yang dipilih dalam dataset. Data dengan nilai yang sama untuk bidang ini ditempatkan dalam paket subtask yang sama.
Targeted Assignment: Paket subtask ditugaskan kepada pelabel atau tim tertentu.
Check Proportion
Jika Task Workflow yang Anda pilih mencakup langkah pemeriksaan, seperti Marking-Check atau Marking-Inspection-Acceptance, Anda harus mengonfigurasi rasio sampling untuk proses pemeriksaan. Nilai default-nya adalah 100%.
User Configuration
Berdasarkan Task Workflow yang dipilih, konfigurasikan pelabel/grup, pemeriksa/grup, penerima/grup, atau administrator tugas/grup. Anda dapat berkolaborasi dengan beberapa anggota di ruang kerja untuk menyelesaikan tugas anotasi. Untuk informasi selengkapnya tentang izin peran di iTAG, lihat iTAG overview.
Setelah mengonfigurasi parameter, klik Create.
Lihat daftar tugas
Setelah membuat tugas anotasi, pemeriksaan, dan penerimaan, Anda dapat melihat daftar semua tugas saat ini di halaman Task Center di iTAG, tempat Anda dapat memeriksa status setiap tugas dan menggunakan opsi di kolom Actions untuk melihat detail paket subtask atau mengambil hasil pelabelan.

Area | Task | Description |
① | Process labeling tasks | Klik Go to the iTAG Page di pojok kanan atas untuk menuju halaman anotasi iTAG. Di halaman ini, Anda dapat mengklaim dan memproses task anotasi, pemeriksaan, serta penerimaan. Untuk informasi lebih lanjut, lihat Process labeling tasks. |
② | View task status | Anda dapat melihat status semua task di halaman Task Center. |
③ | Subtask package details | Untuk task yang belum selesai, klik Subtask Details untuk melihat status penyelesaian paket subtask. Untuk paket subtask yang belum selesai, Anda dapat mengklik Transfer untuk langsung mentransfernya ke orang lain. Anda juga dapat mengklik Release agar worker lain dapat mengklaim paket subtask tersebut. |
④ | Get labeling results View export progress | Untuk task yang telah selesai, klik Export Labeling Result dan ikuti petunjuk untuk mengekspor hasilnya. Klik Obtain Data Record untuk melihat progres dan hasil ekspor. Untuk informasi lebih lanjut, lihat Export labeling result data. |
⑤ | More operations | Klik ikon |
Langkah selanjutnya
Anda dapat mengambil dan memproses tugas anotasi. Untuk informasi selengkapnya, lihat Process labeling tasks.
pada kolom Actions dari suatu task untuk melakukan operasi seperti unpublish atau publish task tersebut.