iTAG dari Platform for AI (PAI) menyediakan template pelabelan untuk Pengenalan Entitas Bernama (NER), klasifikasi teks, dan analisis hubungan untuk entitas bernama. Saat membuat pekerjaan pelabelan teks, Anda dapat memilih template berdasarkan skenario bisnis Anda. Topik ini menjelaskan skenario penggunaan template pelabelan teks serta struktur data input dan output untuk masing-masing template.
Informasi latar belakang
iTAG menyediakan template pelabelan teks yang mendukung fitur-fitur berikut:
NER
NER digunakan untuk menyeret kotak seleksi di atas entitas bernama dan memberi label pada entitas tersebut.
Skenario
Template pelabelan ini cocok untuk skenario seperti pengenalan kata kunci untuk nama produk dan konten berita.
Struktur Data
Data Input
Setiap baris dalam file .manifest data input berisi sebuah objek. Setiap baris harus memiliki bidang source.
{"data":{"source":"Alibaba Group acquired Vendio and Auctiva, two e-commerce platforms that serve American small enterprises. In the same month, Alibaba Group launched mobile apps for Taobao."}} ...Data Output
Setiap baris dalam file .manifest data output berisi sebuah objek beserta hasil pelabelannya. Kode berikut menunjukkan contoh string JSON di setiap baris:
{ "data": { "source": "Alibaba Group acquired Vendio and Auctiva, two e-commerce platforms that serve American small enterprises. In the same month, Alibaba Group launched mobile apps for Taobao." }, "label-1430082002522152960": { "results": [ { "objects": [ { "result": { "Text content": [ "Label 1" ] }, "color": null, "id": null, "text": "Optical character recognition (OCR) result 1", "start": 49, "end": 51 }, { "result": { "Text content": [ "Label 2", "Label 3" ] }, "color": null, "id": null, "text": "OCR result 2", "start": 34, "end": 40 } ], "empty": false } ] } }
Klasifikasi teks
Klasifikasi teks digunakan untuk menemukan satu atau lebih label yang sesuai dengan teks input dari sekumpulan label dan menambahkan label-label tersebut ke teks. Template ini mendukung klasifikasi teks dengan satu label maupun multi-label.
Skenario
Template pelabelan ini cocok untuk skenario seperti rekomendasi berita, manajemen pengetahuan, dan penyaringan konten sampah.
Struktur Data
Data Input
Setiap baris dalam file .manifest data input berisi sebuah objek. Setiap baris harus memiliki bidang source.
{"data":{"source":"Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan."}} ...Data Output
Setiap baris dalam file .manifest data output berisi sebuah objek beserta hasil pelabelannya. Kode berikut menunjukkan contoh string JSON di setiap baris:
{ "data": { "source": "Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan." }, "label-1432989439570944000": { "results": [ { "questionId": "2", "data": [ "Label 2", "Label 1" ], "markTitle": "Multiple-choice", "type": "survey/multivalue" } ] } }
Analisis hubungan untuk entitas bernama
Analisis hubungan untuk entitas bernama digunakan untuk memberi label pada hubungan antara entitas bernama. Template ini cocok untuk skenario di mana triple dan grafik pengetahuan digunakan untuk menyusun informasi.
Skenario
Template pelabelan ini cocok untuk skenario seperti grafik pengetahuan.
Struktur Data
Data Input
Setiap baris dalam file .manifest data input berisi sebuah objek. Setiap baris harus memiliki bidang source.
{"data":{"source":"Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan."}} ...Data Output
Setiap baris dalam file .manifest data output berisi sebuah objek beserta hasil pelabelannya. Kode berikut menunjukkan contoh string JSON di setiap baris:
{ "data": { "source": "Alibaba Group changed the name of its platform that serves Chinese businesses to 1688. In the same month, Alibaba Group launched a group buying website called Juhuasuan." }, "label-1435488346167255040": { "results": [ { "objects": [ { "result": { "Multiple-choice": [ "Label 3" ] }, "color": null, "id": null, "text": "Group buying website", "start": 32, "end": 35 }, { "result": { "Multiple-choice": [ "Label 2" ] }, "color": null, "id": null, "text": "1688", "start": 18, "end": 21 }, { "result": { "Multiple-choice": [ "Label 1" ] }, "color": null, "id": null, "text": "Businesses", "start": 9, "end": 12 } ], "empty": false }, [ { "result": { "Single-choice": "Label 4" }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "Businesses" }, "to": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" } }, { "result": { "Single-choice": "Label 6" }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "Businesses" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "Group buying website" } }, { "result": { "Single-choice": "Label 4" }, "from": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "Group buying website" } } ] ] } }