iTAG は、固有表現抽出 (NER) 、テキスト分類、エンティティ関係抽出のためのラベリングテンプレートを提供します。
サポートされているテンプレート
固有表現抽出
固有表現抽出 (NER) では、テキストの特定のスパンを選択してラベリングします。
-
利用シーン
製品説明やニュース記事における主要な用語の識別。
-
データ構造
-
入力データ
マニフェストファイルの各行は 1 つのデータ項目を表し、source フィールドが含まれています。
{"data":{"source":"Alibaba acquired Vendio and Auctiva, two e-commerce solution providers for small businesses in the United States. In the same month, the Mobile Taobao app was launched."}} ... -
出力データ
マニフェストファイルの各行には、ソースデータとラベリング結果が含まれています。
{ "data": { "source": "Alibaba acquired Vendio and Auctiva, two e-commerce solution providers for small businesses in the United States. In the same month, the Mobile Taobao app was launched." }, "label-1430082002522152960": { "results": [ { "objects": [ { "result": { "Text Content": [ "Label 1" ] }, "color": null, "id": null, "text": "Recognized text 1", "start": 49, "end": 51 }, { "result": { "Text Content": [ "Label 2", "Label 3" ] }, "color": null, "id": null, "text": "Recognized text 2", "start": 34, "end": 40 } ], "empty": false } ] } }
-
テキスト分類
テキスト分類は、テキストセグメントに 1 つ以上の事前定義されたラベルを割り当てます。このテンプレートは、シングルラベル分類とマルチラベル分類の両方をサポートしています。
-
利用シーン
ニュースの推薦、ナレッジ管理、迷惑メールフィルタリング。
-
データ構造
-
入力データ
マニフェストファイルの各行は 1 つのデータ項目を表し、source フィールドが含まれています。
{"data":{"source":"Alibaba changed the name of its Chinese trading market to \"1688\". In the same month, Taobao launched the group-buying website Juhuasuan."}} ... -
出力データ
マニフェストファイルの各行には、ソースデータとラベリング結果が含まれています。
{ "data": { "source": "Alibaba changed the name of its Chinese trading market to \"1688\". In the same month, Taobao launched the group-buying website Juhuasuan." }, "label-1432989439570944000": { "results": [ { "questionId": "2", "data": [ "Label 2", "Label 1" ], "markTitle": "Multiple-choice", "type": "survey/multivalue" } ] } }
-
エンティティ関係
エンティティ関係のラベリングは、三つ組抽出とも呼ばれ、エンティティ間の関係をラベリングして知識グラフを構築します。
-
利用シーン
知識グラフの構築。
-
データ構造
-
入力データ
マニフェストファイルの各行は 1 つのデータ項目を表し、source フィールドが含まれています。
{"data":{"source":"Alibaba changed the name of its Chinese trading market to \"1688\". In the same month, Taobao launched the group-buying website Juhuasuan."}} ... -
出力データ
マニフェストファイルの各行には、ソースデータとラベリング結果が含まれています。
{ "data": { "source": "Alibaba changed the name of its Chinese trading market to \"1688\". In the same month, Taobao launched the group-buying website Juhuasuan." }, "label-1435488346167255040": { "results": [ { "objects": [ { "result": { "Multiple-choice": [ "Label 3" ] }, "color": null, "id": null, "text": "group-buying website", "start": 32, "end": 35 }, { "result": { "Multiple-choice": [ "Label 2" ] }, "color": null, "id": null, "text": "1688", "start": 18, "end": 21 }, { "result": { "Multiple-choice": [ "Label 1" ] }, "color": null, "id": null, "text": "trading market", "start": 9, "end": 12 } ], "empty": false }, [ { "result": { "Single-choice": "Label 4" }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "trading market" }, "to": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" } }, { "result": { "Single-choice": "Label 6" }, "from": { "x": -225, "y": -126, "start": 9, "end": 12, "text": "trading market" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "group-buying website" } }, { "result": { "Single-choice": "Label 4" }, "from": { "x": -233, "y": 75, "start": 18, "end": 21, "text": "1688" }, "to": { "x": 24, "y": -93, "start": 32, "end": 35, "text": "group-buying website" } } ] ] } }
-