iTAG は、インテリジェントラベリング設定によるデータのプレラベリングをサポートしています。その後、プレラベリングの結果に基づいて本番ラベリングを実行できます。本番ラベリングでは、結果を検証・修正するだけで済むため、ラベリング効率が大幅に向上します。iTAG は、オフラインプレラベリングとオンラインサービスプレラベリングの 2 つのプレラベリング方法をサポートしています。オフラインプレラベリングでは、プレラベリング結果がすでに含まれているデータをインポートします。オンラインサービスプレラベリングでは、オンライン API サービスを使用してデータを自動的にプレラベリングします。このトピックでは、プレラベリングのファイル形式の要件、ラベリングタスクの主要な設定、および結果の例について説明します。
制限事項
現在、iTAG は画像分類やテキスト分類などの分類タスクのプレラベリングのみをサポートしています。
オフラインプレラベリング
オフラインプレラベリングのファイル形式
prelabel_offline.manifest のようなオフラインプレラベリングのマニフェストファイルを準備し、それを使用して OSS データセットを作成します。
マニフェストファイルの各エントリは、次のフォーマットである必要があります。
sourceフィールドと、プレラベリング結果を保持する少なくとも 1 つのカスタムフィールドを含める必要があります。複数のカスタムフィールドを追加できます。{ "data": { "label": "label_2", "source": "Alibaba Group celebrates its 10th anniversary and establishes Alibaba Cloud" } }ここで:
label:オフラインで生成されたプレラベリング結果。source:元のデータ。
さまざまなラベリングタイプに関する詳細なフォーマット要件については、「ラベリングタスク用のデータセットの作成」をご参照ください。マニフェストファイルのフォーマットが正しくない場合、プレラベリング結果が正しく表示されないことがあります。
オフラインプレラベリングのマニフェストファイルから OSS データセットとしてデータセットを作成する必要があります。詳細については、「データセットの作成と管理」をご参照ください。
オフラインプレラベリングタスクの設定
ラベリングタスクを作成する際に、Intelligent Labeling Configurations ウィザードページで次のパラメーターを設定します。
Service Configurations セクションで、次のパラメーターを設定します。
パラメーター
説明
Labeling Method
ラベリングメソッドを選択します:
Do Not Use:インテリジェントラベリングを無効にします。
Use Offline Prelabeling Result:アップロードされたデータセットには、すでに事前ラベリング結果が含まれています。 iTAG はワーカーがレビューするためにこれらの結果を表示します。
Online Service Prediction:アップロードされたデータセットには、事前ラベリング結果が含まれていません。 iTAG はオンライン予測サービスを呼び出して、データセットの事前ラベリング結果を生成します。
Mapping between Predicted Result and Topic
マニフェストファイル内の事前ラベリング結果を含む列をトピック名にマッピングします。
複数のトピックをラベリングするには、+ Add Mapping between Predicted Result and Topic をクリックして、より多くの結果列をトピック名に関連付けます。
Service Configuration セクションで、Effective Process パラメーターを次のいずれかのオプションに設定します。
Prelabeling:プレラベリングの結果は、プレラベリング段階にのみ適用されます。ワーカーは、これらのプレラベリング結果のレビューと修正を含む本番ラベリングを通常どおり実行します。
Formal Labeling:プレラベリングの結果は、本番ラベリング段階に直接適用されます。ワーカーは手動でのラベリングをスキップし、直接検証または受け入れ段階に進むことができます。
オフラインプレラベリング:結果の例
ラベリングページには、各質問に対するプレラベリング結果が表示されます。