iTAG では、インテリジェントラベリング構成を使用して、データの事前ラベリングを実行できます。データの事前ラベリングが完了した後、その結果に基づいて正式なデータラベリングを実行できます。正式なデータラベリングでは、事前ラベリングの結果を検証・修正するだけで済みます。これにより、ラベリング効率が向上します。iTAG は、オフライン事前ラベリングとオンライン事前ラベリングをサポートしています。オフライン事前ラベリングでは、自動事前ラベリングのために許容されるフォーマットでデータをアップロードする必要があります。オンライン事前ラベリングでは、システムが API 操作を使用してデータの事前ラベリングを自動化します。このトピックでは、オフライン事前ラベリングデータセットのフォーマット、事前ラベリングタスクを作成する際の注意事項について説明し、事前ラベリング結果の例も示します。
制限事項
iTAG の事前ラベリングは、画像またはテキスト分類などの分類シナリオのみをサポートします。
オフライン事前ラベリング
オフライン事前ラベリングに使用されるデータセットのフォーマット
prelabel_offline.manifest という名前のオフライン事前ラベリングファイルを準備し、そのファイルから Object Storage Service (OSS) バケットにデータセットを作成します。
次のコードブロックは、オフライン事前ラベリングデータセットのフォーマットを示しています。データセットには、カスタムフィールドとソースフィールドを含める必要があります。オフライン事前ラベリングデータセットでは、1 つ以上のカスタムフィールドを指定できます。
{ "data": { "label": "label_2", "source": "Alibaba Group's 10th anniversary and the founding of Alibaba Cloud Computing" } }パラメーター:
label:オフラインで生成された事前ラベリング結果。
source:ソースデータ。
ラベリングに使用されるさまざまな種類のファイルのフォーマット要件の詳細については、「ラベリングタスクのデータセットの作成」をご参照ください。オフライン事前ラベリングデータセットがフォーマット要件を満たしていない場合、事前ラベリング結果が正常に表示されないことがあります。
オフライン事前ラベリングファイルから OSS バケットにデータセットを作成する方法の詳細については、「データセットの作成と管理」をご参照ください。
オフライン事前ラベリングタスク作成時の注意事項
ラベリングタスクを作成する際、[インテリジェントラベリング構成] ウィザードページで次のパラメーターを構成できます。
[サービス構成] セクションでは、次のパラメーターを構成できます。
パラメーター
説明
ラベリング方法
利用可能なオプション:
[使用しない]:このオプションを選択すると、インテリジェントラベリングは使用されません。
[オフライン事前ラベリング結果を使用]:アップロードしたデータセットに事前ラベリング結果が含まれている場合、このオプションを選択すると、iTAG コンソールに事前ラベリング結果が表示されます。
[オンラインサービス予測]:アップロードしたデータセットに事前ラベリング結果が含まれていない場合、このオプションを選択すると、オンライン予測サービスを呼び出してデータセットを処理します。予測結果は、iTAG コンソールに事前ラベリング結果として表示されます。
[予測結果とトピックのマッピング]
オフライン事前ラベリングデータセットの事前ラベリング結果列をトピックにマッピングします。これにより、さまざまなトピックの事前ラベリング結果を指定できます。
複数のトピックのデータをラベリングする場合は、[予測結果とトピックのマッピングを追加] をクリックしてマッピングを追加します。
[サービス構成] セクションでは、[有効なプロセス] に次のいずれかのオプションを選択できます:
[事前ラベリング]:このオプションを選択すると、事前ラベリング結果は事前ラベリング段階でのみ有効になります。ワーカーは、正式なデータラベリング段階で事前ラベリング結果を検証および修正する必要があります。
[正式なラベリング]:このオプションを選択すると、事前ラベリング結果は正式なデータラベリング段階で有効になります。ワーカーは、正式なデータラベリング段階でデータをラベリングする必要はありません。検証または驗収段階に進むことができます。
オフライン事前ラベリング結果の例
さまざまなトピックの事前ラベリング結果は、次の図に示すように、ラベリング結果ページに表示されます。