LVM-Image-Text-Matching Filter (DLC) コンポーネントは、テキスト-画像マッチングスコアが低すぎる画像のデータをフィルタリングするために使用されます。
サポートされるコンピューティングリソース
アルゴリズム
LVM-Image-Text-Matching Filter (DLC) コンポーネントは、画像の記述テキストをトレーニングデータ内の記述テキストと比較し、blip-itm-base-cocoに基づいて画像のマッチングスコアを計算します。 このように、コンポーネントは、画像の品質を保証するために、過度に低いテキスト画像マッチングスコアを有する画像のデータをフィルタリングする。 トレーニングデータの説明テキストは、トレーニングデータファイルの <__ dj__video> フィールドに続く内容です。 ほとんどの場合、コンポーネントは、画像生成モデルの後続のトレーニングに使用されます。
入力はJSONLファイルです。 <__dj_image> フィールドは記述テキストの開始マーカーであり、<|__dj_eoc |> フィールドは記述テキストの終了マーカーである。

imagesフィールドは、イメージのOSSパスです。
テキストフィールドは説明テキストです。
入力と出力
入力ポート
ファイルデータの読み取りコンポーネントは、トレーニングデータが保存されているOSSパスを読み取るために使用されます。
Image Data OSS Pathパラメーターを設定して、トレーニングデータファイルを選択できます。
トレーニングデータファイルの詳細については、「アルゴリズム」をご参照ください。
出力ポート
フィルタリングの結果。 詳細については、次のセクションのパラメーターの説明をご参照ください。
コンポーネントの設定
Machine Learning DesignerでLVM-Image-Text-Matching Filter (DLC) コンポーネントのパラメーターを設定できます。 下表に、各パラメーターを説明します。
タブ | パラメーター | 必須 | 説明 | デフォルト値 | |
フィールド設定 | イメージデータOSSパス | 選択可能 | トレーニングデータファイル。 詳細については、「アルゴリズム」をご参照ください。 | デフォルト値なし | |
出力ファイルOSSパス | 必須 | フィルタリング結果が保存されるOSSディレクトリ。 結果には次のファイルが含まれます。
| デフォルト値なし | ||
出力ファイル名 | 必須 | フィルタリング結果のファイル名。 | result.jsonl | ||
Parameter Settings | 最小テキスト-フレームマッチングスコア | 必須 | テキストと画像の最小マッチングスコア。 | 0.1 | |
最大テキスト-フレームマッチングスコア | 必須 | テキストと画像の最大マッチングスコア。 ほとんどの場合、このパラメーターを1に設定します。 | 1 | ||
実行チューニング | リソースグループの選択 | パブリックリソースグループ | 選択可能 | 使用するインスタンスタイプ (CPUまたはGPU) と仮想プライベートクラウド (VPC) 。 アルゴリズムのGPUインスタンスタイプを選択する必要があります。 | デフォルト値なし |
専用リソースグループ | 選択可能 | 使用するCPUコア、メモリ、共有メモリの数、およびGPUの数。 | デフォルト値なし | ||
最大実行時間 (秒) | 選択可能 | コンポーネントを実行できる最大期間。 指定した時間を超えた場合は, ジョブを終了します。 | デフォルト値なし | ||