すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:LVM-イメージ-テキストマッチングフィルター (DLC)

最終更新日:Nov 13, 2024

LVM-Image-Text-Matching Filter (DLC) コンポーネントは、テキスト-画像マッチングスコアが低すぎる画像のデータをフィルタリングするために使用されます。

サポートされるコンピューティングリソース

ディープラーニングコンテナ (DLC)

アルゴリズム

LVM-Image-Text-Matching Filter (DLC) コンポーネントは、画像の記述テキストをトレーニングデータ内の記述テキストと比較し、blip-itm-base-cocoに基づいて画像のマッチングスコアを計算します。 このように、コンポーネントは、画像の品質を保証するために、過度に低いテキスト画像マッチングスコアを有する画像のデータをフィルタリングする。 トレーニングデータの説明テキストは、トレーニングデータファイルの <__ dj__video> フィールドに続く内容です。 ほとんどの場合、コンポーネントは、画像生成モデルの後続のトレーニングに使用されます。

入力はJSONLファイルです。 <__dj_image> フィールドは記述テキストの開始マーカーであり、<|__dj_eoc |> フィールドは記述テキストの終了マーカーである。

image

  • imagesフィールドは、イメージのOSSパスです。

  • テキストフィールドは説明テキストです。

入力と出力

入力ポート

  • ファイルデータの読み取りコンポーネントは、トレーニングデータが保存されているOSSパスを読み取るために使用されます。

  • Image Data OSS Pathパラメーターを設定して、トレーニングデータファイルを選択できます。

トレーニングデータファイルの詳細については、「アルゴリズム」をご参照ください。

出力ポート

フィルタリングの結果。 詳細については、次のセクションのパラメーターの説明をご参照ください。

コンポーネントの設定

Machine Learning DesignerでLVM-Image-Text-Matching Filter (DLC) コンポーネントのパラメーターを設定できます。 下表に、各パラメーターを説明します。

タブ

パラメーター

必須

説明

デフォルト値

フィールド設定

イメージデータOSSパス

選択可能

トレーニングデータファイル。 詳細については、「アルゴリズム」をご参照ください。

デフォルト値なし

出力ファイルOSSパス

必須

フィルタリング結果が保存されるOSSディレクトリ。 結果には次のファイルが含まれます。

  • {name}.jsonl: 出力ファイル。 [Output Filename] パラメーターを設定して、出力ファイルを指定できます。

  • {name}_stats.jsonl: 状態ファイル。

  • dj_run_yaml.yaml: アルゴリズムの実行時に使用されるパラメーター設定ファイル。

デフォルト値なし

出力ファイル名

必須

フィルタリング結果のファイル名。

result.jsonl

Parameter Settings

最小テキスト-フレームマッチングスコア

必須

テキストと画像の最小マッチングスコア。

0.1

最大テキスト-フレームマッチングスコア

必須

テキストと画像の最大マッチングスコア。 ほとんどの場合、このパラメーターを1に設定します。

1

実行チューニング

リソースグループの選択

パブリックリソースグループ

選択可能

使用するインスタンスタイプ (CPUまたはGPU) と仮想プライベートクラウド (VPC) 。 アルゴリズムのGPUインスタンスタイプを選択する必要があります。

デフォルト値なし

専用リソースグループ

選択可能

使用するCPUコア、メモリ、共有メモリの数、およびGPUの数。

デフォルト値なし

最大実行時間 (秒)

選択可能

コンポーネントを実行できる最大期間。 指定した時間を超えた場合は, ジョブを終了します。

デフォルト値なし