すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:LVM-イメージ-テキスト-類似度フィルター (DLC)

最終更新日:Nov 13, 2024

LVM-Image-Text-Similarity Filter (DLC) コンポーネントは、テキストと画像の類似性が低すぎる画像のデータをフィルタリングするために使用されます。

サポートされるコンピューティングリソース

ディープラーニングコンテナ (DLC)

アルゴリズム

LVM − Image − Text − Similarity Filter (DLC) コンポーネントは、clip − vit − base − patch32に基づいて、画像の記述テキストとトレーニングデータ内の記述テキストとの間の類似性を計算します。 このように、コンポーネントは、過度に低いテキスト画像類似度を有する画像のデータをフィルタリングして、画像の品質を保証する。 トレーニングデータの説明テキストは、トレーニングデータファイルの <__ dj__video> フィールドに続く内容です。 ほとんどの場合、コンポーネントは、画像生成モデルの後続のトレーニングに使用されます。

入力はJSONLファイルです。 <__dj_image> フィールドは記述テキストの開始マーカーであり、<|__dj_eoc |> フィールドは記述テキストの終了マーカーである。

image

  • imagesフィールドは、イメージのOSSパスです。

  • テキストフィールドは説明テキストです。

入力と出力

入力ポート

  • ファイルデータの読み取りコンポーネントは、トレーニングデータが保存されているOSSパスを読み取るために使用されます。

  • Image Data OSS Pathパラメーターを設定して、トレーニングデータファイルを選択できます。

トレーニングデータファイルの詳細については、「アルゴリズム」をご参照ください。

出力ポート

フィルタリングの結果。 詳細については、次のセクションのパラメーターの説明をご参照ください。

コンポーネントの設定

Machine Learning DesignerでLVM-Image-Text-Similarity Filter (DLC) コンポーネントのパラメーターを設定できます。 下表に、各パラメーターを説明します。

タブ

パラメーター

必須

説明

デフォルト値

フィールド設定

イメージデータOSSパス

選択可能

トレーニングデータファイル。 詳細については、「アルゴリズム」をご参照ください。

デフォルト値なし

出力ファイルOSSパス

必須

フィルタリング結果が保存されるOSSディレクトリ。 結果には次のファイルが含まれます。

  • {name}.jsonl: 出力ファイル。 [Output Filename] パラメーターを設定して、出力ファイルを指定できます。

  • {name}_stats.jsonl: 状態ファイル。

  • dj_run_yaml.yaml: アルゴリズムの実行時に使用されるパラメーター設定ファイル。

デフォルト値なし

出力ファイル名

必須

フィルタリング結果のファイル名。

result.jsonl

Parameter Settings

最小テキストフレーム類似性スコア

必須

テキストと画像の最小の類似性。

0.1

最大テキストフレーム類似スコア

必須

テキストと画像の最大の類似性。 ほとんどの場合、このパラメーターを1に設定します。

1

実行チューニング

リソースグループの選択

パブリックリソースグループ

選択可能

使用するインスタンスタイプ (CPUまたはGPU) と仮想プライベートクラウド (VPC) 。 アルゴリズムのGPUインスタンスタイプを選択する必要があります。

デフォルト値なし

専用リソースグループ

選択可能

使用するCPUコア、メモリ、共有メモリの数、およびGPUの数。

デフォルト値なし

最大実行時間 (秒)

選択可能

コンポーネントを実行できる最大期間。 指定した時間を超えた場合は, ジョブを終了します。

デフォルト値なし