すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:LVM-テキスト-フレーム-類似度フィルタ (DLC)

最終更新日:Nov 13, 2024

Platform for AI (PAI) のLVM-Text-Frame-Similarity Filter (DLC) コンポーネントは、類似性の低いビデオのデータをフィルタリングするために使用されます。 MP4ビデオのみを処理できます。

サポートされるコンピューティングリソース

ディープラーニングコンテナ (DLC)

アルゴリズム

LVM-Text-Frame-Similarity Filter (DLC) コンポーネントは、サンプリングされたビデオフレームの記述とトレーニングデータ内の記述テキストとの間の類似性を計算する。 説明テキストは、トレーニングデータ<__dj__video> フィールドに続く内容です。 このように、コンポーネントは、ビデオの品質を保証するために、低い類似性を有するビデオのデータをフィルタリングすることができる。 ほとんどの場合、コンポーネントは、ビデオ生成モデルのその後のトレーニングに使用されます。

入力はJSONLファイルです。 <__dj_image> フィールドは記述テキストの開始マーカーであり、<|__dj_eoc |> フィールドは記述テキストの終了マーカーである。

image

  • imagesフィールドは、イメージのOSSパスです。

  • テキストフィールドは説明テキストです。

入力と出力

入力ポート

  • ファイルデータの読み取りコンポーネントは、トレーニングデータが保存されているOSSディレクトリを読み取るために使用されます。

  • OSS Data Pathパラメーターを設定して、トレーニングデータファイルを選択できます。

トレーニングデータファイルの詳細については、「アルゴリズム」をご参照ください。

出力ポート

フィルタリングの結果。 詳細については、次のセクションのパラメーターの説明をご参照ください。

コンポーネントの設定

Machine Learning DesignerでLVM-Text-Frame-Similarity Filter (DLC) コンポーネントのパラメーターを設定できます。 下表に、各パラメーターを説明します。

タブ

パラメーター

必須

説明

デフォルト値

フィールド設定

ビデオデータOSSパス

選択可能

トレーニングデータファイル。 詳細については、「アルゴリズム」をご参照ください。

デフォルト値なし

出力ファイルOSSパス

必須

フィルタリング結果が保存されるOSSディレクトリ。 結果には次のファイルが含まれます。

  • {name}.jsonl: 出力ファイル。 [Output Filename] パラメーターを設定して、出力ファイルを指定できます。

  • {name}_stats.jsonl: 状態ファイル。

  • dj_run_yaml.yaml: アルゴリズムの実行時に使用されるパラメーター設定ファイル。

デフォルト値なし

出力ファイル名

必須

フィルタリング結果のファイル名。

result.jsonl

Parameter Settings

最小テキストフレーム類似性スコア

必須

テキストと画像の最小の類似性。

0.1

最大テキストフレーム類似スコア

必須

テキストと画像の最大の類似性。

1

サンプリングされたフレームの数

必須

サンプリングされるビデオフレームの数。 システムは、ビデオ持続時間に基づいて分析のためにビデオ内のフレームを均等に収集する。

3

実行チューニング

リソースグループの選択

パブリックリソースグループ

選択可能

使用するインスタンスタイプ (CPUまたはGPU) と仮想プライベートクラウド (VPC) 。 アルゴリズムのGPUインスタンスタイプを選択する必要があります。

デフォルト値なし

専用リソースグループ

選択可能

使用するvCPU、メモリ、共有メモリ、およびGPUの数。

デフォルト値なし

最大実行時間 (秒)

選択可能

コンポーネントを実行できる最大期間。 指定した時間を超えた場合は, ジョブを終了します。

デフォルト値なし