LVM 画像編集アルゴリズムは、画像のクリーニング、コンテンツのフィルタリング、基本的な画像情報の抽出、画像キャプションの生成などの特徴を提供します。さまざまなアルゴリズムを組み合わせて画像データをフィルタリングし、テキスト記述を生成できます。このプロセスは、画像生成モデルのトレーニング用に高品質の画像データを提供します。このトピックでは、Machine Learning Designer で画像テキストフィルタリングプリセットテンプレートを使用する方法について説明します。
制限事項
画像テキストフィルタリングプリセットテンプレートは、中国 (杭州)、中国 (上海)、中国 (北京)、および中国 (深圳) リージョンでのみ利用可能です。
画像データの準備
PAI は、使用できるサンプルデータを提供します:
画像メタデータファイルと画像ファイルをダウンロードします。
画像メタデータファイル: image_meta.jsonl。このファイルは、画像テキストアルゴリズムの入力として使用されます。
画像ファイル: data.zip。このファイルは、一般的な画像編集アルゴリズムの入力として使用されます。
パッケージを解凍し、画像ファイルを OSS にアップロードします。詳細については、「単純なアップロード」をご参照ください。
画像メタデータファイルを変更します。
画像メタデータファイルの構成
oss://bucket_name.oss-cn-hangzhou.aliyuncs.com/image_algorithm_test/image_data/を、画像をアップロードした OSS ディレクトリに置き換えます。
画像ファイルをアップロードしたのと同じ OSS バケットに画像メタデータファイルをアップロードします。詳細については、「単純なアップロード」をご参照ください。
パイプラインの作成と実行
Machine Learning Designer ページに移動します。
PAI コンソールにログインします。
左上隅で、目的のリージョンを選択します。
左側のナビゲーションウィンドウで [ワークスペースリスト] をクリックし、管理するワークスペースの名前をクリックします。
左側のナビゲーションウィンドウで、[モデル開発とトレーニング] > [Machine Learning Designer] を選択します。
パイプラインを作成します。
[プリセットテンプレート] タブで、[ビジネスドメイン] > [マルチモーダル大規模モデル] を選択し、[画像テキストフィルタリング] テンプレートの [作成] をクリックします。

パイプラインパラメーターを構成し、[OK] をクリックします。デフォルト値を使用できます。
パイプラインリストで、作成したパイプラインを選択し、[パイプラインに入る] をクリックします。
パイプラインを構成します。
Read OSS Data コンポーネントを構成します。Read OSS Data コンポーネントをクリックします。右側のペインの [フィールド設定] タブで、[OSS データパス] を画像データファイルが格納されている OSS ディレクトリに設定します。
LLMDataProcessGroup1 グループを構成します。設定ボタン
をクリックし、[データ出力 OSS ディレクトリ] を構成します。出力ファイルはこのディレクトリに保存されます。LVM 画像前処理アルゴリズムコンポーネントの構成の詳細については、「画像前処理オペレーター」をご参照ください。
パイプラインを実行します。実行が完了したら、生成されたファイルを表示できます:
meta.jsonl ファイル: 実行中に、[画像データの OSS パス] に指定されたパスの親ディレクトリに meta.jsonl 画像メタデータファイルが生成されます。
結果ファイル: [出力ファイルの OSS パス] に指定したディレクトリで結果ファイルを表示できます。
結果ファイルの詳細については、「画像前処理オペレーター」の [出力ファイルの OSS パス] パラメーターの説明をご参照ください。