すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:画像テキストフィルタリング

最終更新日:Oct 17, 2025

LVM 画像編集アルゴリズムは、画像のクリーニング、コンテンツのフィルタリング、基本的な画像情報の抽出、画像キャプションの生成などの特徴を提供します。さまざまなアルゴリズムを組み合わせて画像データをフィルタリングし、テキスト記述を生成できます。このプロセスは、画像生成モデルのトレーニング用に高品質の画像データを提供します。このトピックでは、Machine Learning Designer で画像テキストフィルタリングプリセットテンプレートを使用する方法について説明します。

制限事項

画像テキストフィルタリングプリセットテンプレートは、中国 (杭州)、中国 (上海)、中国 (北京)、および中国 (深圳) リージョンでのみ利用可能です。

画像データの準備

PAI は、使用できるサンプルデータを提供します:

  1. 画像メタデータファイルと画像ファイルをダウンロードします。

    • 画像メタデータファイル: image_meta.jsonl。このファイルは、画像テキストアルゴリズムの入力として使用されます。

    • 画像ファイル: data.zip。このファイルは、一般的な画像編集アルゴリズムの入力として使用されます。

  2. パッケージを解凍し、画像ファイルを OSS にアップロードします。詳細については、「単純なアップロード」をご参照ください。

  3. 画像メタデータファイルを変更します。

    画像メタデータファイルの構成 oss://bucket_name.oss-cn-hangzhou.aliyuncs.com/image_algorithm_test/image_data/ を、画像をアップロードした OSS ディレクトリに置き換えます。

    image

  4. 画像ファイルをアップロードしたのと同じ OSS バケットに画像メタデータファイルをアップロードします。詳細については、「単純なアップロード」をご参照ください。

パイプラインの作成と実行

  1. Machine Learning Designer ページに移動します。

    1. PAI コンソールにログインします。

    2. 左上隅で、目的のリージョンを選択します。

    3. 左側のナビゲーションウィンドウで [ワークスペースリスト] をクリックし、管理するワークスペースの名前をクリックします。

    4. 左側のナビゲーションウィンドウで、[モデル開発とトレーニング] > [Machine Learning Designer] を選択します。

  2. パイプラインを作成します。

    1. [プリセットテンプレート] タブで、[ビジネスドメイン] > [マルチモーダル大規模モデル] を選択し、[画像テキストフィルタリング] テンプレートの [作成] をクリックします。

      image

    2. パイプラインパラメーターを構成し、[OK] をクリックします。デフォルト値を使用できます。

    3. パイプラインリストで、作成したパイプラインを選択し、[パイプラインに入る] をクリックします。

  3. パイプラインを構成します。

    • Read OSS Data コンポーネントを構成します。Read OSS Data コンポーネントをクリックします。右側のペインの [フィールド設定] タブで、[OSS データパス] を画像データファイルが格納されている OSS ディレクトリに設定します。

    • LLMDataProcessGroup1 グループを構成します。設定ボタン image をクリックし、[データ出力 OSS ディレクトリ] を構成します。出力ファイルはこのディレクトリに保存されます。LVM 画像前処理アルゴリズムコンポーネントの構成の詳細については、「画像前処理オペレーター」をご参照ください。

      image

  4. パイプラインを実行します。実行が完了したら、生成されたファイルを表示できます:

    • meta.jsonl ファイル: 実行中に、[画像データの OSS パス] に指定されたパスの親ディレクトリに meta.jsonl 画像メタデータファイルが生成されます。

    • 結果ファイル: [出力ファイルの OSS パス] に指定したディレクトリで結果ファイルを表示できます。

    結果ファイルの詳細については、「画像前処理オペレーター」の [出力ファイルの OSS パス] パラメーターの説明をご参照ください。

参考資料

画像前処理コンポーネント