すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:画像-テキストのフィルタリング

最終更新日:Feb 07, 2025

LVM画像処理アルゴリズムは、画像をクレンジングし、画像コンテンツをクレンジングし、画像から基本情報を抽出し、画像のキャプションを生成するために使用される。 さまざまなアルゴリズムを組み合わせて、高品質の画像データをフィルタリングし、ビジネス要件を満たすテキストサンプルを生成できます。 生成された画像データを使用してモデルをトレーニングできます。 このトピックでは、Platform for AI (PAI) のMachine Learning DesignerでImage-Text Filteringプリセットテンプレートを使用する方法について説明します。

制限事項

画像-テキストフィルタリングプリセットテンプレートは、中国 (杭州) 、中国 (上海) 、中国 (北京) 、および中国 (深セン) の各リージョンでのみ使用できます。

画像データの準備

PAIはあなたの参照にサンプルデータを提供します。

  1. 画像メタデータファイルと画像ファイルをダウンロードします。

    • 画像メタデータファイル: image_meta.jsonl。画像-テキストアルゴリズムの入力として使用できます。

    • 画像ファイル: data.zip。一般的な画像処理アルゴリズムの入力として使用できます。

  2. 解凍します。zipパッケージを作成し、画像ファイルをOSSにアップロードします。 詳細については、「OSSコンソールの使用」をご参照ください。

  3. 画像メタデータファイルを変更します。

    画像メタデータファイルのyour_oss_pathフィールドを、画像をアップロードするOSSバケットのディレクトリに置き換えます。 たとえば、OSSバケットのimage_algorithm_test/image_dataディレクトリに画像をアップロードする場合は、your_oss_pathフィールドをimage_algorithm_test/image_dataに置き換えます。

    image

    image

  4. ステップ2と同じOSSバケットに画像メタデータファイルをアップロードします。 詳細については、「OSSコンソールの使用」をご参照ください。

パイプラインの作成と実行

  1. 視覚化モデリング (デザイナー) ページに移動します。

    1. PAI コンソールにログインします。

    2. 左上隅で、ビジネス要件に基づいてリージョンを選択します。

    3. 左側のナビゲーションペインで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。

    4. 左側のナビゲーションウィンドウで、[モデルトレーニング] > [視覚化モデリング (デザイナー)] を選択します。

  2. パイプラインを作成します。

    1. プリセットテンプレートタブで、ビジネスエリア > マルチモーダルLLMを選択します。[画像-テキストのフィルタリング] セクションで、[作成] をクリックします。

      image

    2. [パイプラインの作成] ダイアログボックスで、パイプラインパラメーターを設定し、[OK] をクリックします。 デフォルト値のままでかまいません。

    3. パイプラインリストで、作成したパイプラインを見つけ、[開く] をクリックします。

  3. パイプラインを設定します。

    LVMイメージ前処理アルゴリズムコンポーネントを設定します。 詳細については、「画像前処理演算子」をご参照ください。 image

  4. パイプラインを実行します。 パイプラインの実行後、生成されたファイルを表示します。

    • meta.jsonlファイル: イメージメタデータファイルmeta.jsonlは、image Data OSS Pathパラメーターで指定されたディレクトリの上位ディレクトリに生成されます。

    • 出力ファイル: [Output file OSS Path] パラメーターで指定されたディレクトリに出力ファイルを表示できます。

    出力ファイルの詳細については、画像前処理演算子[出力ファイルOSSパス] パラメーターの説明をご参照ください。

関連ドキュメント

画像前処理演算子