LVM画像処理アルゴリズムは、画像をクレンジングし、画像コンテンツをクレンジングし、画像から基本情報を抽出し、画像のキャプションを生成するために使用される。 さまざまなアルゴリズムを組み合わせて、高品質の画像データをフィルタリングし、ビジネス要件を満たすテキストサンプルを生成できます。 生成された画像データを使用してモデルをトレーニングできます。 このトピックでは、Platform for AI (PAI) のMachine Learning DesignerでImage-Text Filteringプリセットテンプレートを使用する方法について説明します。
制限事項
画像-テキストフィルタリングプリセットテンプレートは、中国 (杭州) 、中国 (上海) 、中国 (北京) 、および中国 (深セン) の各リージョンでのみ使用できます。
画像データの準備
PAIはあなたの参照にサンプルデータを提供します。
画像メタデータファイルと画像ファイルをダウンロードします。
画像メタデータファイル: image_meta.jsonl。画像-テキストアルゴリズムの入力として使用できます。
画像ファイル: data.zip。一般的な画像処理アルゴリズムの入力として使用できます。
解凍します。zipパッケージを作成し、画像ファイルをOSSにアップロードします。 詳細については、「OSSコンソールの使用」をご参照ください。
画像メタデータファイルを変更します。
画像メタデータファイルの
your_oss_path
フィールドを、画像をアップロードするOSSバケットのディレクトリに置き換えます。 たとえば、OSSバケットのimage_algorithm_test/image_dataディレクトリに画像をアップロードする場合は、your_oss_path
フィールドをimage_algorithm_test/image_data
に置き換えます。ステップ2と同じOSSバケットに画像メタデータファイルをアップロードします。 詳細については、「OSSコンソールの使用」をご参照ください。
パイプラインの作成と実行
視覚化モデリング (デザイナー) ページに移動します。
PAI コンソールにログインします。
左上隅で、ビジネス要件に基づいてリージョンを選択します。
左側のナビゲーションペインで、[ワークスペース] をクリックします。 [ワークスペース] ページで、管理するワークスペースの名前をクリックします。
左側のナビゲーションウィンドウで、[モデルトレーニング] > [視覚化モデリング (デザイナー)] を選択します。
パイプラインを作成します。
プリセットテンプレートタブで、ビジネスエリア > マルチモーダルLLMを選択します。[画像-テキストのフィルタリング] セクションで、[作成] をクリックします。
[パイプラインの作成] ダイアログボックスで、パイプラインパラメーターを設定し、[OK] をクリックします。 デフォルト値のままでかまいません。
パイプラインリストで、作成したパイプラインを見つけ、[開く] をクリックします。
パイプラインを設定します。
LVMイメージ前処理アルゴリズムコンポーネントを設定します。 詳細については、「画像前処理演算子」をご参照ください。
パイプラインを実行します。 パイプラインの実行後、生成されたファイルを表示します。
meta.jsonlファイル: イメージメタデータファイルmeta.jsonlは、image Data OSS Pathパラメーターで指定されたディレクトリの上位ディレクトリに生成されます。
出力ファイル: [Output file OSS Path] パラメーターで指定されたディレクトリに出力ファイルを表示できます。
出力ファイルの詳細については、画像前処理演算子の [出力ファイルOSSパス] パラメーターの説明をご参照ください。