マルチメディア分析は、アルゴリズムベースのサービスを提供し、マルチメディアコンテンツを分析します。これらのサービスには、すぐに利用可能なアルゴリズム機能を提供する基盤モデルサービスと高度モデルサービスが含まれます。このトピックでは、マルチメディア分析の課金の詳細と利用手順について説明します。
背景情報
マルチメディア分析は、以下のアルゴリズムサービスをサポートしています:
基盤モデルサービス:画像に対してすぐに利用可能なアルゴリズム機能を提供します。これには、画像のマルチラベルタグ付け、画像品質評価、顔属性分析 (魅力、顔の形、髪型、髪色など)、年齢分析、体型補正 (痩身またはプラスサイズ)、ウォーターマーク除去などのモデルサービスが含まれます。
高度モデルサービス:動画に対してすぐに利用可能なアルゴリズム機能を提供します。これには、動画の分類とタグ付け、動画品質評価、画像と動画を含む投稿の動的分類とタグ付け (動的な投稿やスレッドなどのマルチモーダルコンテンツのタグ付けに使用)、AI 生成画像のタグ付けなどのモデルサービスが含まれます。これらのタグは、AI 画像生成モデルのトレーニングを改善します。
課金の詳細
マルチメディア分析は、従量課金とサブスクリプションリソースプランの 2 つの課金方法をサポートしています。詳細については、「マルチメディア分析の課金の詳細」をご参照ください。
利用ガイド
マルチメディア分析のアクティブ化とリソースプランの購入
初めて利用するユーザーは、Platform for AI (PAI) ページの [ソリューション] の下にある [マルチメディア分析] セクションでサービスをアクティブ化する必要があります。手順は以下の通りです。
PAI コンソールにログインします。
図の手順に従って、マルチメディア分析サービスをアクティブ化します。
デフォルトでは従量課金方式が使用されます。呼び出し回数に基づいて課金されます。

また、一括払いでリソースプランを購入すると、より低価格で利用できます。
マルチメディア分析ページの Basic Model Service タブで、[リソースプランの購入] をクリックします。
Subscription Model Service ページで、[数量]、[シナリオ]、[API 呼び出し]、[期間] の各パラメーターを設定し、[今すぐ購入] をクリックします。
マルチメディア分析サービスを利用するには、[シナリオ] パラメーターを [マルチメディア分析 - 基盤モデルサービス] または [マルチメディア分析 - 高度モデルサービス] に設定します。その他のパラメーターは、ビジネス要件に基づいて設定してください。
Python SDK の手順
マルチメディア分析サービスをアクティブ化した後、Python ソフトウェア開発キット (SDK) を使用して、さまざまなアルゴリズムサービスを呼び出すことができます。詳細については、「マルチメディア分析:Python SDK の手順」をご参照ください。
Java SDK の手順
マルチメディア分析サービスをアクティブ化した後、Java SDK を使用してアルゴリズムサービスの API 操作を呼び出す方法の詳細については、Java SDK GitHub をご参照ください。Java SDK のパラメーターは、Python SDK のパラメーターとほぼ同じです。パラメーターの詳細については、「マルチメディア分析:Python SDK の手順」をご参照ください。
マルチメディア分析機能マトリックス
仕様 | モデルサービス名 | サービス呼び出しあたりの消費量 | 説明 | 例 |
基盤モデルサービス | 画像品質評価 | 基盤モデルサービスの呼び出し 1 回 | 画像品質評価を提供し、0 から 100 までの浮動小数点スコアを返します。 |
|
顔属性分析 | 基盤モデルサービスの呼び出し 1 回 |
|
| |
年齢分析 | 基盤モデルサービスの呼び出し 1 回 |
| 年齢層には以下が含まれます: | |
画像のマルチラベルタグ付け | 基盤モデルサービスの呼び出し 1 回 | 画像のマルチラベルタグ付けを提供します。確率が最も高い上位 K 個のタグと、それに対応する高次元特徴を出力できます。 | 頻出タグの例:女の子、自撮り、男の子、日常生活、スクリーンショット、食べ物、車、料理、ゲーム、漫画、動物、韓国ファッション。 | |
体型補正 | 基盤モデルサービスの呼び出し 1 回 | 体型修正機能を提供します。ポートレートをアップロードし、[degree] パラメーターを変更することで、体型をスリムにしたり大きくしたりできます。 | API 操作は、補正後の画像の Base64 エンコーディングを返します。 | |
ウォーターマーク除去 | 基盤モデルサービスの呼び出し 1 回 | 画像からウォーターマークを除去します。 | API 操作は、ウォーターマーク除去後の画像の Base64 エンコーディングを返します。 | |
AI 生成画像のタグ付け | 基盤モデルサービスの呼び出し 1 回 | Stable Diffusion などの AI 画像生成モデルのトレーニング用に、画像のマルチラベルタグ付け機能を提供します。より良いタグは、生成される画像の品質を向上させます。 |
| |
カスタムモデルサービス | 基盤モデルサービスの呼び出し N 回。N の値は、カスタムモデルの複雑さによって異なります。 | 画像と動画向けのカスタムモデルサービスを提供します。 | 特定のカスタムモデルのタイプに依存します。 | |
高度モデルサービス | 画像と動画を含む投稿の動的分類とタグ付け | 高度モデルサービスの呼び出し 1 回 | マルチモーダルコンテンツを含む動的な投稿やスレッドの分類とタグ付けを提供します。テキストと画像、またはテキストと動画の組み合わせを使用した分類とタグ付けをサポートします。また、高次元特徴埋め込みの返却もサポートします。 |
|
動画品質評価 | 高度モデルサービスの呼び出し 1 回 | 短編動画の品質評価を提供し、0 から 100 までの浮動小数点品質スコアを返します。 |
| |
動画の分類とタグ付け | 高度モデルサービスの呼び出し 1 回 | 短編動画の分類とタグ付けを提供します。動画のクラスと、確率が最も高い上位 K 個のタグを返します。また、高次元の動画特徴の出力もサポートします。 |
|
テストとサービス
さらなるテストやサポートが必要な場合は、テクニカルサポートにチケットを起票してお問い合わせください。