すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:マルチメディア分析

最終更新日:Nov 29, 2025

マルチメディア分析は、アルゴリズムベースのサービスを提供し、マルチメディアコンテンツを分析します。これらのサービスには、すぐに利用可能なアルゴリズム機能を提供する基盤モデルサービスと高度モデルサービスが含まれます。このトピックでは、マルチメディア分析の課金の詳細と利用手順について説明します。

背景情報

マルチメディア分析は、以下のアルゴリズムサービスをサポートしています:

  • 基盤モデルサービス:画像に対してすぐに利用可能なアルゴリズム機能を提供します。これには、画像のマルチラベルタグ付け、画像品質評価、顔属性分析 (魅力、顔の形、髪型、髪色など)、年齢分析、体型補正 (痩身またはプラスサイズ)、ウォーターマーク除去などのモデルサービスが含まれます。

  • 高度モデルサービス:動画に対してすぐに利用可能なアルゴリズム機能を提供します。これには、動画の分類とタグ付け、動画品質評価、画像と動画を含む投稿の動的分類とタグ付け (動的な投稿やスレッドなどのマルチモーダルコンテンツのタグ付けに使用)、AI 生成画像のタグ付けなどのモデルサービスが含まれます。これらのタグは、AI 画像生成モデルのトレーニングを改善します。

課金の詳細

マルチメディア分析は、従量課金とサブスクリプションリソースプランの 2 つの課金方法をサポートしています。詳細については、「マルチメディア分析の課金の詳細」をご参照ください。

利用ガイド

マルチメディア分析のアクティブ化とリソースプランの購入

初めて利用するユーザーは、Platform for AI (PAI) ページの [ソリューション] の下にある [マルチメディア分析] セクションでサービスをアクティブ化する必要があります。手順は以下の通りです。

  1. PAI コンソールにログインします。

  2. 図の手順に従って、マルチメディア分析サービスをアクティブ化します。

  3. デフォルトでは従量課金方式が使用されます。呼び出し回数に基づいて課金されます。38e9535689e0b041a5c5c5a0ca32dd1a.png

また、一括払いでリソースプランを購入すると、より低価格で利用できます。

  1. マルチメディア分析ページの Basic Model Service タブで、[リソースプランの購入] をクリックします。

  2. Subscription Model Service ページで、[数量][シナリオ][API 呼び出し][期間] の各パラメーターを設定し、[今すぐ購入] をクリックします。

  3. マルチメディア分析サービスを利用するには、[シナリオ] パラメーターを [マルチメディア分析 - 基盤モデルサービス] または [マルチメディア分析 - 高度モデルサービス] に設定します。その他のパラメーターは、ビジネス要件に基づいて設定してください。

Python SDK の手順

マルチメディア分析サービスをアクティブ化した後、Python ソフトウェア開発キット (SDK) を使用して、さまざまなアルゴリズムサービスを呼び出すことができます。詳細については、「マルチメディア分析:Python SDK の手順」をご参照ください。

Java SDK の手順

マルチメディア分析サービスをアクティブ化した後、Java SDK を使用してアルゴリズムサービスの API 操作を呼び出す方法の詳細については、Java SDK GitHub をご参照ください。Java SDK のパラメーターは、Python SDK のパラメーターとほぼ同じです。パラメーターの詳細については、「マルチメディア分析:Python SDK の手順」をご参照ください。

マルチメディア分析機能マトリックス

仕様

モデルサービス名

サービス呼び出しあたりの消費量

説明

基盤モデルサービス

画像品質評価

基盤モデルサービスの呼び出し 1 回

画像品質評価を提供し、0 から 100 までの浮動小数点スコアを返します。

"iqa_result":66.88

顔属性分析

基盤モデルサービスの呼び出し 1 回

  • 顔の形、髪色、髪型、魅力などの顔属性の出力を提供します。

  • 顔領域の座標に基づいて複数の顔を区別します。顔が検出されない場合は、空の配列が返されます。

  • 顔の形:三角顔、丸顔、ハート顔、四角顔、卵顔、ダイヤモンド顔、面長。

  • 女性の髪型:

    • 前髪のタイプ:センターパート、編み込み、サイドパート、前髪なし、シースルーバング、ぱっつん前髪。

    • カールのタイプ:雲カール、大波ウェーブ、小波ウェーブ、エアリーカール、パーマカール、縮れカール、エッグロールカール。

    • 髪型:カーリー、アップヘア、ストレート、ポニーテール、編み込み。

    • 髪の長さ:ミディアム、ショート、ロング。

  • 男性の髪型:パートヘア、バズカット、クルーカット、フラットトップ、ブッチカット、テクスチャードクロップ、レイヤー、スリックバック。

  • 髪色:黒、コーヒー、アッシュグレー、栗色、茶色、グラデーション、バーガンディ、金、黄、その他。

  • 魅力:0~5。

年齢分析

基盤モデルサービスの呼び出し 1 回

  • 画像内の主要な顔の年齢層を検出します。

  • 画像内に複数の顔がある場合、最大の顔の結果のみが返されます。顔が検出されない場合は、エラーが返されます。

年齢層には以下が含まれます: '0-2''3-9''10-19''20-29''30-39''40-49''50-59''60-69''70+'

画像のマルチラベルタグ付け

基盤モデルサービスの呼び出し 1 回

画像のマルチラベルタグ付けを提供します。確率が最も高い上位 K 個のタグと、それに対応する高次元特徴を出力できます。

頻出タグの例:女の子、自撮り、男の子、日常生活、スクリーンショット、食べ物、車、料理、ゲーム、漫画、動物、韓国ファッション。

体型補正

基盤モデルサービスの呼び出し 1 回

体型修正機能を提供します。ポートレートをアップロードし、[degree] パラメーターを変更することで、体型をスリムにしたり大きくしたりできます。degree > 0 はスリム化を示します。

API 操作は、補正後の画像の Base64 エンコーディングを返します。

ウォーターマーク除去

基盤モデルサービスの呼び出し 1 回

画像からウォーターマークを除去します。

API 操作は、ウォーターマーク除去後の画像の Base64 エンコーディングを返します。

AI 生成画像のタグ付け

基盤モデルサービスの呼び出し 1 回

Stable Diffusion などの AI 画像生成モデルのトレーニング用に、画像のマルチラベルタグ付け機能を提供します。より良いタグは、生成される画像の品質を向上させます。

  • サポートされているタグ付けモデル:WD14、BLIP、GIT、RAM。

  • キャプション結果の例:

    "sensitive, 1girl, solo, long hair, looking at viewer, smile, black hair, brown eyes, scarf, lips, realistic"

カスタムモデルサービス

基盤モデルサービスの呼び出し N 回。N の値は、カスタムモデルの複雑さによって異なります。

画像と動画向けのカスタムモデルサービスを提供します。

特定のカスタムモデルのタイプに依存します。

高度モデルサービス

画像と動画を含む投稿の動的分類とタグ付け

高度モデルサービスの呼び出し 1 回

マルチモーダルコンテンツを含む動的な投稿やスレッドの分類とタグ付けを提供します。テキストと画像、またはテキストと動画の組み合わせを使用した分類とタグ付けをサポートします。また、高次元特徴埋め込みの返却もサポートします。

  • 頻出クラスの例:生活、映画・テレビ番組、スポーツ、旅行、ゲーム、食べ物、フィットネス。

  • 頻出タグの例:スポーツ、食べ物、ダンス、フィットネス、料理、旅行、自撮り。

  • 埋め込みの例:

    0.915,0.882,0.943,0.978,1.027,1.181,1.066,1.029,0.866,0.716,0.628,1.203,0.689,0.533,0.734,1.038,0.98,0.613,0.96,0.88,0.586,0.702,1.515,0.697,0.987,0.699,1.179,4.274,0.757,0.89,0.805,0.901

動画品質評価

高度モデルサービスの呼び出し 1 回

短編動画の品質評価を提供し、0 から 100 までの浮動小数点品質スコアを返します。

"video_score":20.57

動画の分類とタグ付け

高度モデルサービスの呼び出し 1 回

短編動画の分類とタグ付けを提供します。動画のクラスと、確率が最も高い上位 K 個のタグを返します。また、高次元の動画特徴の出力もサポートします。

  • 頻出クラスの例:生活、知識、音楽、テクノロジー、ゲーム。

  • 頻出タグの例:字幕付き、女の子、社会ニュース、痩身・シェイプアップ、寸劇、映画クリップ、自然風景。

テストとサービス

さらなるテストやサポートが必要な場合は、テクニカルサポートにチケットを起票してお問い合わせください。