多媒體分析為您提供多媒體領域內的演算法識別服務,包括基本模型服務和進階模型服務,為您提供開箱即用的演算法服務能力。本文為您介紹多媒體分析相關計費說明和使用指導。
背景資訊
多媒體分析支援的演算法服務如下:
基本模型服務:提供映像領域內開箱即用的演算法服務能力,包括映像多標籤、映像品質分評定、人臉屬性分析(顏值、臉型、髮型、發色等資訊)、年齡分析、人像身材修改(瘦身/大碼)、映像去浮水印等模型服務。
進階模型服務:提供視頻領域內開箱即用的演算法服務能力,包括視頻分類打標、視頻品質分評定、圖文視頻動態分類打標(用於動態、文章類的多模態內容打標)、AI繪圖打標(打標結果用於提升AI繪圖模型訓練效果)等模型服務。
計費說明
多媒體分析提供隨用隨付後付費和資源套件預付費兩種計費方式,具體計費說明,詳情請參見多媒體分析計費說明。
使用指導
開通多媒體分析服務和購買資源套件
新使用者首先需要在人工智慧平台PAI的情境化解決方案的多媒體分析中開通服務,具體操作步驟如下。
登入PAI控制台。
按照下圖操作指引,開通多媒體分析服務。
預設使用隨用隨付(後付費)方式,按調用量計費。

您也可以選擇購買資源套件,一次性付費購買,享受更優惠的價格。
在多媒體分析頁面的基本模型服務頁簽,單擊購買點數包。
在模型服務預付費頁面,配置購買數量、情境規格和API調用次數,並單擊立即購買。
其中:情境規格支援選擇多媒體分析-基本模型服務或多媒體分析-進階模型服務;其他參數根據使用情境進行選擇。
Python SDK使用說明
開通多媒體分析服務後,您可以使用Python SDK調用各項演算法服務,詳情請參見多媒體分析:Python SDK使用說明。
Java SDK使用說明
開通多媒體分析服務後,使用Java SDK調用各項演算法服務API介面的操作詳情,請參見Java SDK GitHub。Java SDK和Python SDK的參數基本一致。若需瞭解具體參數說明,請參考多媒體分析:Python SDK使用說明。
多媒體分析能力矩陣
規格 | 模型服務名稱 | 每次服務消耗 | 描述 | 樣本 |
基本模型服務 | 映像品質評分 | 1次基本模型服務 | 提供映像品質評估能力,返回 [0, 100] 的浮點數分值。 |
|
人臉屬性分析 | 1次基本模型服務 |
|
| |
年齡分析 | 1次基本模型服務 |
| 年齡區間包含: | |
映像多標籤 | 1次基本模型服務 | 提供映像多標籤打標能力,可以輸出機率最高的Top K個標籤以及對應的機率,也可以輸出映像的高維特徵。 | 高頻標籤舉例:女生、自拍、男生、生活隨拍、截屏、食物、車、美食、遊戲、卡通、動物、韓系穿搭等。 | |
人像身材修改 | 1次基本模型服務 | 提供人像身材修改功能,您可以上傳人像照片,並通過調整degree參數來控制人像的身材,包括胖身或瘦身,其中 | 介面返回修改後映像的Base64編碼。 | |
映像去浮水印 | 1次基本模型服務 | 去除映像中包含的浮水印。 | 介面返回去除浮水印後映像的Base64編碼。 | |
AI繪圖打標 | 1次基本模型服務 | 提供AI繪圖(Stable-Diffusion)訓練所需的多種映像多標籤打標能力,更好的標籤能提升訓練模型的生圖效果。 |
| |
定製模型服務 | N次基本模型服務,具體N的值根據定製模型複雜度有所差異 | 提供映像、視頻相關的定製模型服務。 | 根據實際定製模型類型確定。 | |
進階模型服務 | 圖文視頻動態分類打標 | 1次進階模型服務 | 為包含多模態內容的動態或文章提供分類打標服務,支援使用文本+圖片或文本+視頻的組合進行分類打標,並支援返回高維特徵Embedding。 |
|
視頻品質評分 | 1次進階模型服務 | 提供短視頻品質評估能力,返回[0-100]的浮點品質分。 |
| |
視頻分類打標 | 1次進階模型服務 | 提供短視頻分類打標能力,返回短視頻類別和機率較高的Top K個標籤及對應機率,也支援輸出視頻的高維特徵。 |
|
測試與服務
如果您需要做進一步的測試和服務,請工單聯絡我們擷取支援人員。