SubmitIProductionJob提交智能生產任務API參考與參數說明-智能媒體服務-阿里雲 - Intelligent Media Services

調用SubmitIProductionJob提交智能生產任務。

介面說明

該介面為非同步介面，提交任務後返回任務 ID（此時任務尚未完成，任務將進入後台排隊非同步執行），最終結果將通過回調通知，也可通過查詢智能生產任務主動查詢任務狀態。

調試

您可以在OpenAPI Explorer中直接運行該介面，免去您計算簽名的困擾。運行成功後，OpenAPI Explorer可以自動產生SDK程式碼範例。

調試

授權資訊

下表是API對應的授權資訊，可以在RAM權限原則語句的Action元素中使用，用來給RAM使用者或RAM角色授予調用此API的許可權。具體說明如下：

操作：是指具體的許可權點。
存取層級：是指每個操作的存取層級，取值為寫入（Write）、讀取（Read）或列出（List）。
資源類型：是指操作中支援授權的資源類型。具體說明如下：
- 對於必選的資源類型，用前面加 * 表示。
- 對於不支援資源級授權的操作，用全部資源表示。
條件關鍵字：是指雲產品自身定義的條件關鍵字。
關聯操作：是指成功執行操作所需要的其他許可權。操作者必須同時具備關聯操作的許可權，操作才能成功。

操作

存取層級

資源類型

條件關鍵字

關聯操作

ice:SubmitIProductionJob

create

*全部資源

*

無

請求參數

名稱	類型	必填	描述	樣本值
Name	string	否	任務名稱，長度不超過 100 字元。	測試工作
FunctionName	string	是	需要使用的演算法功能名稱。取值： Cover：智能封面 VideoClip：視頻摘要 VideoDelogo：視頻去表徵圖 VideoDetext：視頻去字幕 CaptionExtraction：字幕提取 VideoGreenScreenMatting：綠幕摳圖 FaceBeauty：視頻美顏 VideoH2V：視頻橫轉豎 MusicSegmentDetect：副歌檢測 AudioBeatDetection：節奏檢測 AudioQualityAssessment：音質檢測 SpeechDenoise：語音降噪 AudioMixing：音頻混音 MusicDemix：聲伴分離	Cover
Input	object	是	輸入媒體，支援 OSS 或媒資 ID。不同演算法功能 Input 輸入的檔案要求不同，詳見下方補充說明。
Type	string	是	媒體類型： OSS：OSS 路徑 Media：媒資 ID	OSS
Media	string	是	輸入媒體，支援 OSS 地址和媒資 ID 兩種。 oss 地址規則為：（兩種形式選一種即可） oss://bucket/object http(s)://bucket.oss-[regionId].aliyuncs.com/object 其中 bucket 為和當前專案處於同一地區的 oss bucket 名稱，object 為檔案路徑。	oss://bucket/object
Output	object	是	輸出媒體，支援 OSS 或媒資 ID。不同演算法功能 Output 輸出的檔案不同，詳見下方補充說明。
Type	string	是	媒體類型： OSS：OSS 路徑 Media：媒資 ID	OSS
Biz	string	否	媒資所屬業務	IMS
Media	string	是	輸出媒體。當 Type 為 OSS 時填入 OSS 地址，Type 為 Media 時填入媒資 ID。 OSS 地址規則為：（兩種形式選一種即可） oss://bucket/object http(s)://bucket.oss-[RegionId].aliyuncs.com/object 其中 bucket 為和當前專案處於同一地區的 oss bucket 名稱，object 為檔案路徑。媒資 ID：支援指定已有 MediaId 不需要指定 Biz，隨源支援建立 MediaId（MediaId 為空白）根據 Biz 決定寫入 IMS 還是 VOD 媒資，未指定 Biz 預設隨源或 IMS 說明 OSS 地址路徑支援預留位置，如：oss://example-****/iproduction/{source}-{timestamp}-{sequenceId}.png。當前支援以下幾種預留位置： {source}：填充輸入檔案名稱 {timestamp}：填充 Unix 時間戳記 {sequenceId}：填充產生序號 {resultType}：填充輸出檔案類型（服務端決定）預留位置不必須，但對於多輸出演算法，比如智能封面等，需要注意加入序號預留位置確保輸出檔案路徑不重複。	oss://bucket/object
OutputUrl	string	否	當 Type=Media 時，指定輸出檔案 OSS 地址。bucket 必須註冊在 IMS 或 VOD 中。	http(s)://bucket.oss-[RegionId].aliyuncs.com/object
TemplateId	string	否	模板 ID	**20b48fb04483915d4f2cd8ac**
JobParams	string	否	演算法作業參數，JSON 對象，不同演算法對應參數內容不同。詳見補充說明。	{"Model":"gif"}
ScheduleConfig	object	否	任務調度配置資訊
PipelineId	string	否	管道 ID	5246b8d12a62433ab77845074039c3dc
Priority	integer	否	取值範圍為 1 到 10，數值越小優先順序越高。	6
UserData	string	否	使用者自訂資料，擷取結果時原樣返回。長度不超過 256 字元。	{"test":1}
ModelId	string	否	演算法模型 ID。如果為空白，則選擇對應功能的預設模型（此參數保持為空白即可，一般無需傳入，直接使用預設模型）。當前有以下演算法功能存在非預設模型可供選擇： VideoDetext ModelId = algo-video-detext-new，效果更好的字幕擦除演算法，速度比預設演算法慢，費用比預設演算法高

Input 和 Output 欄位說明

Cover

輸入一個視頻檔案，輸出若干張圖片（預設 3 張，需要通過預留位置區分），格式為 png 或 gif（取決於 JobParams 中參數，產生靜態圖或動態圖）。

VideoDelogo

輸入一個視頻檔案，輸出擦除表徵圖後的視頻（格式為 mp4）。

VideoDetext

輸入一個視頻檔案，輸出擦除字幕後的視頻（格式為 mp4）。

CaptionExtraction

輸入一個視頻檔案，輸出字幕檔案（SRT 格式）。

VideoGreenScreenMatting

輸入一個視頻檔案，輸出綠幕摳圖後的視頻（格式為 mp4 或 webm，取決於 JobParams 參數）。

FaceBeauty

輸入一個視頻檔案，輸出美顏後的視頻（格式為 mp4）。

VideoH2V

輸入一個視頻檔案，輸出橫轉豎後的視頻（格式為 mp4）。

MusicSegmentDetect

輸入一個音頻檔案，輸出副歌檢測後的結果資訊檔（Json 格式）。

AudioBeatDetection

輸入一個音頻檔案，輸出節奏檢測後的結果資訊檔（Json 格式）。

AudioQualityAssessment

輸入一個音頻檔案，無輸出檔案。音質檢測結果放在 QueryIProductionJob 中直接返回。

SpeechDenoise

輸入一個音頻檔案，輸出降噪後的音頻（格式為 wav）。

AudioMixing

輸入一個待混音的音頻檔案，輸出混音後的音頻（格式為 wav）。混入的音頻檔案如何輸入詳見下面的 JobParams 參數。

MusicDemix

輸入一個音頻檔案（歌曲），輸出聲伴分離後的兩個音頻（Output 路徑中需要傳入{resultType}預留位置，分別代表人聲和背景聲）。

JobParams 的 JSON 欄位說明

Cover

Model：String 類型，智能封面模型，為空白時輸出圖片封面，為 gif 時輸出動圖封面。

VideoDelogo

LogoModel：String 類型，去除的 logo 類型，取值：tv（通用台標 - 電視台），internet（通用台標 - 網路媒體），該欄位可多選，通過逗號分隔。
Boxes：String 類型，目標 logo 框位置，以左上方為原點的歸一化距離，[xmin, ymin, width, height]，目前最多支援兩個目標 logo 框，例如："[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]"。

VideoDetext

LimitRegion：list 類型，限定字幕檢測地區，以左上方為原點的歸一化距離，[xmin, ymin, width, height]，可支援多個檢測地區，例如：[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]。注意，不設定該參數時，預設檢測地區為視頻下方 30%地區。
Time：指定全域擦除時間（單位 s），list 類型，包括起始時間和結束時間，[start_time, end_time]，例如[5, 20]，表示只擦除視頻的 5~20 秒之間的字幕。
- Time 參數可以是一維數組，如[5, 20]，指定一個時間段
- Time 參數也可以是二維數組，如[[5, 20], [25, 43], [51, 80]]，指定多個時間段（只有當 modelId=algo-video-detext-new 時支援）

CaptionExtraction

fps：採樣幀率（可選），整數，取值範圍為[2,10]，預設 5。
roi：字幕框選地區（只對地區內的字幕進行提取），格式：[[top, bottom], [left, right]]，為歸一化取值（如下半部分[[0.5, 1], [0, 1]]）。不傳此值，預設識別視頻底部 1/4 地區。
lang：識別語言，ch（中文）、en（英文），ch_ml（中英混合）。預設 ch。
track：如果傳"main"，表示只提取主字幕軌道。不傳時，預設提取地區內出現的所有字幕。

VideoGreenScreenMatting

bgimage：摳圖後疊加的背景圖片，例如：http://example-image-****.example-location.aliyuncs.com/example/example.jpg。如果不傳該參數，則輸出帶透明通道的 WEBM 視頻。

FaceBeauty

beauty_params：美顏功能參數，填寫樣本： "whiten=20,smooth=50,face_thin=50"，詳見參數欄位說明

VideoH2V

無

MusicSegmentDetect

無

AudioBeatDetection

無

AudioQualityAssessment

無

SpeechDenoise

輸入音頻要求：格式需為 WAV，採樣率為 16khz 或 48khz。

AudioMixing

inputs：待混合的音軌檔案地址清單，目前只支援一個，例如：{"file":"http://example-bucket-****.oss-cn-shanghai.aliyuncs.com/2.mp4"}

MusicDemix

無

返回參數

名稱	類型	描述	樣本值
	object	Schema of Response
RequestId	string	請求 ID	C1849434-FC47-5DC1-92B6-F7EAAFE3851E
JobId	string	智慧工作提示 ID	**20b48fb04483915d4f2cd8ac**

樣本

正常返回樣本

JSON格式

{
  "RequestId": "C1849434-FC47-5DC1-92B6-F7EAAFE3851E",
  "JobId": "****20b48fb04483915d4f2cd8ac****"
}

錯誤碼

訪問錯誤中心查看更多錯誤碼。

變更歷史

更多資訊，參考變更詳情。