全部產品
Search
文件中心

Intelligent Media Services:SubmitIProductionJob - 提交智能生產任務

更新時間:Mar 21, 2026

調用SubmitIProductionJob提交智能生產任務。

調試

您可以在OpenAPI Explorer中直接運行該介面,免去您計算簽名的困擾。運行成功後,OpenAPI Explorer可以自動產生SDK程式碼範例。

調試

授權資訊

下表是API對應的授權資訊,可以在RAM權限原則語句的Action元素中使用,用來給RAM使用者或RAM角色授予調用此API的許可權。具體說明如下:

  • 操作:是指具體的許可權點。

  • 存取層級:是指每個操作的存取層級,取值為寫入(Write)、讀取(Read)或列出(List)。

  • 資源類型:是指操作中支援授權的資源類型。具體說明如下:

    • 對於必選的資源類型,用前面加 * 表示。

    • 對於不支援資源級授權的操作,用全部資源表示。

  • 條件關鍵字:是指雲產品自身定義的條件關鍵字。

  • 關聯操作:是指成功執行操作所需要的其他許可權。操作者必須同時具備關聯操作的許可權,操作才能成功。

操作

存取層級

資源類型

條件關鍵字

關聯操作

ice:SubmitIProductionJob

create

*全部資源

*

請求參數

名稱

類型

必填

描述

樣本值

Name

string

任務名稱,長度不超過 100 字元。

測試工作

FunctionName

string

需要使用的演算法功能名稱。取值:

  • Cover:智能封面

  • VideoClip:視頻摘要

  • VideoDelogo:視頻去表徵圖

  • VideoDetext:視頻去字幕

  • CaptionExtraction:字幕提取

  • VideoGreenScreenMatting:綠幕摳圖

  • FaceBeauty:視頻美顏

  • VideoH2V:視頻橫轉豎

  • MusicSegmentDetect:副歌檢測

  • AudioBeatDetection:節奏檢測

  • AudioQualityAssessment:音質檢測

  • SpeechDenoise:語音降噪

  • AudioMixing:音頻混音

  • MusicDemix:聲伴分離

Cover

Input

object

輸入媒體,支援 OSS 或媒資 ID。

不同演算法功能 Input 輸入的檔案要求不同,詳見下方補充說明。

Type

string

媒體類型:

  • OSS:OSS 路徑

  • Media:媒資 ID

OSS

Media

string

輸入媒體,支援 OSS 地址和媒資 ID 兩種。 oss 地址規則為:(兩種形式選一種即可)

  1. oss://bucket/object

  2. http(s)://bucket.oss-[regionId].aliyuncs.com/object 其中 bucket 為和當前專案處於同一地區的 oss bucket 名稱,object 為檔案路徑。

oss://bucket/object

Output

object

輸出媒體,支援 OSS 或媒資 ID。

不同演算法功能 Output 輸出的檔案不同,詳見下方補充說明。

Type

string

媒體類型:

  • OSS:OSS 路徑

  • Media:媒資 ID

OSS

Biz

string

媒資所屬業務

IMS

Media

string

輸出媒體。當 Type 為 OSS 時填入 OSS 地址,Type 為 Media 時填入媒資 ID。

OSS 地址規則為:(兩種形式選一種即可)

  1. oss://bucket/object

  2. http(s)://bucket.oss-[RegionId].aliyuncs.com/object 其中 bucket 為和當前專案處於同一地區的 oss bucket 名稱,object 為檔案路徑。

媒資 ID:

  • 支援指定已有 MediaId

    • 不需要指定 Biz,隨源

  • 支援建立 MediaId(MediaId 為空白)

    • 根據 Biz 決定寫入 IMS 還是 VOD 媒資,未指定 Biz 預設隨源或 IMS

說明

OSS 地址路徑支援預留位置,如:oss://example-****/iproduction/{source}-{timestamp}-{sequenceId}.png。當前支援以下幾種預留位置:

  • {source}:填充輸入檔案名稱

  • {timestamp}:填充 Unix 時間戳記

  • {sequenceId}:填充產生序號

  • {resultType}:填充輸出檔案類型(服務端決定) 預留位置不必須,但對於多輸出演算法,比如智能封面等,需要注意加入序號預留位置確保輸出檔案路徑不重複。

oss://bucket/object

OutputUrl

string

當 Type=Media 時,指定輸出檔案 OSS 地址。bucket 必須註冊在 IMS 或 VOD 中。

http(s)://bucket.oss-[RegionId].aliyuncs.com/object

TemplateId

string

模板 ID

****20b48fb04483915d4f2cd8ac****

JobParams

string

演算法作業參數,JSON 對象,不同演算法對應參數內容不同。詳見補充說明。

{"Model":"gif"}

ScheduleConfig

object

任務調度配置資訊

PipelineId

string

管道 ID

5246b8d12a62433ab77845074039c3dc

Priority

integer

取值範圍為 1 到 10,數值越小優先順序越高。

6

UserData

string

使用者自訂資料,擷取結果時原樣返回。長度不超過 256 字元。

{"test":1}

ModelId

string

演算法模型 ID。如果為空白,則選擇對應功能的預設模型(此參數保持為空白即可,一般無需傳入,直接使用預設模型)。

當前有以下演算法功能存在非預設模型可供選擇:

  • VideoDetext
    • ModelId = algo-video-detext-new,效果更好的字幕擦除演算法,速度比預設演算法慢,費用比預設演算法高

Input 和 Output 欄位說明

Cover

輸入一個視頻檔案,輸出若干張圖片(預設 3 張,需要通過預留位置區分),格式為 png 或 gif(取決於 JobParams 中參數,產生靜態圖或動態圖)。

VideoDelogo

輸入一個視頻檔案,輸出擦除表徵圖後的視頻(格式為 mp4)。

VideoDetext

輸入一個視頻檔案,輸出擦除字幕後的視頻(格式為 mp4)。

CaptionExtraction

輸入一個視頻檔案,輸出字幕檔案(SRT 格式)。

VideoGreenScreenMatting

輸入一個視頻檔案,輸出綠幕摳圖後的視頻(格式為 mp4 或 webm,取決於 JobParams 參數)。

FaceBeauty

輸入一個視頻檔案,輸出美顏後的視頻(格式為 mp4)。

VideoH2V

輸入一個視頻檔案,輸出橫轉豎後的視頻(格式為 mp4)。

MusicSegmentDetect

輸入一個音頻檔案,輸出副歌檢測後的結果資訊檔(Json 格式)。

AudioBeatDetection

輸入一個音頻檔案,輸出節奏檢測後的結果資訊檔(Json 格式)。

AudioQualityAssessment

輸入一個音頻檔案,無輸出檔案。音質檢測結果放在 QueryIProductionJob 中直接返回。

SpeechDenoise

輸入一個音頻檔案,輸出降噪後的音頻(格式為 wav)。

AudioMixing

輸入一個待混音的音頻檔案,輸出混音後的音頻(格式為 wav)。混入的音頻檔案如何輸入詳見下面的 JobParams 參數。

MusicDemix

輸入一個音頻檔案(歌曲),輸出聲伴分離後的兩個音頻(Output 路徑中需要傳入{resultType}預留位置,分別代表人聲和背景聲)。

JobParams 的 JSON 欄位說明

Cover

  • Model:String 類型,智能封面模型,為空白時輸出圖片封面,為 gif 時輸出動圖封面。

VideoDelogo

  • LogoModel:String 類型,去除的 logo 類型,取值:tv(通用台標 - 電視台),internet(通用台標 - 網路媒體),該欄位可多選,通過逗號分隔。

  • Boxes:String 類型,目標 logo 框位置,以左上方為原點的歸一化距離,[xmin, ymin, width, height],目前最多支援兩個目標 logo 框,例如:"[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]"。

VideoDetext

  • LimitRegion:list 類型,限定字幕檢測地區,以左上方為原點的歸一化距離,[xmin, ymin, width, height],可支援多個檢測地區,例如:[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]。注意,不設定該參數時,預設檢測地區為視頻下方 30%地區。

  • Time:指定全域擦除時間(單位 s),list 類型,包括起始時間和結束時間,[start_time, end_time],例如[5, 20],表示只擦除視頻的 5~20 秒之間的字幕。
    • Time 參數可以是一維數組,如[5, 20],指定一個時間段

    • Time 參數也可以是二維數組,如[[5, 20], [25, 43], [51, 80]],指定多個時間段(只有當 modelId=algo-video-detext-new 時支援)

CaptionExtraction

  • fps:採樣幀率(可選),整數,取值範圍為[2,10],預設 5。

  • roi:字幕框選地區(只對地區內的字幕進行提取),格式:[[top, bottom], [left, right]],為歸一化取值(如下半部分[[0.5, 1], [0, 1]])。不傳此值,預設識別視頻底部 1/4 地區。

  • lang:識別語言,ch(中文)、en(英文),ch_ml(中英混合)。預設 ch。

  • track:如果傳"main",表示只提取主字幕軌道。不傳時,預設提取地區內出現的所有字幕。

VideoGreenScreenMatting

  • bgimage:摳圖後疊加的背景圖片,例如:http://example-image-****.example-location.aliyuncs.com/example/example.jpg。如果不傳該參數,則輸出帶透明通道的 WEBM 視頻。

FaceBeauty

  • beauty_params:美顏功能參數,填寫樣本: "whiten=20,smooth=50,face_thin=50",詳見參數欄位說明

VideoH2V

MusicSegmentDetect

AudioBeatDetection

AudioQualityAssessment

SpeechDenoise

輸入音頻要求:格式需為 WAV,採樣率為 16khz 或 48khz。

AudioMixing

  • inputs:待混合的音軌檔案地址清單,目前只支援一個,例如:{"file":"http://example-bucket-****.oss-cn-shanghai.aliyuncs.com/2.mp4"}

MusicDemix

返回參數

名稱

類型

描述

樣本值

object

Schema of Response

RequestId

string

請求 ID

C1849434-FC47-5DC1-92B6-F7EAAFE3851E

JobId

string

智慧工作提示 ID

****20b48fb04483915d4f2cd8ac****

樣本

正常返回樣本

JSON格式

{
  "RequestId": "C1849434-FC47-5DC1-92B6-F7EAAFE3851E",
  "JobId": "****20b48fb04483915d4f2cd8ac****"
}

錯誤碼

訪問錯誤中心查看更多錯誤碼。

變更歷史

更多資訊,參考變更詳情