請求參數 | 多圖參考新加坡和北京地區的API Key不同,擷取與配置 API Key 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "image_reference",
"prompt": "視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當她站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下她與大自然的美妙邂逅。",
"ref_images_url": [
"http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
"http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
]
},
"parameters": {
"prompt_extend": true,
"obj_or_bg": ["obj","bg"],
"size": "1280*720"
}
}'
視頻重繪新加坡和北京地區的API Key不同,擷取與配置 API Key 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_repainting",
"prompt": "視頻展示了一輛黑色的蒸汽龐克風格汽車,紳士駕駛著,車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素,畫面複古與趣味。",
"video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
},
"parameters": {
"prompt_extend": false,
"control_condition": "depth"
}
}'
局部編輯新加坡和北京地區的API Key不同,擷取與配置 API Key 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_edit",
"prompt": "視頻展示了一家巴黎風情的法式咖啡館,一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯,輕輕啜飲,神情愜意。咖啡館裝飾雅緻,柔和的色調與溫暖燈光映照著獅子所在的地區。",
"mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
"video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
"mask_frame_id": 1
},
"parameters": {
"prompt_extend": false,
"mask_type": "tracking",
"expand_ratio": 0.05
}
}'
視頻延展新加坡和北京地區的API Key不同,擷取與配置 API Key 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_extension",
"prompt": "一隻戴著墨鏡的狗在街道上滑滑板,3D卡通。",
"first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
},
"parameters": {
"prompt_extend": false
}
}'
視頻畫面擴充新加坡和北京地區的API Key不同,擷取與配置 API Key 以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wan2.1-vace-plus",
"input": {
"function": "video_outpainting",
"prompt": "一位優雅的女士正在激情演奏小提琴,她身後是一支完整的交響樂團。",
"video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
},
"parameters": {
"prompt_extend": false,
"top_scale": 1.5,
"bottom_scale": 1.5,
"left_scale": 1.5,
"right_scale": 1.5
}
}'
|
要求標頭(Headers) |
Content-Type string (必選) 請求內容類型。此參數必須設定為application/json。 |
Authorization string(必選) 請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。 |
X-DashScope-Async string (必選) 非同步處理配置參數。HTTP請求只支援非同步,必須設定為enable。
重要 缺少此要求標頭將報錯:“current user api does not support synchronous calls”。 |
請求體(Request Body) |
多圖參考model string (必選) 模型名稱。樣本值:wan2.1-vace-plus。 input object (必選) 輸入的基本資料,如提示詞等。 屬性 prompt string (必選) 提示詞,用來描述產生視頻中期望包含的元素和視覺特點。 支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。 提示詞技巧請參見文生視頻/圖生視頻Prompt指南。 function string (必選) 功能名稱。多圖參考設定為image_reference。 多圖參考支援最多3張參考圖。映像內容可以包括主體與背景,例如人物、動物、服飾、情境等。使用 prompt 描述期望產生的視頻畫面內容,模型可將多張圖片融合產生連貫的視頻內容。 ref_images_url array[string] (必選) 輸入參考映像的URL 數組。 URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 參考映像支援 1-3 張映像,若超過 3 張,則僅保留前 3 張作為輸入。 映像限制: 使用建議: | parameters object (可選) 視頻處理參數,如設定浮水印等。 屬性 obj_or_bg array[string] (可選) 該參數用於標識每張參考映像的用途,與 ref_images_url 參數一一對應。數組中每個元素表示對應位置的映像為“主體”還是“背景”: 使用說明: 樣本值: ["obj", "obj", "bg"]。 size string (可選) 產生視頻的解析度(寬*高)。目前支援產生720P 視頻,解析度的取值為: duration integer (可選) 視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。 prompt_extend bool (可選) 是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。 true(預設值):開啟智能改寫。
false:關閉智能改寫。
seed integer (可選) 隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。 如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。 watermark bool (可選) 是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。 false(預設值):不添加浮水印。
true:添加浮水印。
|
視頻重繪model string (必選) 模型名稱。樣本值:wan2.1-vace-plus。 input object (必選) 輸入的基本資料,如提示詞等。 屬性 prompt string (必選) 提示詞,用來描述產生視頻中期望包含的元素和視覺特點。 支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。 提示詞技巧請參見文生視頻/圖生視頻Prompt指南。 function string (必選) 功能名稱。視頻重繪設定為 video_repainting。 視頻重繪支援從輸入視頻中提取主體姿態與動作、構圖與運動輪廓以及線稿結構,結合文本提示詞(prompt),產生具有相同動態特徵的新視頻。同時,還支援通過參考映像替換原視頻中的主體,例如更換角色形象但仍保留原有動作。 video_url string (必選) 輸入視頻的URL地址。 URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 視頻限制: 視頻格式:MP4。 視訊框架率:大於等於16FPS。 視頻大小:不超過50MB。 視頻長度:不超過5秒,否則取視頻的前5秒。 URL地址中不能包含中文字元。
關於輸出視頻的解析度: 關於輸出視頻的時間長度: ref_images_url array[string] (可選) 輸入參考映像的 URL數組。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 僅支援傳入1張參考映像,且該映像建議為主體映像,用於替換輸入視頻中的主體內容。 映像限制: 使用建議: | parameters object (必選) 視頻處理參數,如設定浮水印等。 屬性 control_condition string (必選) 設定視頻特徵提取的方式。 strength float (可選) 調節 control_condition 所指定的視頻特徵提取方式對產生視頻的控制強度。 預設值為1.0,取值範圍[0.0, 1.0]。 數值越大,產生視頻越貼近原視頻動作和構圖;數值越小,產生內容越自由。 prompt_extend bool (可選) 是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。 true(預設值):開啟智能改寫。
false:關閉智能改寫。(推薦)
當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。 seed integer (可選) 隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。 如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。 watermark bool (可選) 是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。 false(預設值):不添加浮水印。
true:添加浮水印。
|
局部編輯model string (必選) 模型名稱。樣本值:wan2.1-vace-plus。 input object (必選) 輸入的基本資料,如提示詞等。 屬性 prompt string (必選) 提示詞,用來描述產生視頻中期望包含的元素和視覺特點。 支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。 提示詞技巧請參見文生視頻/圖生視頻Prompt指南。 function string (必選) 功能名稱。局部編輯設定為 video_edit。 局部編輯支援對輸入視頻的指定地區進行增加、修改或刪除元素,還可以對編輯地區的主體或背景進行替換,實現精細化的視頻編輯。 video_url string (必選) 輸入視頻的URL地址。 URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 視頻限制: 視頻格式:MP4。 視訊框架率:大於等於16FPS。 視頻大小:不超過50MB。 視頻長度:不超過5秒,否則取視頻的前5秒。 URL地址中不能包含中文字元。
關於輸出視頻的解析度: 關於輸出視頻的時間長度: ref_images_url array[string] (可選) 輸入參考映像的URL數組。 URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 當前僅支援傳入 1 張 參考映像 ,該映像可作為主體或背景使用,用於替換輸入視頻中的對應內容。 映像限制: 使用建議: mask_image_url string (可選) 掩碼映像的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 該參數用於指定視頻的編輯地區。與 mask_video_url 參數二選一填寫,推薦優先使用此參數 。 掩碼映像的白色地區(像素值嚴格為 [255, 255, 255])表示需要編輯的部分;黑色地區(像素值嚴格為 [0, 0, 0])表示保留不變的地區。 映像限制: mask_frame_id integer (可選) 當 mask_image_url 不為空白時,該參數生效,用於標識掩碼目標出現在視頻中的哪一幀,以“幀 ID”表示。 預設值為 1,單位為幀,表示視頻的第一幀(首幀)。 取值範圍為[1, max_frame_id],其中max_frame_id=輸入視訊框架率*輸入視頻時間長度+1。 例如,輸入視頻(video_url)幀率為16FPS,表示每秒 16 幀,視頻時間長度為5秒,因此輸入視頻的總幀數為16*5+1=81,即max_frame_id=81。 mask_video_url string (可選) 掩碼視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 該參數用於指定視頻的編輯地區。與mask_image_url參數,二選一填寫。 掩碼視頻的視頻格式、幀率、解析度、長度需與輸入視頻(video_url)完全一致。 掩碼視頻的白色地區(像素值嚴格為 [255, 255, 255])表示需要編輯的部分;黑色地區(像素值嚴格為 [0, 0, 0])表示保留不變的地區。 | parameters object (可選) 視頻處理參數,如設定浮水印等。 屬性 control_condition string (可選) 設定視頻特徵提取的方式。預設為"",表示不做任何提取。 mask_type string (可選) 當 mask_image_url 不為空白時,該參數生效,用於指定編輯地區的行為方式。 expand_ratio float (可選) 當 mask_type 為 tracking 時,該參數生效,表示對掩碼地區進行向外擴充的比例。 取值範圍為 [0.0, 1.0],預設值為 0.05。推薦使用預設值。 取值越小,掩碼地區越貼合目標物體;取值越大,掩碼地區的擴充範圍越廣。 expand_mode string (可選) 當 mask_type 為 tracking 時,該參數生效,表示掩碼地區的形狀。 演算法會根據選擇的expand_mode,基於輸入的掩碼映像產生對應形狀的掩碼視頻。支援的取值如下: hull(預設值):多邊形模式,表示使用一個多邊形包裹掩碼目標。
bbox:邊界框模式,表示使用一個矩形包裹掩碼目標。
original:原始模式,表示盡量保持與原始掩碼目標的形狀一致。
size string (可選) 產生視頻的解析度(寬*高)。目前支援產生720P 視頻,解析度的取值為: duration integer (可選) 視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。 prompt_extend bool (可選) 是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。 true(預設值):開啟智能改寫。
false:關閉智能改寫。(推薦)
當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。 seed integer (可選) 隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。 如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。 watermark bool (可選) 是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。 false(預設值):不添加浮水印。
true:添加浮水印。
|
視頻延展model string (必選) 模型名稱。樣本值:wan2.1-vace-plus。 input object (必選) 輸入的基本資料,如提示詞等。 屬性 prompt string (必選) 提示詞,用來描述產生視頻中期望包含的元素和視覺特點。 支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。 提示詞技巧請參見文生視頻/圖生視頻Prompt指南。 function string (必選) 功能名稱。視頻延展設定為 video_extension。 視頻延展支援基於映像或視頻產生延續性內容,還支援通過參考視頻提取動態特徵(如動作、構圖等),用於指導產生具有相似運動表現的視頻。 延長後的視頻總時間長度為 5 秒 ,請注意:這是指最終輸出視頻的完整時間長度為 5 秒,而非在原視頻基礎上延長 5 秒。 first_frame_url string (可選) 首幀映像的URL地址。 URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 映像限制: last_frame_url string(可選) 尾幀映像的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 映像限制: first_clip_url string (可選) 首段視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 視頻限制: 關於輸出視頻的解析度: last_clip_url string(可選) 尾段視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 視頻限制: 關於輸出視頻的解析度: video_url string (可選) 輸入視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 該視頻主要用於提取其中的運動特徵,與 first_frame_url 、 last_frame_url 、first_clip_url 、 last_clip_url參數配合使用,以指導產生具有相似運動表現的延展視頻。 視頻限制: | parameters object (可選) 視頻處理參數,如設定輸出視頻的解析度等。 屬性 control_condition string (可選) 設定視頻特徵提取的方式,輸入video_url時必選。預設為"",表示不做任何提取。 duration integer (可選) 視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。 prompt_extend bool (可選) 是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。 true(預設值):開啟智能改寫。
false:關閉智能改寫。(推薦)
當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。 seed integer (可選) 隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。 如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。 watermark bool (可選) 是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。 false(預設值):不添加浮水印。
true:添加浮水印。
|
視頻畫面擴充model string (必選) 模型名稱。樣本值:wan2.1-vace-plus。 input object (必選) 輸入的基本資料,如提示詞等。 屬性 prompt string (必選) 提示詞,用來描述產生視頻中期望包含的元素和視覺特點。 支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。 提示詞技巧請參見文生視頻/圖生視頻Prompt指南。 function string (必選) 功能名稱。視頻畫面擴充設定為 video_outpainting。 視頻畫面擴充支援對視頻在上、下、左、右四個方向按比例擴充。 video_url string (必選) 輸入視頻的URL地址。 URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。 視頻限制: 視頻格式:MP4。 視訊框架率:大於等於16FPS。 視頻大小:不超過50MB。 視頻長度:不超過5秒,否則取視頻的前5秒。 URL地址中不能包含中文字元。
關於輸出視頻的解析度: 關於輸出視頻的時間長度: | parameters object (可選) 視頻處理參數,如設定擴充比例等。 屬性 top_scale float (可選) 視頻畫面置中,向上按比例擴充視頻。 取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。 bottom_scale float (可選) 視頻畫面置中,向下按比例擴充視頻。 取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。 left_scale float (可選) 視頻畫面置中,向左按比例擴充視頻。 取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。 right_scale float (可選) 視頻畫面置中,向右按比例擴充視頻。 取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。 duration integer (可選) 視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。 prompt_extend bool (可選) 是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。 true(預設值):開啟智能改寫。
false:關閉智能改寫。(推薦)
當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。 seed integer (可選) 隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。 如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。 watermark bool (可選) 是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。 false(預設值):不添加浮水印。
true:添加浮水印。
|
|