萬相-視頻編輯（2.1）

萬相2.1-視頻編輯統一模型支援文本、映像、視頻等多種模態輸入，可執行多種視頻產生與編輯任務。

相關文檔：使用指南

適用範圍

為確保調用成功，請務必保證模型、Endpoint URL 和 API Key 均屬於同一地區。跨地區調用將會失敗。

選擇模型：確認模型所屬的地區。
選擇 URL：選擇對應的地區 Endpoint URL，支援HTTP URL。
配置 API Key：選擇地區並擷取API Key，再配置API Key到環境變數。

說明

本文的範例程式碼適用於新加坡地區。

重要

新加坡地區的舊版網域名稱 https://dashscope-intl.aliyuncs.com 即將下線，請及時遷移到新版網域名稱 https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com。

HTTP調用

視頻編輯統一模型的處理耗時較長（約5-10分鐘），API採用非同步呼叫的方式。整個流程包含 “建立任務 -> 輪詢擷取” 兩個核心步驟，具體如下：

步驟1：建立任務擷取任務ID

新加坡

POST https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

調用時請將WorkspaceId替換為真實的Workspace ID。

北京

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

請求參數

多圖參考

新加坡和北京地區的API Key不同，擷取API Key

以下為新加坡地區URL，調用時請將WorkspaceId替換為真實的業務空間ID，各地區的URL不同。

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "image_reference",
        "prompt": "視頻中，一位女孩自晨霧繚繞的古老森林深處款款走出，她步伐輕盈，鏡頭捕捉她每一個靈動瞬間。當她站定，環顧四周蔥鬱林木時，她臉上綻放出驚喜與喜悅交織的笑容。這一幕，定格在了光影交錯的瞬間，記錄下她與大自然的美妙邂逅。",
        "ref_images_url": [
            "http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
            "http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "obj_or_bg": ["obj","bg"],
        "size": "1280*720"
    }
}'

視頻重繪

新加坡和北京地區的API Key不同，擷取API Key

以下為新加坡地區URL，調用時請將WorkspaceId替換為真實的業務空間ID，各地區的URL不同。

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_repainting",
        "prompt": "視頻展示了一輛黑色的蒸汽龐克風格汽車，紳士駕駛著，車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素，畫面複古與趣味。",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "control_condition": "depth"
    }
}'

局部編輯

新加坡和北京地區的API Key不同，擷取API Key

以下為新加坡地區URL，調用時請將WorkspaceId替換為真實的業務空間ID，各地區的URL不同。

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_edit",
        "prompt": "視頻展示了一家巴黎風情的法式咖啡館，一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯，輕輕啜飲，神情愜意。咖啡館裝飾雅緻，柔和的色調與溫暖燈光映照著獅子所在的地區。",
        "mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
        "mask_frame_id": 1
    },
    "parameters": {
        "prompt_extend": false,
        "mask_type": "tracking",
        "expand_ratio": 0.05
    }
}'

視頻延展

新加坡和北京地區的API Key不同，擷取API Key

以下為新加坡地區URL，調用時請將WorkspaceId替換為真實的業務空間ID，各地區的URL不同。

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_extension",
        "prompt": "一隻戴著墨鏡的狗在街道上滑滑板，3D卡通。",
        "first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
    },
    "parameters": {
        "prompt_extend": false
    }
}'

視頻畫面擴充

新加坡和北京地區的API Key不同，擷取API Key

以下為新加坡地區URL，調用時請將WorkspaceId替換為真實的業務空間ID，各地區的URL不同。

curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_outpainting",
        "prompt": "一位優雅的女士正在激情演奏小提琴，她身後是一支完整的交響樂團。",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "top_scale": 1.5,
        "bottom_scale": 1.5,
        "left_scale": 1.5,
        "right_scale": 1.5
    }
}'

要求標頭（Headers）

Content-Type string （必選）

請求內容類型。此參數必須設定為application/json。

Authorization string（必選）

請求身份認證。介面使用阿里雲百鍊API Key進行身份認證。樣本值：Bearer sk-xxxx。

X-DashScope-Async string （必選）

非同步處理配置參數。HTTP請求只支援非同步，必須設定為enable。

重要

缺少此要求標頭將報錯：“current user api does not support synchronous calls”。

請求體（Request Body）

多圖參考

model string （必選）

模型名稱。樣本值：wan2.1-vace-plus。

input object （必選）

輸入的基本資料，如提示詞等。

屬性

prompt string （必選）

提示詞，用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文，長度不超過800個字元，每個漢字/字母佔一個字元，超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南。

function string （必選）

功能名稱。多圖參考設定為image_reference。

多圖參考支援最多3張參考圖。映像內容可以包括主體與背景，例如人物、動物、服飾、情境等。使用 prompt 描述期望產生的視頻畫面內容，模型可將多張圖片融合產生連貫的視頻內容。

ref_images_url array[string] （必選）

輸入參考映像的URL 數組。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

參考映像支援 1-3 張映像，若超過 3 張，則僅保留前 3 張作為輸入。

映像限制：

映像格式：JPG、JPEG、PNG、BMP、TIFF、WEBP。
映像解析度：映像的寬和高範圍在[360, 2000]，單位像素。
映像大小：不超過10MB。
URL地址中不能包含中文字元。

使用建議：

若使用參考映像中的主體時，建議每張映像中僅包含一個主體。背景建議為純色（如白色或單一顏色），以便更好地突出主體。
若使用參考映像的背景時，背景映像最多隻有一張，且背景映像中不包含任何主體對象。

parameters object （可選）

視頻處理參數，如設定浮水印等。

屬性

obj_or_bg array[string] （可選）

該參數用於標識每張參考映像的用途，與 ref_images_url 參數一一對應。數組中每個元素表示對應位置的映像為“主體”還是“背景”：

obj：表示該映像作為主體參考。
bg：表示該映像作為背景參考（最多僅允許一個）。

使用說明：

建議傳入該參數，且長度必須與 ref_images_url保持一致，否則將報錯。
僅當 ref_images_url為單元素數組時，可不傳，此時預設值為 ["obj"]。

樣本值： ["obj", "obj", "bg"]。

size string （可選）

產生視頻的解析度（寬*高）。目前支援產生720P 視頻，解析度的取值為：

1280*720（預設值）：視頻寬高比為16:9。其中，1280代表寬度，720代表高度。
720*1280：視頻寬高比為9:16。
960*960：視頻寬高比為1:1。
832*1088：視頻寬高比為3:4。
1088*832：視頻寬高比為4:3。

duration integer （可選）

視頻產生時間長度，單位為秒。當前參數值固定為5，且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool （可選）

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯，但會增加耗時。

true（預設值）：開啟智能改寫。
false：關閉智能改寫。

seed integer （可選）

隨機數種子，用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。

如果不提供，則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定，請使用相同的seed參數值。

watermark bool （可選）

是否添加浮水印標識，浮水印位於圖片右下角，文案為“AI產生”。

false（預設值）：不添加浮水印。
true：添加浮水印。

視頻重繪

model string （必選）

模型名稱。樣本值：wan2.1-vace-plus。

input object （必選）

輸入的基本資料，如提示詞等。

屬性

prompt string （必選）

提示詞，用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文，長度不超過800個字元，每個漢字/字母佔一個字元，超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南。

function string （必選）

功能名稱。視頻重繪設定為 video_repainting。

視頻重繪支援從輸入視頻中提取主體姿態與動作、構圖與運動輪廓以及線稿結構，結合文本提示詞（prompt），產生具有相同動態特徵的新視頻。同時，還支援通過參考映像替換原視頻中的主體，例如更換角色形象但仍保留原有動作。

video_url string （必選）

輸入視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

視頻限制：

視頻格式：MP4。
視訊框架率：大於等於16FPS。
視頻大小：不超過50MB。
視頻長度：不超過5秒，否則取視頻的前5秒。
URL地址中不能包含中文字元。

關於輸出視頻的解析度：

若輸入視頻解析度 ≤ 720P，輸出將保留原生解析度；
若輸入視頻解析度 > 720P，則在保持原視頻寬高比的前提下，按比例縮放至不超過 720P。

關於輸出視頻的時間長度：

輸出視頻時間長度與輸入視頻一致，最長不超過 5 秒。
樣本：若輸入視頻為 3 秒，則輸出也為 3 秒；若輸入為 6 秒，則輸出為前 5 秒。

ref_images_url array[string] （可選）

輸入參考映像的 URL數組。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

僅支援傳入1張參考映像，且該映像建議為主體映像，用於替換輸入視頻中的主體內容。

映像限制：

映像格式：JPG、JPEG、PNG、BMP、TIFF、WEBP。
映像解析度：映像的寬度和高度範圍為[360, 2000]，單位為像素。
映像大小：不超過10MB。
URL地址中不能包含中文字元。

使用建議：

若使用參考映像中的主體時，建議每張映像僅包含一個主體。背景建議為純色（如白色或單一顏色），以便更好地突出主體。

parameters object （必選）

視頻處理參數，如設定浮水印等。

屬性

control_condition string （必選）

設定視頻特徵提取的方式。

posebodyface：提取輸入視頻中主體的臉部表情和肢體動作，適用於需保留主體表情細節的情境。
posebody：提取輸入視頻中主體的肢體動作（不含臉部表情），適用於只需要控制主體身體動作的情境。
depth：提取輸入視頻的構圖和運動輪廓。
scribble：提取輸入視頻的線稿結構。

strength float （可選）

調節 control_condition 所指定的視頻特徵提取方式對產生視頻的控制強度。

預設值為1.0，取值範圍[0.0, 1.0]。

數值越大，產生視頻越貼近原視頻動作和構圖；數值越小，產生內容越自由。

prompt_extend bool （可選）

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯，但會增加耗時。

true（預設值）：開啟智能改寫。
false：關閉智能改寫。（推薦）

當文本描述與輸入的視頻內容不一致時，模型可能產生誤解。建議手動關閉智能擴寫，並在 prompt 中提供清晰、具體的畫面描述，以提升產生一致性與準確性。

seed integer （可選）

隨機數種子，用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。

如果不提供，則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定，請使用相同的seed參數值。

watermark bool （可選）

是否添加浮水印標識，浮水印位於圖片右下角，文案為“AI產生”。

false（預設值）：不添加浮水印。
true：添加浮水印。

局部編輯

model string （必選）

模型名稱。樣本值：wan2.1-vace-plus。

input object （必選）

輸入的基本資料，如提示詞等。

屬性

prompt string （必選）

提示詞，用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文，長度不超過800個字元，每個漢字/字母佔一個字元，超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南。

function string （必選）

功能名稱。局部編輯設定為 video_edit。

局部編輯支援對輸入視頻的指定地區進行增加、修改或刪除元素，還可以對編輯地區的主體或背景進行替換，實現精細化的視頻編輯。

video_url string （必選）

輸入視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

視頻限制：

視頻格式：MP4。
視訊框架率：大於等於16FPS。
視頻大小：不超過50MB。
視頻長度：不超過5秒，否則取視頻的前5秒。
URL地址中不能包含中文字元。

關於輸出視頻的解析度：

若輸入視頻解析度 ≤ 720P，輸出將保留原生解析度；
若輸入視頻解析度 > 720P，則在保持原視頻寬高比的前提下，按比例縮放至不超過 720P。

關於輸出視頻的時間長度：

輸出視頻時間長度與輸入視頻一致，最長不超過 5 秒。
樣本：若輸入視頻為 3 秒，則輸出也為 3 秒；若輸入為 6 秒，則輸出為前 5 秒。

ref_images_url array[string] （可選）

輸入參考映像的URL數組。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

當前僅支援傳入 1 張 參考映像，該映像可作為主體或背景使用，用於替換輸入視頻中的對應內容。

映像限制：

映像格式：JPG、JPEG、PNG、BMP、TIFF、WEBP。
映像解析度：映像的寬度和高度範圍為[360, 2000]，單位為像素。
映像大小：不超過10MB。
URL地址中不能包含中文字元。

使用建議：

若使用參考映像中的主體時，建議每張映像中僅包含一個主體。背景建議為純色（如白色或單一顏色），以便更好地突出主體。
若使用參考映像的背景時，背景映像中不包含任何主體對象。

mask_image_url string （可選）

掩碼映像的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

該參數用於指定視頻的編輯地區。與 mask_video_url 參數二選一填寫，推薦優先使用此參數 。

掩碼映像的白色地區（像素值嚴格為 [255, 255, 255]）表示需要編輯的部分；黑色地區（像素值嚴格為 [0, 0, 0]）表示保留不變的地區。

映像限制：

映像格式：JPG、JPEG、PNG、BMP、TIFF、WEBP。
映像解析度：和輸入視頻（video_url）解析度嚴格相同。
映像大小：不超過10MB。
URL地址中不能包含中文字元。

mask_frame_id integer （可選）

當 mask_image_url 不為空白時，該參數生效，用於標識掩碼目標出現在視頻中的哪一幀，以“幀 ID”表示。

預設值為 1，單位為幀，表示視頻的第一幀（首幀）。

取值範圍為[1, max_frame_id]，其中max_frame_id=輸入視訊框架率*輸入視頻時間長度+1。

例如，輸入視頻（video_url）幀率為16FPS，表示每秒 16 幀，視頻時間長度為5秒，因此輸入視頻的總幀數為16*5+1=81，即max_frame_id=81。

mask_video_url string （可選）

掩碼視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

該參數用於指定視頻的編輯地區。與mask_image_url參數，二選一填寫。

掩碼視頻的視頻格式、幀率、解析度、長度需與輸入視頻（video_url）完全一致。

掩碼視頻的白色地區（像素值嚴格為 [255, 255, 255]）表示需要編輯的部分；黑色地區（像素值嚴格為 [0, 0, 0]）表示保留不變的地區。

parameters object （可選）

視頻處理參數，如設定浮水印等。

屬性

control_condition string （可選）

設定視頻特徵提取的方式。預設為""，表示不做任何提取。

posebodyface：提取輸入視頻的主體的臉部表情和肢體動作，適用於主體臉部在畫面中佔比較大、特徵清晰可見的情境。
depth：提取輸入視頻的構圖和運動輪廓。

mask_type string （可選）

當 mask_image_url 不為空白時，該參數生效，用於指定編輯地區的行為方式。

tracking（預設值）：編輯地區將根據目標物體的運動軌跡動態跟隨，適用於主體運動情境。
fixed ：編輯地區保持固定不變，不會隨畫面內容變化。

expand_ratio float （可選）

當 mask_type 為 tracking 時，該參數生效，表示對掩碼地區進行向外擴充的比例。

取值範圍為 [0.0, 1.0]，預設值為 0.05。推薦使用預設值。

取值越小，掩碼地區越貼合目標物體；取值越大，掩碼地區的擴充範圍越廣。

expand_mode string （可選）

當 mask_type 為 tracking 時，該參數生效，表示掩碼地區的形狀。

演算法會根據選擇的expand_mode，基於輸入的掩碼映像產生對應形狀的掩碼視頻。支援的取值如下：

hull（預設值）：多邊形模式，表示使用一個多邊形包裹掩碼目標。
bbox：邊界框模式，表示使用一個矩形包裹掩碼目標。
original：原始模式，表示盡量保持與原始掩碼目標的形狀一致。

size string （可選）

產生視頻的解析度（寬*高）。目前支援產生720P 視頻，解析度的取值為：

1280*720（預設值）：視頻寬高比為16:9。其中，1280代表寬度，720代表高度。
720*1280：視頻寬高比為9:16。
960*960：視頻寬高比為1:1。
832*1088：視頻寬高比為3:4。
1088*832：視頻寬高比為4:3。

duration integer （可選）

視頻產生時間長度，單位為秒。當前參數值固定為5，且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool （可選）

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯，但會增加耗時。

true（預設值）：開啟智能改寫。
false：關閉智能改寫。（推薦）

當文本描述與輸入的視頻內容不一致時，模型可能產生誤解。建議手動關閉智能擴寫，並在 prompt 中提供清晰、具體的畫面描述，以提升產生一致性與準確性。

seed integer （可選）

隨機數種子，用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。

如果不提供，則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定，請使用相同的seed參數值。

watermark bool （可選）

是否添加浮水印標識，浮水印位於圖片右下角，文案為“AI產生”。

false（預設值）：不添加浮水印。
true：添加浮水印。

視頻延展

model string （必選）

模型名稱。樣本值：wan2.1-vace-plus。

input object （必選）

輸入的基本資料，如提示詞等。

屬性

prompt string （必選）

提示詞，用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文，長度不超過800個字元，每個漢字/字母佔一個字元，超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南。

function string （必選）

功能名稱。視頻延展設定為 video_extension。

視頻延展支援基於映像或視頻產生延續性內容，還支援通過參考視頻提取動態特徵（如動作、構圖等），用於指導產生具有相似運動表現的視頻。

延長後的視頻總時間長度為 5 秒，請注意：這是指最終輸出視頻的完整時間長度為 5 秒，而非在原視頻基礎上延長 5 秒。

first_frame_url string （可選）

首幀映像的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

映像限制：

映像格式：JPG、JPEG、PNG、BMP、TIFF、WEBP。
映像解析度：映像的寬和高範圍在[360, 2000]，單位像素。
映像大小：不超過10MB。
URL地址中不能包含中文字元。

last_frame_url string（可選）

尾幀映像的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

映像限制：

映像格式：JPG、JPEG、PNG、BMP、TIFF、WEBP。
映像解析度：映像的寬和高範圍在[360, 2000]，單位像素。
映像大小：不超過10MB。
URL地址中不能包含中文字元。

first_clip_url string （可選）

首段視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

視頻限制：

視頻格式：MP4。
視訊框架率：大於等於16FPS。當first_clip_url和last_clip_url同時使用時，建議兩個片段的幀率保持一致。
視頻大小：不超過50MB。
視頻長度：不超過3秒，否則取視頻的前3秒。若同時填寫first_clip_url和last_clip_url時，兩段視頻的總時間長度不超過3秒。
URL地址中不能包含中文字元。

關於輸出視頻的解析度：

若輸入視頻解析度 ≤ 720P，輸出將保留原生解析度；
若輸入視頻解析度 > 720P，則在保持原視頻寬高比的前提下，按比例縮放至不超過 720P。

last_clip_url string（可選）

尾段視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3。

視頻限制：

視頻格式：MP4。
視訊框架率：大於等於16FPS。當first_clip_url和last_clip_url同時使用時，建議兩個片段的幀率保持一致。
視頻大小：不超過50MB。
視頻長度：不超過3秒，否則取視頻的前3秒。若同時填寫first_clip_url和last_clip_url時，兩段視頻的總時間長度不超過3秒。
URL地址中不能包含中文字元。

關於輸出視頻的解析度：

若輸入視頻解析度 ≤ 720P，輸出將保留原生解析度；
若輸入視頻解析度 > 720P，則在保持原視頻寬高比的前提下，按比例縮放至不超過 720P。

video_url string （可選）

輸入視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3。

該視頻主要用於提取其中的運動特徵，與 first_frame_url 、 last_frame_url 、first_clip_url 、 last_clip_url參數配合使用，以指導產生具有相似運動表現的延展視頻。

視頻限制：

視頻格式：MP4。
視訊框架率：大於等於16FPS，與前後片段保持一致。
視頻解析度：與前後幀、前後片段保持一致。
視頻大小：不超過50MB。
視頻長度：不超過5秒，否則取視頻的前5秒。
URL地址中不能包含中文字元。

parameters object （可選）

視頻處理參數，如設定輸出視頻的解析度等。

屬性

control_condition string （可選）

設定視頻特徵提取的方式，輸入video_url時必選。預設為""，表示不做任何提取。

posebodyface：提取輸入視頻的主體的臉部表情和肢體動作。
depth：提取輸入視頻的構圖和運動輪廓。

duration integer （可選）

視頻產生時間長度，單位為秒。當前參數值固定為5，且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool （可選）

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯，但會增加耗時。

true（預設值）：開啟智能改寫。
false：關閉智能改寫。（推薦）

當文本描述與輸入的視頻內容不一致時，模型可能產生誤解。建議手動關閉智能擴寫，並在 prompt 中提供清晰、具體的畫面描述，以提升產生一致性與準確性。

seed integer （可選）

隨機數種子，用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。

如果不提供，則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定，請使用相同的seed參數值。

watermark bool （可選）

是否添加浮水印標識，浮水印位於圖片右下角，文案為“AI產生”。

false（預設值）：不添加浮水印。
true：添加浮水印。

視頻畫面擴充

model string （必選）

模型名稱。樣本值：wan2.1-vace-plus。

input object （必選）

輸入的基本資料，如提示詞等。

屬性

prompt string （必選）

提示詞，用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文，長度不超過800個字元，每個漢字/字母佔一個字元，超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南。

function string （必選）

功能名稱。視頻畫面擴充設定為 video_outpainting。

視頻畫面擴充支援對視頻在上、下、左、右四個方向按比例擴充。

video_url string （必選）

輸入視頻的URL地址。

公網URL：
- 支援 HTTP 和 HTTPS 協議。
- 樣本值：https://xxx/xxx.mp3。

視頻限制：

視頻格式：MP4。
視訊框架率：大於等於16FPS。
視頻大小：不超過50MB。
視頻長度：不超過5秒，否則取視頻的前5秒。
URL地址中不能包含中文字元。

關於輸出視頻的解析度：

若輸入視頻解析度 ≤ 720P，輸出將保留原生解析度；
若輸入視頻解析度 > 720P，則在保持原視頻寬高比的前提下，按比例縮放至不超過 720P。

關於輸出視頻的時間長度：

輸出視頻時間長度與輸入視頻一致，最長不超過 5 秒。
樣本：若輸入視頻為 3 秒，則輸出也為 3 秒；若輸入為 6 秒，則輸出為前 5 秒。

parameters object （可選）

視頻處理參數，如設定擴充比例等。

屬性

top_scale float （可選）

視頻畫面置中，向上按比例擴充視頻。

取值範圍為[1.0, 2.0]，預設值為1.0，表示不擴充。

bottom_scale float （可選）

視頻畫面置中，向下按比例擴充視頻。

取值範圍為[1.0, 2.0]，預設值為1.0，表示不擴充。

left_scale float （可選）

視頻畫面置中，向左按比例擴充視頻。

取值範圍為[1.0, 2.0]，預設值為1.0，表示不擴充。

right_scale float （可選）

視頻畫面置中，向右按比例擴充視頻。

取值範圍為[1.0, 2.0]，預設值為1.0，表示不擴充。

duration integer （可選）

視頻產生時間長度，單位為秒。當前參數值固定為5，且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool （可選）

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯，但會增加耗時。

true（預設值）：開啟智能改寫。
false：關閉智能改寫。（推薦）

當文本描述與輸入的視頻內容不一致時，模型可能產生誤解。建議手動關閉智能擴寫，並在 prompt 中提供清晰、具體的畫面描述，以提升產生一致性與準確性。

seed integer （可選）

隨機數種子，用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]。

如果不提供，則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定，請使用相同的seed參數值。

watermark bool （可選）

是否添加浮水印標識，浮水印位於圖片右下角，文案為“AI產生”。

false（預設值）：不添加浮水印。
true：添加浮水印。

響應參數	成功響應請儲存 task_id，用於查詢任務狀態與結果。 `{ "output": { "task_status": "PENDING", "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx" }, "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx" }` 異常響應建立任務失敗，請參見錯誤碼進行解決。 `{ "code": "InvalidApiKey", "message": "No API-key provided.", "request_id": "7438d53d-6eb8-4596-8835-xxxxxx" }`
output `object` 任務輸出資訊。屬性 task_id `string` 任務ID。查詢有效期間24小時。 task_status `string` 任務狀態。枚舉值 PENDING：任務排隊中 RUNNING：任務處理中 SUCCEEDED：任務執行成功 FAILED：任務執行失敗 CANCELED：任務已取消 UNKNOWN：任務不存在或狀態未知
request_id `string` 請求唯一標識。可用於請求明細溯源和問題排查。
code `string` 請求失敗的錯誤碼。請求成功時不會返回此參數，詳情請參見錯誤碼。
message `string` 請求失敗的詳細資料。請求成功時不會返回此參數，詳情請參見錯誤碼。

步驟2：根據任務ID查詢結果

新加坡

GET https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/tasks/{task_id}

調用時請將WorkspaceId替換為真實的Workspace ID。

北京

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

請求參數	查詢任務結果將`{task_id}`完整替換為上一步介面返回的`task_id`的值。`task_id`查詢有效期間為24小時。 `curl -X GET https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/tasks/{task_id} \ --header "Authorization: Bearer $DASHSCOPE_API_KEY"`
要求標頭（Headers）
Authorization `string`（必選）請求身份認證。介面使用阿里雲百鍊API Key進行身份認證。樣本值：Bearer sk-xxxx。
URL路徑參數（Path parameters）
task_id `string`（必選）任務ID。

響應參數	任務執行成功任務資料（如任務狀態、視頻URL等）僅保留24小時，逾時後會被自動清除。請您務必及時儲存產生的視頻。 { "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx", "output": { "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx", "task_status": "SUCCEEDED", "submit_time": "2025-05-15 16:14:44.723", "scheduled_time": "2025-05-15 16:14:44.750", "end_time": "2025-05-15 16:20:09.389", "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx", "orig_prompt": "視頻中，一位女孩自晨霧繚繞的古老森林深處款款走出，她步伐輕盈，鏡頭捕捉她每一個靈動瞬間。當女孩站定，環顧四周蔥鬱林木時，她臉上綻放出驚喜與喜悅交織的笑容。這一幕，定格在了光影交錯的瞬間，記錄下女孩與大自然的美妙邂逅。", "actual_prompt": "一位身著淺色長裙的女孩從晨霧繚繞的古老森林深處緩緩走出，步伐輕盈如舞。她長發微卷，面容清秀，眼神明亮。鏡頭跟隨她的動作，捕捉每一個靈動瞬間。當她站定，轉身環顧四周蔥鬱林木時，臉上綻放出驚喜與喜悅交織的笑容。陽光透過樹葉灑下斑駁光影，定格這一人與自然和諧共處的美好時刻。畫面風格為清新自然系寫真，中景全景結合，平視視角帶有輕微調動運鏡。" }, "usage": { "video_duration": 5, "video_ratio": "standard", "video_count": 1 } } 任務執行失敗若任務執行失敗，task_status將置為 FAILED，並提供錯誤碼和資訊。請參見錯誤碼進行解決。 `{ "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d", "output": { "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010", "task_status": "FAILED", "code": "InvalidParameter", "message": "The size is not match xxxxxx" } }`
output `object` 任務輸出資訊。屬性 task_id `string` 任務ID。查詢有效期間24小時。 task_status `string` 任務狀態。枚舉值 PENDING：任務排隊中 RUNNING：任務處理中 SUCCEEDED：任務執行成功 FAILED：任務執行失敗 CANCELED：任務已取消 UNKNOWN：任務不存在或狀態未知 submit_time `string` 任務提交時間。時區為UTC+8，格式為 YYYY-MM-DD HH:mm:ss.SSS。 scheduled_time `string` 任務執行時間。時區為UTC+8，格式為 YYYY-MM-DD HH:mm:ss.SSS。 end_time `string` 任務完成時間。時區為UTC+8，格式為 YYYY-MM-DD HH:mm:ss.SSS。 video_url `string` 視頻URL。連結有效期間24小時，可通過此URL下載視頻。輸出視頻格式為mp4（H.264 編碼）。 orig_prompt `string` 原始的輸入prompt。 actual_prompt `string` 開啟prompt智能改寫後實際使用的prompt。若不開啟prompt智能改寫，不會返回該欄位。 code `string` 請求失敗的錯誤碼。請求成功時不會返回此參數，詳情請參見錯誤碼。 message `string` 請求失敗的詳細資料。請求成功時不會返回此參數，詳情請參見錯誤碼。
usage `object` 輸出資訊統計。只對成功的結果計數。屬性 video_duration `integer` 產生視頻的時間長度，單位為秒。 video_ratio `string` 產生視頻的比例。固定為`standard`。 video_count `integer` 產生視頻的數量。
request_id `string` 請求唯一標識。可用於請求明細溯源和問題排查。

使用限制

資料時效：任務task_id和視頻video_url均只保留 24 小時，到期後將無法查詢或下載。
音頻支援：當前僅支援產生無聲視頻，不支援音訊輸出。如有需要，可通過語音合成產生音頻。

錯誤碼

如果模型調用失敗並返回報錯資訊，請參見錯誤碼進行解決。

常見問題

Q：如何擷取視頻儲存的訪問網域名稱白名單？

A：模型產生的視頻儲存於阿里雲OSS，API將返回一個臨時的公網URL。若需要對該下載地址進行防火牆白名單配置，請注意：由於底層儲存會根據業務情況進行動態變更，為避免到期資訊影響訪問，文檔不提供固定的OSS網域名稱白名單。如有安全管控需求，請聯絡客戶經理擷取最新OSS網域名稱列表。

響應參數	任務執行成功任務資料（如任務狀態、視頻URL等）僅保留24小時，逾時後會被自動清除。請您務必及時儲存產生的視頻。 { "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx", "output": { "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx", "task_status": "SUCCEEDED", "submit_time": "2025-05-15 16:14:44.723", "scheduled_time": "2025-05-15 16:14:44.750", "end_time": "2025-05-15 16:20:09.389", "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx", "orig_prompt": "視頻中，一位女孩自晨霧繚繞的古老森林深處款款走出，她步伐輕盈，鏡頭捕捉她每一個靈動瞬間。當女孩站定，環顧四周蔥鬱林木時，她臉上綻放出驚喜與喜悅交織的笑容。這一幕，定格在了光影交錯的瞬間，記錄下女孩與大自然的美妙邂逅。", "actual_prompt": "一位身著淺色長裙的女孩從晨霧繚繞的古老森林深處緩緩走出，步伐輕盈如舞。她長發微卷，面容清秀，眼神明亮。鏡頭跟隨她的動作，捕捉每一個靈動瞬間。當她站定，轉身環顧四周蔥鬱林木時，臉上綻放出驚喜與喜悅交織的笑容。陽光透過樹葉灑下斑駁光影，定格這一人與自然和諧共處的美好時刻。畫面風格為清新自然系寫真，中景全景結合，平視視角帶有輕微調動運鏡。" }, "usage": { "video_duration": 5, "video_ratio": "standard", "video_count": 1 } } 任務執行失敗若任務執行失敗，task_status將置為 FAILED，並提供錯誤碼和資訊。請參見錯誤碼進行解決。 `{ "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d", "output": { "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010", "task_status": "FAILED", "code": "InvalidParameter", "message": "The size is not match xxxxxx" } }`
output `object` 任務輸出資訊。屬性 task_id `string` 任務ID。查詢有效期間24小時。 task_status `string` 任務狀態。枚舉值 PENDING：任務排隊中 RUNNING：任務處理中 SUCCEEDED：任務執行成功 FAILED：任務執行失敗 CANCELED：任務已取消 UNKNOWN：任務不存在或狀態未知 submit_time `string` 任務提交時間。時區為UTC+8，格式為 YYYY-MM-DD HH:mm:ss.SSS。 scheduled_time `string` 任務執行時間。時區為UTC+8，格式為 YYYY-MM-DD HH:mm:ss.SSS。 end_time `string` 任務完成時間。時區為UTC+8，格式為 YYYY-MM-DD HH:mm:ss.SSS。 video_url `string` 視頻URL。連結有效期間24小時，可通過此URL下載視頻。輸出視頻格式為mp4（H.264 編碼）。 orig_prompt `string` 原始的輸入prompt。 actual_prompt `string` 開啟prompt智能改寫後實際使用的prompt。若不開啟prompt智能改寫，不會返回該欄位。 code `string` 請求失敗的錯誤碼。請求成功時不會返回此參數，詳情請參見錯誤碼。 message `string` 請求失敗的詳細資料。請求成功時不會返回此參數，詳情請參見錯誤碼。
usage `object` 輸出資訊統計。只對成功的結果計數。屬性 video_duration `integer` 產生視頻的時間長度，單位為秒。 video_ratio `string` 產生視頻的比例。固定為`standard`。 video_count `integer` 產生視頻的數量。
request_id `string` 請求唯一標識。可用於請求明細溯源和問題排查。

適用範圍

HTTP調用

步驟1：建立任務擷取任務ID

新加坡

北京

請求參數

多圖參考

視頻重繪

局部編輯

視頻延展

視頻畫面擴充

要求標頭（Headers）

請求體（Request Body）

多圖參考

視頻重繪

局部編輯

視頻延展

視頻畫面擴充

響應參數

成功響應

異常響應

步驟2：根據任務ID查詢結果

新加坡

北京

請求參數

查詢任務結果

要求標頭（Headers）

URL路徑參數（Path parameters）

響應參數

任務執行成功

任務執行失敗

使用限制

錯誤碼

常見問題

Q：如何擷取視頻儲存的訪問網域名稱白名單？