全部產品
Search
文件中心

Alibaba Cloud Model Studio:萬相-通用視頻編輯API參考

更新時間:Feb 11, 2026

萬相-視頻編輯統一模型支援文本、映像、視頻等多種模態輸入,可執行多種視頻產生與編輯任務。

相關文檔使用指南

適用範圍

為確保調用成功,請務必保證模型、Endpoint URL 和 API Key 均屬於同一地區。跨地區調用將會失敗。

說明

本文的範例程式碼適用於新加坡地區

HTTP調用

視頻編輯統一模型的處理耗時較長(約5-10分鐘),API採用非同步呼叫的方式。整個流程包含 “建立任務 -> 輪詢擷取” 兩個核心步驟,具體如下:

步驟1:建立任務擷取任務ID

新加坡

POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

北京

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

請求參數

多圖參考

新加坡和北京地區的API Key不同,擷取API Key與API Host
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "image_reference",
        "prompt": "視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當她站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下她與大自然的美妙邂逅。",
        "ref_images_url": [
            "http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
            "http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "obj_or_bg": ["obj","bg"],
        "size": "1280*720"
    }
}'

視頻重繪

新加坡和北京地區的API Key不同,擷取API Key與API Host
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_repainting",
        "prompt": "視頻展示了一輛黑色的蒸汽龐克風格汽車,紳士駕駛著,車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素,畫面複古與趣味。",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "control_condition": "depth"
    }
}'

局部編輯

新加坡和北京地區的API Key不同,擷取API Key與API Host
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_edit",
        "prompt": "視頻展示了一家巴黎風情的法式咖啡館,一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯,輕輕啜飲,神情愜意。咖啡館裝飾雅緻,柔和的色調與溫暖燈光映照著獅子所在的地區。",
        "mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
        "mask_frame_id": 1
    },
    "parameters": {
        "prompt_extend": false,
        "mask_type": "tracking",
        "expand_ratio": 0.05
    }
}'

視頻延展

新加坡和北京地區的API Key不同,擷取API Key與API Host
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_extension",
        "prompt": "一隻戴著墨鏡的狗在街道上滑滑板,3D卡通。",
        "first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
    },
    "parameters": {
        "prompt_extend": false
    }
}'

視頻畫面擴充

新加坡和北京地區的API Key不同,擷取API Key與API Host
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_outpainting",
        "prompt": "一位優雅的女士正在激情演奏小提琴,她身後是一支完整的交響樂團。",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "top_scale": 1.5,
        "bottom_scale": 1.5,
        "left_scale": 1.5,
        "right_scale": 1.5
    }
}'
要求標頭(Headers)

Content-Type string (必選)

請求內容類型。此參數必須設定為application/json

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

X-DashScope-Async string (必選)

非同步處理配置參數。HTTP請求只支援非同步,必須設定為enable

重要

缺少此要求標頭將報錯:“current user api does not support synchronous calls”。

請求體(Request Body)

多圖參考

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。多圖參考設定為image_reference

多圖參考支援最多3張參考圖。映像內容可以包括主體與背景,例如人物、動物、服飾、情境等。使用 prompt 描述期望產生的視頻畫面內容,模型可將多張圖片融合產生連貫的視頻內容。

ref_images_url array[string] (必選)

輸入參考映像的URL 數組。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

參考映像支援 1-3 張映像,若超過 3 張,則僅保留前 3 張作為輸入。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬和高範圍在[360, 2000],單位像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

使用建議:

  • 若使用參考映像中的主體時,建議每張映像中僅包含一個主體。背景建議為純色(如白色或單一顏色),以便更好地突出主體。

  • 若使用參考映像的背景時,背景映像最多隻有一張,且背景映像中不包含任何主體對象。

parameters object (可選)

視頻處理參數,如設定浮水印等。

屬性

obj_or_bg array[string] (可選)

該參數用於標識每張參考映像的用途,與 ref_images_url 參數一一對應。數組中每個元素表示對應位置的映像為“主體”還是“背景”:

  • obj:表示該映像作為主體參考。

  • bg:表示該映像作為背景參考 (最多僅允許一個)。

使用說明:

  • 建議傳入該參數,且長度必須與 ref_images_url保持一致,否則將報錯。

  • 僅當 ref_images_url為單元素數組時,可不傳,此時預設值為 ["obj"]

樣本值: ["obj", "obj", "bg"]。

size string (可選)

產生視頻的解析度(寬*高)。目前支援產生720P 視頻,解析度的取值為:

  • 1280*720(預設值):視頻寬高比為16:9。其中,1280代表寬度,720代表高度。

  • 720*1280:視頻寬高比為9:16。

  • 960*960:視頻寬高比為1:1。

  • 832*1088:視頻寬高比為3:4。

  • 1088*832:視頻寬高比為4:3。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

視頻重繪

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。視頻重繪設定為 video_repainting

視頻重繪支援從輸入視頻中提取主體姿態與動作、構圖與運動輪廓以及線稿結構,結合文本提示詞(prompt),產生具有相同動態特徵的新視頻。同時,還支援通過參考映像替換原視頻中的主體,例如更換角色形象但仍保留原有動作。

video_url string (必選)

輸入視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

關於輸出視頻的時間長度:

  • 輸出視頻時間長度與輸入視頻一致,最長不超過 5 秒。

  • 樣本:若輸入視頻為 3 秒,則輸出也為 3 秒;若輸入為 6 秒,則輸出為前 5 秒。

ref_images_url array[string] (可選)

輸入參考映像的 URL數組。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

僅支援傳入1張參考映像,且該映像建議為主體映像,用於替換輸入視頻中的主體內容。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬度和高度範圍為[360, 2000],單位為像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

使用建議:

  • 若使用參考映像中的主體時,建議每張映像僅包含一個主體。背景建議為純色(如白色或單一顏色),以便更好地突出主體。

parameters object (必選)

視頻處理參數,如設定浮水印等。

屬性

control_condition string (必選)

設定視頻特徵提取的方式。

  • posebodyface:提取輸入視頻中主體的臉部表情和肢體動作,適用於需保留主體表情細節的情境。

  • posebody:提取輸入視頻中主體的肢體動作(不含臉部表情),適用於只需要控制主體身體動作的情境。

  • depth:提取輸入視頻的構圖和運動輪廓。

  • scribble:提取輸入視頻的線稿結構。

strength float (可選)

調節 control_condition 所指定的視頻特徵提取方式對產生視頻的控制強度。

預設值為1.0,取值範圍[0.0, 1.0]。

數值越大,產生視頻越貼近原視頻動作和構圖;數值越小,產生內容越自由。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

局部編輯

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。局部編輯設定為 video_edit

局部編輯支援對輸入視頻的指定地區進行增加、修改或刪除元素,還可以對編輯地區的主體或背景進行替換,實現精細化的視頻編輯。

video_url string (必選)

輸入視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

關於輸出視頻的時間長度:

  • 輸出視頻時間長度與輸入視頻一致,最長不超過 5 秒。

  • 樣本:若輸入視頻為 3 秒,則輸出也為 3 秒;若輸入為 6 秒,則輸出為前 5 秒。

ref_images_url array[string] (可選)

輸入參考映像的URL數組。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

當前僅支援傳入 1 張 參考映像 ,該映像可作為主體或背景使用,用於替換輸入視頻中的對應內容。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬度和高度範圍為[360, 2000],單位為像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

使用建議:

  • 若使用參考映像中的主體時,建議每張映像中僅包含一個主體。背景建議為純色(如白色或單一顏色),以便更好地突出主體。

  • 若使用參考映像的背景時,背景映像中不包含任何主體對象。

mask_image_url string (可選)

掩碼映像的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

該參數用於指定視頻的編輯地區。與 mask_video_url 參數二選一填寫,推薦優先使用此參數

掩碼映像的白色地區(像素值嚴格為 [255, 255, 255])表示需要編輯的部分;黑色地區(像素值嚴格為 [0, 0, 0])表示保留不變的地區。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:和輸入視頻(video_url)解析度嚴格相同。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

mask_frame_id integer (可選)

mask_image_url 不為空白時,該參數生效,用於標識掩碼目標出現在視頻中的哪一幀,以“幀 ID”表示。

預設值為 1,單位為幀,表示視頻的第一幀(首幀)。

取值範圍為[1, max_frame_id],其中max_frame_id=輸入視訊框架率*輸入視頻時間長度+1

例如,輸入視頻(video_url)幀率為16FPS,表示每秒 16 幀,視頻時間長度為5秒,因此輸入視頻的總幀數為16*5+1=81,即max_frame_id=81。

mask_video_url string (可選)

掩碼視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

該參數用於指定視頻的編輯地區。與mask_image_url參數,二選一填寫。

掩碼視頻的視頻格式、幀率、解析度、長度需與輸入視頻(video_url)完全一致。

掩碼視頻的白色地區(像素值嚴格為 [255, 255, 255])表示需要編輯的部分;黑色地區(像素值嚴格為 [0, 0, 0])表示保留不變的地區。

parameters object (可選)

視頻處理參數,如設定浮水印等。

屬性

control_condition string (可選)

設定視頻特徵提取的方式。預設為"",表示不做任何提取。

  • posebodyface:提取輸入視頻的主體的臉部表情和肢體動作,適用於主體臉部在畫面中佔比較大、特徵清晰可見的情境。

  • depth:提取輸入視頻的構圖和運動輪廓。

mask_type string (可選)

mask_image_url 不為空白時,該參數生效,用於指定編輯地區的行為方式。

  • tracking(預設值):編輯地區將根據目標物體的運動軌跡動態跟隨,適用於主體運動情境。

  • fixed :編輯地區保持固定不變,不會隨畫面內容變化。

expand_ratio float (可選)

mask_typetracking 時,該參數生效,表示對掩碼地區進行向外擴充的比例。

取值範圍為 [0.0, 1.0],預設值為 0.05。推薦使用預設值。

取值越小,掩碼地區越貼合目標物體;取值越大,掩碼地區的擴充範圍越廣。

expand_mode string (可選)

mask_typetracking 時,該參數生效,表示掩碼地區的形狀。

演算法會根據選擇的expand_mode,基於輸入的掩碼映像產生對應形狀的掩碼視頻。支援的取值如下:

  • hull(預設值):多邊形模式,表示使用一個多邊形包裹掩碼目標。

  • bbox:邊界框模式,表示使用一個矩形包裹掩碼目標。

  • original:原始模式,表示盡量保持與原始掩碼目標的形狀一致。

size string (可選)

產生視頻的解析度(寬*高)。目前支援產生720P 視頻,解析度的取值為:

  • 1280*720(預設值):視頻寬高比為16:9。其中,1280代表寬度,720代表高度。

  • 720*1280:視頻寬高比為9:16。

  • 960*960:視頻寬高比為1:1。

  • 832*1088:視頻寬高比為3:4。

  • 1088*832:視頻寬高比為4:3。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

視頻延展

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。視頻延展設定為 video_extension

視頻延展支援基於映像或視頻產生延續性內容,還支援通過參考視頻提取動態特徵(如動作、構圖等),用於指導產生具有相似運動表現的視頻。

延長後的視頻總時間長度為 5 秒 ,請注意:這是指最終輸出視頻的完整時間長度為 5 秒,而非在原視頻基礎上延長 5 秒。

first_frame_url string (可選)

首幀映像的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬和高範圍在[360, 2000],單位像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

last_frame_url string(可選)

尾幀映像的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬和高範圍在[360, 2000],單位像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

first_clip_url string (可選)

首段視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。當first_clip_urllast_clip_url同時使用時,建議兩個片段的幀率保持一致。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過3秒,否則取視頻的前3秒。若同時填寫first_clip_urllast_clip_url時,兩段視頻的總時間長度不超過3秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

last_clip_url string(可選)

尾段視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。當first_clip_urllast_clip_url同時使用時,建議兩個片段的幀率保持一致。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過3秒,否則取視頻的前3秒。若同時填寫first_clip_urllast_clip_url時,兩段視頻的總時間長度不超過3秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

video_url string (可選)

輸入視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://help-static-aliyun-doc.aliyuncs.com/xxx.mp3。

該視頻主要用於提取其中的運動特徵,與 first_frame_urllast_frame_urlfirst_clip_urllast_clip_url參數配合使用,以指導產生具有相似運動表現的延展視頻。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS,與前後片段保持一致。

  • 視頻解析度:與前後幀、前後片段保持一致。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

parameters object (可選)

視頻處理參數,如設定輸出視頻的解析度等。

屬性

control_condition string (可選)

設定視頻特徵提取的方式,輸入video_url時必選。預設為"",表示不做任何提取。

  • posebodyface:提取輸入視頻的主體的臉部表情和肢體動作。

  • depth:提取輸入視頻的構圖和運動輪廓。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

視頻畫面擴充

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。視頻畫面擴充設定為 video_outpainting

視頻畫面擴充支援對視頻在上、下、左、右四個方向按比例擴充。

video_url string (必選)

輸入視頻的URL地址。

  1. 公網URL:

    • 支援 HTTP 和 HTTPS 協議。

    • 樣本值:https://xxx/xxx.mp3。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

關於輸出視頻的時間長度:

  • 輸出視頻時間長度與輸入視頻一致,最長不超過 5 秒。

  • 樣本:若輸入視頻為 3 秒,則輸出也為 3 秒;若輸入為 6 秒,則輸出為前 5 秒。

parameters object (可選)

視頻處理參數,如設定擴充比例等。

屬性

top_scale float (可選)

視頻畫面置中,向上按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

bottom_scale float (可選)

視頻畫面置中,向下按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

left_scale float (可選)

視頻畫面置中,向左按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

right_scale float (可選)

視頻畫面置中,向右按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

響應參數

成功響應

請儲存 task_id,用於查詢任務狀態與結果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

異常響應

建立任務失敗,請參見錯誤資訊進行解決。

{
    "code": "InvalidApiKey",
    "message": "No API-key provided.",
    "request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

步驟2:根據任務ID查詢結果

新加坡

GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}

北京

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

請求參數

查詢任務結果

{task_id}完整替換為上一步介面返回的task_id的值。

curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
要求標頭(Headers)

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

URL路徑參數(Path parameters)

task_id string(必選)

任務ID。

響應參數

任務執行成功

任務資料(如任務狀態、視頻URL等)僅保留24小時,逾時後會被自動清除。請您務必及時儲存產生的視頻。

{
    "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx",
    "output": {
        "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-05-15 16:14:44.723",
        "scheduled_time": "2025-05-15 16:14:44.750",
        "end_time": "2025-05-15 16:20:09.389",
        "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx",
        "orig_prompt": "視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當女孩站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下女孩與大自然的美妙邂逅。",
        "actual_prompt": "一位身著淺色長裙的女孩從晨霧繚繞的古老森林深處緩緩走出,步伐輕盈如舞。她長發微卷,面容清秀,眼神明亮。鏡頭跟隨她的動作,捕捉每一個靈動瞬間。當她站定,轉身環顧四周蔥鬱林木時,臉上綻放出驚喜與喜悅交織的笑容。陽光透過樹葉灑下斑駁光影,定格這一人與自然和諧共處的美好時刻。畫面風格為清新自然系寫真,中景全景結合,平視視角帶有輕微調動運鏡。"
    },
    "usage": {
        "video_duration": 5,
        "video_ratio": "standard",
        "video_count": 1
    }
}

任務執行失敗

若任務執行失敗,task_status將置為 FAILED,並提供錯誤碼和資訊。請參見錯誤資訊進行解決。

{
    "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d",
    "output": {
        "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010",
        "task_status": "FAILED",
        "code": "InvalidParameter",
        "message": "The size is not match xxxxxx"
    }
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

submit_time string

任務提交時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任務執行時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任務完成時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

video_url string

視頻URL。連結有效期間24小時,可通過此URL下載視頻。輸出視頻格式為mp4(H.264 編碼)。

orig_prompt string

原始的輸入prompt。

actual_prompt string

開啟prompt智能改寫後實際使用的prompt。若不開啟prompt智能改寫,不會返回該欄位。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

usage object

輸出資訊統計。只對成功的結果計數。

屬性

video_duration integer

產生視頻的時間長度,單位為秒。

video_ratio string

產生視頻的比例。固定為standard

video_count integer

產生視頻的數量。

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

使用限制

  • 資料時效:任務task_id和 視頻video_url均只保留 24 小時,到期後將無法查詢或下載。

  • 音頻支援:當前僅支援產生無聲視頻,不支援音訊輸出。如有需要,可通過語音合成產生音頻。

  • 網路訪問配置:視頻連結儲存於阿里雲 OSS,如果業務系統因安全性原則無法訪問外部OSS連結,請將以下 OSS 網域名稱加入網路訪問白名單。

    # OSS網域名稱列表
    dashscope-result-bj.oss-cn-beijing.aliyuncs.com
    dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
    dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
    dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
    dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
    dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
    dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
    dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
    dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
    dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com

錯誤碼

如果模型調用失敗並返回報錯資訊,請參見錯誤資訊進行解決。