全部產品
Search
文件中心

Alibaba Cloud Model Studio:通義萬相-通用視頻編輯API參考

更新時間:Dec 24, 2025

本文介紹通義萬相-視頻編輯統一模型的輸入輸出參數。該模型支援文本、映像、視頻等多種模態輸入,可執行多種視頻產生與編輯任務。

快速入口:通義萬相官網線上體驗

說明

通義萬相官網的功能與API支援的能力可能存在差異,具體以API文檔中列出的能力為準。如有新增功能,API文檔會及時更新,敬請關注。

模型概覽

新加坡地區

模型名稱

計費單價

限流(主帳號與RAM子帳號共用)

免費額度(查看)

任務下發介面RPS限制

同時處理中任務數量

wan2.1-vace-plus

$0.1/秒

2

2

50秒

北京地區

重要

北京地區無免費額度,調用將產生費用,請確認後再操作。

模型名稱

計費單價

限流(主帳號與RAM子帳號共用)

任務下發介面RPS限制

同時處理中任務數量

wanx2.1-vace-plus

$0.100347/秒

2

2

點擊查看計費樣本

費用在免費額度耗盡後開始計算。計費公式為:總費用 = 計費單價 × 視頻產生時間長度 (秒)

  • 假設產生一個視頻,且選擇的是新加坡地區的wan2.1-vace-plus模型。

  • 費用計算:$0.1/秒 × 5秒 = $0.5。

模型效果

模型功能

輸入參考圖

輸入提示詞

輸出視頻

多圖參考

參考圖1(參考主體)

image

參考圖2(參考背景)

image

視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當她站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下她與大自然的美妙邂逅。

輸出視頻

視頻重繪

視頻展示了一輛黑色的蒸汽龐克風格汽車,紳士駕駛著,車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素,畫面複古與趣味

局部編輯

輸入視頻

輸入遮罩映像(白色地區表示編輯地區)

mask

視頻展示了一家巴黎風情的法式咖啡館,一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯,輕輕啜飲,神情愜意。咖啡館裝飾雅緻,柔和的色調與溫暖燈光映照著獅子所在的地區。

根據提示詞修改編輯地區的內容

視頻延展

輸入首片段視頻(1秒)

一隻戴著墨鏡的狗在街道上滑滑板,3D卡通。

輸出延長後的視頻(5秒)

視頻畫面擴充

一位優雅的女士正在激情演奏小提琴,她身後是一支完整的交響樂團

前提條件

您需要已擷取與配置 API Key配置API Key到環境變數(準備下線,併入配置 API Key)

重要

北京和新加坡地區擁有獨立的 API Key 請求地址,不可混用,跨地區調用將導致鑒權失敗或服務報錯。

HTTP調用

視頻產生模型處理時間較長,為了避免請求逾時,HTTP調用僅支援非同步擷取模型結果。您需要發起兩個請求:

  1. 建立任務擷取任務ID:首先發起建立工作要求,該請求會返回任務ID(task_id)。

  2. 根據任務ID查詢結果:使用上一步獲得的任務ID,查詢任務狀態及結果。任務成功執行時將返回視頻URL,有效期間24小時。

說明

建立任務後,該任務將被加入到排隊隊列,等待調度執行。後續需要調用“根據任務ID查詢結果介面”擷取任務狀態及結果。

視頻編輯統一模型的處理耗時較長(約5-10分鐘),具體耗時受限於排隊任務數量和服務執行情況,請您在擷取結果時耐心等待。

步驟1:建立任務擷取任務ID

POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

如果使用華北2(北京)地區的模型,需要將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

請求參數

多圖參考

新加坡和北京地區的API Key不同,擷取與配置 API Key
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "image_reference",
        "prompt": "視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當她站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下她與大自然的美妙邂逅。",
        "ref_images_url": [
            "http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
            "http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "obj_or_bg": ["obj","bg"],
        "size": "1280*720"
    }
}'

視頻重繪

新加坡和北京地區的API Key不同,擷取與配置 API Key
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_repainting",
        "prompt": "視頻展示了一輛黑色的蒸汽龐克風格汽車,紳士駕駛著,車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素,畫面複古與趣味。",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "control_condition": "depth"
    }
}'

局部編輯

新加坡和北京地區的API Key不同,擷取與配置 API Key
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_edit",
        "prompt": "視頻展示了一家巴黎風情的法式咖啡館,一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯,輕輕啜飲,神情愜意。咖啡館裝飾雅緻,柔和的色調與溫暖燈光映照著獅子所在的地區。",
        "mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
        "mask_frame_id": 1
    },
    "parameters": {
        "prompt_extend": false,
        "mask_type": "tracking",
        "expand_ratio": 0.05
    }
}'

視頻延展

新加坡和北京地區的API Key不同,擷取與配置 API Key
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_extension",
        "prompt": "一隻戴著墨鏡的狗在街道上滑滑板,3D卡通。",
        "first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
    },
    "parameters": {
        "prompt_extend": false
    }
}'

視頻畫面擴充

新加坡和北京地區的API Key不同,擷取與配置 API Key
以下為新加坡地區url,若使用北京地區的模型,需將url替換為:https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "wan2.1-vace-plus",
    "input": {
        "function": "video_outpainting",
        "prompt": "一位優雅的女士正在激情演奏小提琴,她身後是一支完整的交響樂團。",
        "video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
    },
    "parameters": {
        "prompt_extend": false,
        "top_scale": 1.5,
        "bottom_scale": 1.5,
        "left_scale": 1.5,
        "right_scale": 1.5
    }
}'
要求標頭(Headers)

Content-Type string (必選)

請求內容類型。此參數必須設定為application/json

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

X-DashScope-Async string (必選)

非同步處理配置參數。HTTP請求只支援非同步,必須設定為enable

重要

缺少此要求標頭將報錯:“current user api does not support synchronous calls”。

請求體(Request Body)

多圖參考

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。多圖參考設定為image_reference

多圖參考支援最多3張參考圖。映像內容可以包括主體與背景,例如人物、動物、服飾、情境等。使用 prompt 描述期望產生的視頻畫面內容,模型可將多張圖片融合產生連貫的視頻內容。

ref_images_url array[string] (必選)

輸入參考映像的URL 數組。

URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

參考映像支援 1-3 張映像,若超過 3 張,則僅保留前 3 張作為輸入。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬和高範圍在[360, 2000],單位像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

使用建議:

  • 若使用參考映像中的主體時,建議每張映像中僅包含一個主體。背景建議為純色(如白色或單一顏色),以便更好地突出主體。

  • 若使用參考映像的背景時,背景映像最多隻有一張,且背景映像中不包含任何主體對象。

parameters object (可選)

視頻處理參數,如設定浮水印等。

屬性

obj_or_bg array[string] (可選)

該參數用於標識每張參考映像的用途,與 ref_images_url 參數一一對應。數組中每個元素表示對應位置的映像為“主體”還是“背景”:

  • obj:表示該映像作為主體參考。

  • bg:表示該映像作為背景參考 (最多僅允許一個)。

使用說明:

  • 建議傳入該參數,且長度必須與 ref_images_url保持一致,否則將報錯。

  • 僅當 ref_images_url為單元素數組時,可不傳,此時預設值為 ["obj"]

樣本值: ["obj", "obj", "bg"]。

size string (可選)

產生視頻的解析度(寬*高)。目前支援產生720P 視頻,解析度的取值為:

  • 1280*720(預設值):視頻寬高比為16:9。其中,1280代表寬度,720代表高度。

  • 720*1280:視頻寬高比為9:16。

  • 960*960:視頻寬高比為1:1。

  • 832*1088:視頻寬高比為3:4。

  • 1088*832:視頻寬高比為4:3。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

視頻重繪

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。視頻重繪設定為 video_repainting

視頻重繪支援從輸入視頻中提取主體姿態與動作、構圖與運動輪廓以及線稿結構,結合文本提示詞(prompt),產生具有相同動態特徵的新視頻。同時,還支援通過參考映像替換原視頻中的主體,例如更換角色形象但仍保留原有動作。

video_url string (必選)

輸入視頻的URL地址。

URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

關於輸出視頻的時間長度:

  • 輸出視頻時間長度與輸入視頻一致,最長不超過 5 秒。

  • 樣本:若輸入視頻為 3 秒,則輸出也為 3 秒;若輸入為 6 秒,則輸出為前 5 秒。

ref_images_url array[string] (可選)

輸入參考映像的 URL數組。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

僅支援傳入1張參考映像,且該映像建議為主體映像,用於替換輸入視頻中的主體內容。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬度和高度範圍為[360, 2000],單位為像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

使用建議:

  • 若使用參考映像中的主體時,建議每張映像僅包含一個主體。背景建議為純色(如白色或單一顏色),以便更好地突出主體。

parameters object (必選)

視頻處理參數,如設定浮水印等。

屬性

control_condition string (必選)

設定視頻特徵提取的方式。

  • posebodyface:提取輸入視頻中主體的臉部表情和肢體動作,適用於需保留主體表情細節的情境。

  • posebody:提取輸入視頻中主體的肢體動作(不含臉部表情),適用於只需要控制主體身體動作的情境。

  • depth:提取輸入視頻的構圖和運動輪廓。

  • scribble:提取輸入視頻的線稿結構。

strength float (可選)

調節 control_condition 所指定的視頻特徵提取方式對產生視頻的控制強度。

預設值為1.0,取值範圍[0.0, 1.0]。

數值越大,產生視頻越貼近原視頻動作和構圖;數值越小,產生內容越自由。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

局部編輯

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。局部編輯設定為 video_edit

局部編輯支援對輸入視頻的指定地區進行增加、修改或刪除元素,還可以對編輯地區的主體或背景進行替換,實現精細化的視頻編輯。

video_url string (必選)

輸入視頻的URL地址。

URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

關於輸出視頻的時間長度:

  • 輸出視頻時間長度與輸入視頻一致,最長不超過 5 秒。

  • 樣本:若輸入視頻為 3 秒,則輸出也為 3 秒;若輸入為 6 秒,則輸出為前 5 秒。

ref_images_url array[string] (可選)

輸入參考映像的URL數組。

URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

當前僅支援傳入 1 張 參考映像 ,該映像可作為主體或背景使用,用於替換輸入視頻中的對應內容。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬度和高度範圍為[360, 2000],單位為像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

使用建議:

  • 若使用參考映像中的主體時,建議每張映像中僅包含一個主體。背景建議為純色(如白色或單一顏色),以便更好地突出主體。

  • 若使用參考映像的背景時,背景映像中不包含任何主體對象。

mask_image_url string (可選)

掩碼映像的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

該參數用於指定視頻的編輯地區。與 mask_video_url 參數二選一填寫,推薦優先使用此參數

掩碼映像的白色地區(像素值嚴格為 [255, 255, 255])表示需要編輯的部分;黑色地區(像素值嚴格為 [0, 0, 0])表示保留不變的地區。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:和輸入視頻(video_url)解析度嚴格相同。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

mask_frame_id integer (可選)

mask_image_url 不為空白時,該參數生效,用於標識掩碼目標出現在視頻中的哪一幀,以“幀 ID”表示。

預設值為 1,單位為幀,表示視頻的第一幀(首幀)。

取值範圍為[1, max_frame_id],其中max_frame_id=輸入視訊框架率*輸入視頻時間長度+1

例如,輸入視頻(video_url)幀率為16FPS,表示每秒 16 幀,視頻時間長度為5秒,因此輸入視頻的總幀數為16*5+1=81,即max_frame_id=81。

mask_video_url string (可選)

掩碼視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

該參數用於指定視頻的編輯地區。與mask_image_url參數,二選一填寫。

掩碼視頻的視頻格式、幀率、解析度、長度需與輸入視頻(video_url)完全一致。

掩碼視頻的白色地區(像素值嚴格為 [255, 255, 255])表示需要編輯的部分;黑色地區(像素值嚴格為 [0, 0, 0])表示保留不變的地區。

parameters object (可選)

視頻處理參數,如設定浮水印等。

屬性

control_condition string (可選)

設定視頻特徵提取的方式。預設為"",表示不做任何提取。

  • posebodyface:提取輸入視頻的主體的臉部表情和肢體動作,適用於主體臉部在畫面中佔比較大、特徵清晰可見的情境。

  • depth:提取輸入視頻的構圖和運動輪廓。

mask_type string (可選)

mask_image_url 不為空白時,該參數生效,用於指定編輯地區的行為方式。

  • tracking(預設值):編輯地區將根據目標物體的運動軌跡動態跟隨,適用於主體運動情境。

  • fixed :編輯地區保持固定不變,不會隨畫面內容變化。

expand_ratio float (可選)

mask_typetracking 時,該參數生效,表示對掩碼地區進行向外擴充的比例。

取值範圍為 [0.0, 1.0],預設值為 0.05。推薦使用預設值。

取值越小,掩碼地區越貼合目標物體;取值越大,掩碼地區的擴充範圍越廣。

expand_mode string (可選)

mask_typetracking 時,該參數生效,表示掩碼地區的形狀。

演算法會根據選擇的expand_mode,基於輸入的掩碼映像產生對應形狀的掩碼視頻。支援的取值如下:

  • hull(預設值):多邊形模式,表示使用一個多邊形包裹掩碼目標。

  • bbox:邊界框模式,表示使用一個矩形包裹掩碼目標。

  • original:原始模式,表示盡量保持與原始掩碼目標的形狀一致。

size string (可選)

產生視頻的解析度(寬*高)。目前支援產生720P 視頻,解析度的取值為:

  • 1280*720(預設值):視頻寬高比為16:9。其中,1280代表寬度,720代表高度。

  • 720*1280:視頻寬高比為9:16。

  • 960*960:視頻寬高比為1:1。

  • 832*1088:視頻寬高比為3:4。

  • 1088*832:視頻寬高比為4:3。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

視頻延展

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。視頻延展設定為 video_extension

視頻延展支援基於映像或視頻產生延續性內容,還支援通過參考視頻提取動態特徵(如動作、構圖等),用於指導產生具有相似運動表現的視頻。

延長後的視頻總時間長度為 5 秒 ,請注意:這是指最終輸出視頻的完整時間長度為 5 秒,而非在原視頻基礎上延長 5 秒。

first_frame_url string (可選)

首幀映像的URL地址。

URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬和高範圍在[360, 2000],單位像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

last_frame_url string(可選)

尾幀映像的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

映像限制:

  • 映像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP。

  • 映像解析度:映像的寬和高範圍在[360, 2000],單位像素。

  • 映像大小:不超過10MB。

  • URL地址中不能包含中文字元。

first_clip_url string (可選)

首段視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。當first_clip_urllast_clip_url同時使用時,建議兩個片段的幀率保持一致。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過3秒,否則取視頻的前3秒。若同時填寫first_clip_urllast_clip_url時,兩段視頻的總時間長度不超過3秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

last_clip_url string(可選)

尾段視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。當first_clip_urllast_clip_url同時使用時,建議兩個片段的幀率保持一致。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過3秒,否則取視頻的前3秒。若同時填寫first_clip_urllast_clip_url時,兩段視頻的總時間長度不超過3秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

video_url string (可選)

輸入視頻的URL地址。URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

該視頻主要用於提取其中的運動特徵,與 first_frame_urllast_frame_urlfirst_clip_urllast_clip_url參數配合使用,以指導產生具有相似運動表現的延展視頻。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS,與前後片段保持一致。

  • 視頻解析度:與前後幀、前後片段保持一致。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

parameters object (可選)

視頻處理參數,如設定輸出視頻的解析度等。

屬性

control_condition string (可選)

設定視頻特徵提取的方式,輸入video_url時必選。預設為"",表示不做任何提取。

  • posebodyface:提取輸入視頻的主體的臉部表情和肢體動作。

  • depth:提取輸入視頻的構圖和運動輪廓。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

視頻畫面擴充

model string (必選)

模型名稱。樣本值:wan2.1-vace-plus

input object (必選)

輸入的基本資料,如提示詞等。

屬性

prompt string (必選)

提示詞,用來描述產生視頻中期望包含的元素和視覺特點。

支援中英文,長度不超過800個字元,每個漢字/字母佔一個字元,超過部分會自動截斷。

提示詞技巧請參見文生視頻/圖生視頻Prompt指南

function string (必選)

功能名稱。視頻畫面擴充設定為 video_outpainting

視頻畫面擴充支援對視頻在上、下、左、右四個方向按比例擴充。

video_url string (必選)

輸入視頻的URL地址。

URL 需為公網可訪問地址,支援 HTTP 或 HTTPS 協議。

視頻限制:

  • 視頻格式:MP4。

  • 視訊框架率:大於等於16FPS。

  • 視頻大小:不超過50MB。

  • 視頻長度:不超過5秒,否則取視頻的前5秒。

  • URL地址中不能包含中文字元。

關於輸出視頻的解析度:

  • 若輸入視頻解析度 ≤ 720P,輸出將保留原生解析度;

  • 若輸入視頻解析度 > 720P,則在保持原視頻寬高比的前提下,按比例縮放至不超過 720P。

關於輸出視頻的時間長度:

  • 輸出視頻時間長度與輸入視頻一致,最長不超過 5 秒。

  • 樣本:若輸入視頻為 3 秒,則輸出也為 3 秒;若輸入為 6 秒,則輸出為前 5 秒。

parameters object (可選)

視頻處理參數,如設定擴充比例等。

屬性

top_scale float (可選)

視頻畫面置中,向上按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

bottom_scale float (可選)

視頻畫面置中,向下按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

left_scale float (可選)

視頻畫面置中,向左按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

right_scale float (可選)

視頻畫面置中,向右按比例擴充視頻。

取值範圍為[1.0, 2.0],預設值為1.0,表示不擴充。

duration integer (可選)

視頻產生時間長度,單位為秒。當前參數值固定為5,且不支援修改。模型將始終產生5秒時間長度的視頻。

prompt_extend bool (可選)

是否開啟prompt智能改寫。開啟後使用大模型對輸入prompt進行智能改寫。對於較短的prompt產生效果提升明顯,但會增加耗時。

  • true(預設值):開啟智能改寫。

  • false:關閉智能改寫。(推薦)

當文本描述與輸入的視頻內容不一致時,模型可能產生誤解。建議手動關閉智能擴寫,並在 prompt 中提供清晰、具體的畫面描述,以提升產生一致性與準確性。

seed integer (可選)

隨機數種子,用於控制模型產生內容的隨機性。seed參數取值範圍是[0, 2147483647]

如果不提供,則演算法自動產生一個隨機數作為種子。如果您希望產生內容保持相對穩定,請使用相同的seed參數值。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案為“AI產生”。

  • false(預設值):不添加浮水印。

  • true:添加浮水印。

響應參數

成功響應

請儲存 task_id,用於查詢任務狀態與結果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

異常響應

建立任務失敗,請參見錯誤資訊進行解決。

{
    "code":"InvalidApiKey",
    "message":"Invalid API-key provided.",
    "request_id":"fb53c4ec-1c12-4fc4-a580-xxxxxx"
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

步驟2:根據任務ID查詢結果

新加坡地區GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}

北京地區GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

請求參數

查詢任務結果

請將86ecf553-d340-4e21-xxxxxxxxx替換為真實的task_id。

新加坡和北京地區的API Key不同。擷取與配置 API Key
以下為新加坡地區base_url,若使用北京地區的模型,需將base_url替換為https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx
curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
要求標頭(Headers)

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

URL路徑參數(Path parameters)

task_id string(必選)

任務ID。

響應參數

任務執行成功

任務資料(如任務狀態、視頻URL等)僅保留24小時,逾時後會被自動清除。請您務必及時儲存產生的視頻。

{
    "request_id": "851985d0-fbba-9d8d-a17a-xxxxxx",
    "output": {
        "task_id": "208e2fd1-fcb4-4adf-9fcc-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-05-15 16:14:44.723",
        "scheduled_time": "2025-05-15 16:14:44.750",
        "end_time": "2025-05-15 16:20:09.389",
        "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx",
        "orig_prompt": "視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當女孩站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下女孩與大自然的美妙邂逅。",
        "actual_prompt": "一位身著淺色長裙的女孩從晨霧繚繞的古老森林深處緩緩走出,步伐輕盈如舞。她長發微卷,面容清秀,眼神明亮。鏡頭跟隨她的動作,捕捉每一個靈動瞬間。當她站定,轉身環顧四周蔥鬱林木時,臉上綻放出驚喜與喜悅交織的笑容。陽光透過樹葉灑下斑駁光影,定格這一人與自然和諧共處的美好時刻。畫面風格為清新自然系寫真,中景全景結合,平視視角帶有輕微調動運鏡。"
    },
    "usage": {
        "video_duration": 5,
        "video_ratio": "standard",
        "video_count": 1
    }
}

任務執行失敗

若任務執行失敗,task_status將置為 FAILED,並提供錯誤碼和資訊。請參見錯誤資訊進行解決。

{
    "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d",
    "output": {
        "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010",
        "task_status": "FAILED",
        "code": "InvalidParameter",
        "message": "The size is not match xxxxxx"
    }
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

submit_time string

任務提交時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任務執行時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任務完成時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

video_url string

視頻URL。連結有效期間24小時,可通過此URL下載視頻。輸出視頻格式為mp4(H.264 編碼)。

orig_prompt string

原始的輸入prompt。

actual_prompt string

開啟prompt智能改寫後實際使用的prompt。若不開啟prompt智能改寫,不會返回該欄位。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

usage object

輸出資訊統計。只對成功的結果計數。

屬性

video_duration integer

產生視頻的時間長度,單位為秒。

video_ratio string

產生視頻的比例。固定為standard

video_count integer

產生視頻的數量。

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

計費與限流

錯誤碼

如果模型調用失敗並返回報錯資訊,請參見錯誤資訊進行解決。

此API還有特定狀態代碼,具體如下所示。

HTTP狀態代碼

介面錯誤碼(code)

介面錯誤資訊(message)

含義說明

200

InvalidParameter

ref_images_url and obj_or_bg must be the same length

使用多圖參考功能時,請確保ref_images_urlobj_or_bg的數組長度一致。

400

InvalidParameter

InvalidParameter

請求參數不合法。

400

IPInfringementSuspect

Input data is suspected of being involved in IP infringement.

輸入資料(如提示詞或映像)涉嫌智慧財產權侵權。請檢查輸入,確保不包含引發侵權風險的內容。

400

DataInspectionFailed

Input data may contain inappropriate content.

輸入資料(如提示詞或映像)可能包含敏感內容。請修改輸入後重試。

500

InternalError

InternalError

服務異常。請先嘗試重試,排除偶發情況。

視頻訪問配置

佈建網域名白名單:確保業務系統可訪問視頻連結

模型產生的視頻儲存於阿里雲OSS,每個視頻會被分配一個OSS連結,如https://dashscope-result-xx.oss-cn-xxxx.aliyuncs.com/xxx.mp4。OSS連結允許公開訪問,您可以使用此連結下載視頻,連結僅在 24 小時內有效。

特別注意的是,如果您的業務對安全性要求較高,無法訪問阿里雲OSS連結,您需要單獨配置外網訪問白名單。請將以下網域名稱添加到您的白名單中,以便順利訪問視頻連結。

# OSS網域名稱列表
dashscope-result-bj.oss-cn-beijing.aliyuncs.com
dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com