全部產品
Search
文件中心

Alibaba Cloud Model Studio:通義萬相-映像產生與編輯2.6 API參考

更新時間:Dec 24, 2025

通義萬相映像產生模型支援影像編輯圖文混排輸出,滿足多樣化產生與整合需求。

模型概覽

模型名稱

模型簡介

輸出映像規格

wan2.6-image

萬相2.6 image

支援影像編輯和圖文混排輸出

圖片格式:PNG。

映像解析度和尺寸請參見size參數

說明

調用前,請查閱各地區支援的模型列表與價格

前提條件

您需要已擷取與配置 API Key配置API Key到環境變數(準備下線,併入配置 API Key)

重要

北京和新加坡地區擁有獨立的 API Key 請求地址,不可混用,跨地區調用將導致鑒權失敗或服務報錯。

HTTP同步調用

一次請求即可獲得結果,流程簡單,推薦大多數情境使用。

新加坡地區POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation

北京地區POST https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation

請求參數

影像編輯

curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--data '{
    "model": "wan2.6-image",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "參考圖1的風格和圖2的背景,產生番茄炒蛋"
                    },
                    {
                        "image": "https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png"
                    },
                    {
                        "image": "https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "watermark": false,
        "n": 1,
        "enable_interleave": false,
        "size": "1280*1280"
    }
}'

圖文混排(僅支援流式)

同步介面在啟用圖文混排輸出(即 parameters.enable_interleave = true)時,僅支援流式輸出,必須同時滿足以下兩項配置:

  • 設定X-DashScope-Sseenable

  • 設定parameters.streamtrue

curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Sse: enable' \
--data '{
    "model": "wan2.6-image",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "給我一個3張圖辣椒炒肉教程"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "max_images": 3,
        "size": "1280*1280",
        "stream": true,
        "enable_interleave":true
    }
}'
要求標頭(Headers)

Content-Type string (必選)

請求內容類型。此參數必須設定為application/json

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

X-DashScope-Sse string(可選)

用於啟用流式輸出。

  • 僅當 parameters.enable_interleave=true 時,必須將該欄位設為 enable

  • 其他情況下可不傳或忽略。

請求體(Request Body)

model string (必選)

模型名稱。

樣本值:wan2.6-image。

input object (必選)

輸入的基本資料。

屬性

messages array (必選)

請求內容數組。當前僅支援單輪對話,即傳入一組role、content參數,不支援多輪對話。

屬性

role string (必選)

訊息的角色。此參數固定設定為user

content array (必選)

訊息內容數組。

屬性

text string (必選)

正向提示詞用於描述您期望產生的映像內容、風格和構圖。

支援中英文,長度不超過2000個字元,每個漢字、字母、數字或符號計為一個字元,超過部分會自動截斷。

樣本值:參考這個風格的圖片,產生番茄炒蛋。

注意:僅支援傳入一個text,不傳或傳入多個將報錯。

image string (可選)

輸入映像的URL或Base64編碼字串。

映像限制:

  • 映像格式:JPEG、JPG、PNG(不支援透明通道)、BMP、WEBP。

  • 映像解析度:映像的寬高範圍均為[384, 5000]像素。

  • 檔案大小:不超過10MB。

映像數量限制:

  • 輸入映像數量與parameters.enable_interleave參數有關。

    • enable_interleave=true時(圖文混排輸出),可輸入0~1張映像。

    • enable_interleave=false時(影像編輯),必須輸入1~4張映像。

  • 當輸入多張映像時,需在content數組中傳入多個image對象,並按照數組順序定義映像順序。

支援的輸入格式:

  1. 使用公網可訪問URL

    • 支援 HTTP 或 HTTPS 協議。

    • 樣本值:http://wanx.alicdn.com/material/xxx.jpeg

  2. 傳入 Base 64 編碼映像後的字串

    • 格式:data:{MIME_type};base64,{base64_data}

    • 樣本:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...(僅示意,實際需傳入完整字串)

    • Base 64 編碼規範請參見映像傳入方式

parameters object (可選)

影像處理參數。

屬性

negative_prompt string (可選)

反向提示詞,用於描述不希望在映像中出現的內容,對畫面進行限制。

支援中英文,長度不超過500個字元,超出部分將自動截斷。

樣本值:低解析度、錯誤、最差品質、低品質、殘缺、多餘的手指、比例不良等。

size string (可選)

輸出映像的解析度,格式為寬*高

  • wan2.6-image:預設值為 1280*1280。總像素在 [768*768, 1280*1280] (即589824 至 1638400像素點)之間,且寬高比範圍為 [1:4, 4:1]。例如,768*2700符合要求。

樣本值:1280*1280。

常見比例推薦的解析度

  • 1:1:1280*1280 或 1024*1024

  • 2:3:800*1200

  • 3:2:1200*800

  • 3:4:960*1280

  • 4:3:1280*960

  • 9:16:720*1280

  • 16:9:1280*720

  • 21:9:1344*576

輸出映像尺寸的規則

方式一:指定 size 參數:輸出映像嚴格按 size 指定的寬高產生。

方式二:未指定 size:輸出映像由 總像素上限 和 寬高比規則 共同決定。系統會根據總像素並安裝寬高比規則對映像進行處理後輸出。

  • 總像素規則:由 enable_interleave 控制。

    • enable_interleave=true 時:

      • 若輸入映像總像素 ≤ 1280*1280,輸出總像素與輸入一致;

      • 若輸入映像總像素 > 1280*1280,輸出總像素固定為 1280*1280。

    • enable_interleave=false 時:輸出總像素固定為 1280*1280。

  • 寬高比規則(近似):

    • 單圖輸入:輸出寬高比與輸入映像一致;

    • 多圖輸入:輸出寬高比與最後一張輸入映像一致。

樣本:當 enable_interleave=true 且輸入 1 張 720*720 的映像時,輸出映像為 720*720,寬高比與輸入一致。

enable_interleave bool (可選)

控制生圖模式:

  • false:預設值,表示影像編輯模式(支援多圖輸入及主體一致性產生)。

    • 用途:基於1~4張輸入映像進行編輯、風格遷移或主體一致性產生。

    • 輸入:必須提供至少1張參考映像。

    • 輸出:可產生1至4張結果映像。

  • true :表示啟用圖文混排輸出模式(僅支援傳入一張映像或不傳映像)。

    • 用途:根據文本描述產生圖文並茂的內容,或進行純文字產生映像(文生圖)。

    • 輸入:可以不提供映像(文生圖),或提供最多1張參考映像。

    • 輸出:固定產生1個包含文本和映像的混合內容塊。

n integer (可選)

重要

n直接影響費用。費用 = 單價 × 成功產生的圖片張數,請在調用前確認模型價格

指定產生圖片的數量。該參數的取值範圍與含義取決於 enable_interleave(模式開關)的狀態:

  • enable_interleave=false(影像編輯模式):

    • 作用:直接控制產生映像的數量。

    • 取值範圍:1~4,預設值為 4。

    • 建議在測試階段將此值設定為 1,以便低成本驗證效果。

  • enable_interleave=true(圖文混排模式):

    • 限制:此參數預設為1,且必須固定為1。若設定為其他值,介面將報錯。

    • 說明:在此模式下,如需控制產生映像的數量上限,請使用 max_images 參數。

max_images integer (可選)

重要

max_images影響費用。費用 = 單價 × 成功產生的圖片張數,請在調用前確認模型價格

僅在圖文混排模式(即 enable_interleave=true)下生效。

  • 作用:指定模型在單次回複中產生映像的最大數量

  • 取值範圍:1~5,預設值為 5。

  • 注意:該參數僅代表“數量上限”。實際產生的映像數量由模型推理決定,可能會少於設定值(例如:設定為 5,模型可能根據內容僅產生 3 張)。

prompt_extend bool (可選)

僅在影像編輯模式(即enable_interleave = false)下生效。

是否開啟 Prompt(提示詞)智能改寫功能。該功能僅對正向提示詞進行最佳化與潤色,不會改變負向提示詞。

  • true:預設值,開啟智能改寫。

  • false:關閉智能改寫,使用原始提示詞。

stream bool (可選)

僅在映像混排模式(即 enable_interleave = true)下生效。

控制返回結果是否為流式輸出。

  • false:預設值,非流式輸出。

  • true:流式輸出。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案固定為“AI產生”。

  • false:預設值,不添加浮水印。

  • true:添加浮水印。

seed integer (可選)

隨機數種子,取值範圍[0,2147483647]

使用相同的seed參數值可使產生內容保持相對穩定。若不提供,演算法將自動使用隨機數種子。

注意:模型產生過程具有機率性,即使使用相同的seed,也不能保證每次產生結果完全一致。

響應參數

任務執行成功

任務資料(如任務狀態、映像URL等)僅保留24小時,逾時後會被自動清除。請您務必及時儲存產生的映像。

{
    "output": {
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "content": [
                        {
                            "image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx.png?Expires=xxx",
                            "type": "image"
                        }
                    ],
                    "role": "assistant"
                }
            }
        ],
        "finished": true
    },
    "usage": {
        "image_count": 1,
        "input_tokens": 0,
        "output_tokens": 0,
        "size": "1280*1280",
        "total_tokens": 0
    },
    "request_id": "a3f4befe-cacd-49c9-8298-xxxxxx"
}

任務執行成功(流式輸出)

任務資料(如任務狀態、映像URL等)僅保留24小時,逾時後會被自動清除。請您務必及時儲存產生的映像。

{"output":{"choices":[{"message":{"content":[{"type":"text","text":"肉"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":571,"image_count":3,"output_tokens":543,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"香"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":572,"image_count":3,"output_tokens":544,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-fb1f435e34a9"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"交織"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":573,"image_count":3,"output_tokens":545,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
......
{"output":{"choices":[{"message":{"content":[{"type":"image","image":"https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx.png?Expires=xxxx"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":557,"image_count":3,"output_tokens":529,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"趁"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":558,"image_count":3,"output_tokens":530,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"熱"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":559,"image_count":3,"output_tokens":531,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"夾"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":560,"image_count":3,"output_tokens":532,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"起"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":561,"image_count":3,"output_tokens":533,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"一塊"}],"role":"assistant"},"finish_reason":"null"}],"finished":true},"usage":{"total_tokens":562,"image_count":3,"output_tokens":534,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}
{"output":{"choices":[{"message":{"content":[{"type":"text","text":"肉"}],"role":"assistant"},"finish_reason":"stop"}],"finished":true},"usage":{"total_tokens":563,"image_count":3,"output_tokens":535,"size":"1280*1280","input_tokens":28},"request_id":"d2dcb952-bf91-4a6a-aad5-xxxxxx"}

任務執行異常

如果因為某種原因導致任務執行失敗,將返回相關資訊,可以通過code和message欄位明確指示錯誤原因。請參見錯誤資訊進行解決。

{
    "request_id": "a4d78a5f-655f-9639-8437-xxxxxx",
    "code": "InvalidParameter",
    "message": "num_images_per_prompt must be 1"
}

output object

任務輸出資訊。

屬性

choices array of object

模型產生的輸出內容。

屬性

finish_reason string

任務停止原因。

非流式輸出情境:自然停止時為stop

流式輸出情境:當開啟流式輸出時,該參數判斷資料流是否傳輸結束。

  • 傳輸過程中:前序資料包會持續返回 "finish_reason": "null",表示內容仍在產生中,請繼續接收。

  • 傳輸結束時:僅在最後一個 JSON 結構體中返回 "finish_reason":"stop",表示流式請求已全部結束,應停止接收。

message object

模型返回的訊息。

屬性

role string

訊息的角色,固定為assistant

content array

屬性

type string

輸出的類型,枚舉值為text、image。

text string

產生的文字。

image string

產生映像的 URL,映像格式為PNG。

連結有效期間為24小時,請及時下載並儲存映像。

finished bool

請求結束標誌符。

  • true:表示請求結束。

  • false:表示請求未結束。

usage object

輸出資訊統計。只對成功的結果計數。

屬性

image_count integer

產生映像的張數。

size string

產生的映像解析度。樣本值:1328*1328。

input_tokens integer

輸入token數量。按圖片張數計費,當前固定為0。

output_tokens integer

輸出token數量。按圖片張數計費,當前固定為0。

total_tokens integer

總token數量。按圖片張數計費,當前固定為0。

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

HTTP非同步呼叫

由於映像產生任務耗時較長(通常為1-2分鐘),API採用非同步呼叫以避免請求逾時。整個流程包含 “建立任務 -> 輪詢擷取” 兩個核心步驟,具體如下:

具體耗時受限於排隊任務數和服務執行情況,請在擷取結果時耐心等待。

步驟1:建立任務擷取任務ID

新加坡地區POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/image-generation/generation

北京地區POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image-generation/generation

說明
  • 建立成功後,使用介面返回的 task_id 查詢結果,task_id 有效期間為 24 小時。請勿重複建立任務,輪詢擷取即可。

請求參數

影像編輯

curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
    "model": "wan2.6-image",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "參考圖1的風格和圖2的背景,產生番茄炒蛋"
                    },
                    {
                        "image": "https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png"
                    },
                    {
                        "image": "https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "prompt_extend": true,
        "watermark": false,
        "n": 1,
        "enable_interleave": false,
        "size": "1280*1280"
    }
}'

圖文混排輸出

curl --location 'https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
    "model": "wan2.6-image",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "給我一個3張圖辣椒炒肉教程"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "max_images": 3,
        "size": "1280*1280",
        "enable_interleave":true
    }
}'

要求標頭(Headers)

Content-Type string (必選)

請求內容類型。此參數必須設定為application/json

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

X-DashScope-Async string (必選)

非同步處理配置參數。HTTP請求只支援非同步,必須設定為enable

重要

缺少此要求標頭將報錯:“current user api does not support synchronous calls”。

請求體(Request Body)

model string (必選)

模型名稱。

樣本值:wan2.6-image。

input object (必選)

輸入的基本資料。

屬性

messages array (必選)

請求內容數組。當前僅支援單輪對話,即傳入一組role、content參數,不支援多輪對話。

屬性

role string (必選)

訊息的角色。此參數固定設定為user

content array (必選)

訊息內容數組。

屬性

text string (必選)

正向提示詞用於描述您期望產生的映像內容、風格和構圖。

支援中英文,長度不超過2000個字元,每個漢字、字母、數字或符號計為一個字元,超過部分會自動截斷。

樣本值:參考這個風格的圖片,產生番茄炒蛋。

注意:僅支援傳入一個text,不傳或傳入多個將報錯。

image string (可選)

輸入映像的URL或Base64編碼字串。

映像限制:

  • 映像格式:JPEG、JPG、PNG(不支援透明通道)、BMP、WEBP。

  • 映像解析度:映像的寬高範圍均為[384, 5000]像素。

  • 檔案大小:不超過10MB。

映像數量限制:

  • 輸入映像數量與parameters.enable_interleave參數有關。

    • enable_interleave=true時(圖文混排輸出),可輸入0~1張映像。

    • enable_interleave=false時(影像編輯),必須輸入1~4張映像。

  • 當輸入多張映像時,需在content數組中傳入多個image對象,並按照數組順序定義映像順序。

支援的輸入格式:

  1. 使用公網可訪問URL

    • 支援 HTTP 或 HTTPS 協議。

    • 樣本值:http://wanx.alicdn.com/material/xxx.jpeg

  2. 傳入 Base 64 編碼映像後的字串

    • 格式:data:{MIME_type};base64,{base64_data}

    • 樣本:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...(僅示意,實際需傳入完整字串)

    • Base 64 編碼規範請參見映像傳入方式

parameters object (可選)

影像處理參數。

屬性

negative_prompt string (可選)

反向提示詞,用於描述不希望在映像中出現的內容,對畫面進行限制。

支援中英文,長度不超過500個字元,超出部分將自動截斷。

樣本值:低解析度、錯誤、最差品質、低品質、殘缺、多餘的手指、比例不良等。

size string (可選)

輸出映像的解析度,格式為寬*高

  • wan2.6-image:預設值為 1280*1280。總像素在 [768*768, 1280*1280] (即589824 至 1638400像素點)之間,且寬高比範圍為 [1:4, 4:1]。例如,768*2700符合要求。

樣本值:1280*1280。

常見比例推薦的解析度

  • 1:1:1280*1280 或 1024*1024

  • 2:3:800*1200

  • 3:2:1200*800

  • 3:4:960*1280

  • 4:3:1280*960

  • 9:16:720*1280

  • 16:9:1280*720

  • 21:9:1344*576

輸出映像尺寸的規則

方式一:指定 size 參數:輸出映像嚴格按 size 指定的寬高產生。

方式二:未指定 size:輸出映像由 總像素上限 和 寬高比規則 共同決定。系統會根據總像素並安裝寬高比規則對映像進行處理後輸出。

  • 總像素規則:由 enable_interleave 控制。

    • enable_interleave=true 時:

      • 若輸入映像總像素 ≤ 1280*1280,輸出總像素與輸入一致;

      • 若輸入映像總像素 > 1280*1280,輸出總像素固定為 1280*1280。

    • enable_interleave=false 時:輸出總像素固定為 1280*1280。

  • 寬高比規則(近似):

    • 單圖輸入:輸出寬高比與輸入映像一致;

    • 多圖輸入:輸出寬高比與最後一張輸入映像一致。

樣本:當 enable_interleave=true 且輸入 1 張 720*720 的映像時,輸出映像為 720*720,寬高比與輸入一致。

enable_interleave bool (可選)

控制生圖模式:

  • false:預設值,表示影像編輯模式(支援多圖輸入及主體一致性產生)。

    • 用途:基於1~4張輸入映像進行編輯、風格遷移或主體一致性產生。

    • 輸入:必須提供至少1張參考映像。

    • 輸出:可產生1至4張結果映像。

  • true :表示啟用圖文混排輸出模式(僅支援傳入一張映像或不傳映像)。

    • 用途:根據文本描述產生圖文並茂的內容,或進行純文字產生映像(文生圖)。

    • 輸入:可以不提供映像(文生圖),或提供最多1張參考映像。

    • 輸出:固定產生1個包含文本和映像的混合內容塊。

n integer (可選)

重要

n直接影響費用。費用 = 單價 × 成功產生的圖片張數,請在調用前確認模型價格

指定產生圖片的數量。該參數的取值範圍與含義取決於 enable_interleave(模式開關)的狀態:

  • enable_interleave=false(影像編輯模式):

    • 作用:直接控制產生映像的數量。

    • 取值範圍:1~4,預設值為 4。

    • 建議在測試階段將此值設定為 1,以便低成本驗證效果。

  • enable_interleave=true(圖文混排模式):

    • 限制:此參數預設為1,且必須固定為1。若設定為其他值,介面將報錯。

    • 說明:在此模式下,如需控制產生映像的數量上限,請使用 max_images 參數。

max_images integer (可選)

重要

max_images影響費用。費用 = 單價 × 成功產生的圖片張數,請在調用前確認模型價格

僅在圖文混排模式(即 enable_interleave=true)下生效。

  • 作用:指定模型在單次回複中產生映像的最大數量

  • 取值範圍:1~5,預設值為 5。

  • 注意:該參數僅代表“數量上限”。實際產生的映像數量由模型推理決定,可能會少於設定值(例如:設定為 5,模型可能根據內容僅產生 3 張)。

prompt_extend bool (可選)

僅在影像編輯模式(即enable_interleave = false)下生效。

是否開啟 Prompt(提示詞)智能改寫功能。該功能僅對正向提示詞進行最佳化與潤色,不會改變負向提示詞。

  • true:預設值,開啟智能改寫。

  • false:關閉智能改寫,使用原始提示詞。

watermark bool (可選)

是否添加浮水印標識,浮水印位於圖片右下角,文案固定為“AI產生”。

  • false:預設值,不添加浮水印。

  • true:添加浮水印。

seed integer (可選)

隨機數種子,取值範圍[0,2147483647]

使用相同的seed參數值可使產生內容保持相對穩定。若不提供,演算法將自動使用隨機數種子。

注意:模型產生過程具有機率性,即使使用相同的seed,也不能保證每次產生結果完全一致。

響應參數

成功響應

請儲存 task_id,用於查詢任務狀態與結果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

異常響應

建立任務失敗,請參見錯誤資訊進行解決。

{
    "code":"InvalidApiKey",
    "message":"Invalid API-key provided.",
    "request_id":"fb53c4ec-1c12-4fc4-a580-xxxxxx"
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

步驟2:根據任務ID查詢結果

新加坡地區GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}

北京地區GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

說明
  • 輪詢建議:映像產生過程約需數分鐘,建議採用輪詢機制,並設定合理的查詢間隔(如 10 秒)來擷取結果。

  • 任務狀態流轉:PENDING(排隊中)→ RUNNING(處理中)→ SUCCEEDED(成功)/ FAILED(失敗)。

  • 結果連結:任務成功後返回映像連結,有效期間為 24 小時。建議在擷取連結後立即下載並轉存至永久儲存(如阿里雲 OSS)。

請求參數

查詢任務結果

請將86ecf553-d340-4e21-xxxxxxxxx替換為真實的task_id。

新加坡和北京地區的API Key不同。擷取與配置 API Key
以下為新加坡地區base_url,若使用北京地區的模型,需將base_url替換為https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx
curl -X GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
要求標頭(Headers)

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

URL路徑參數(Path parameters)

task_id string(必選)

任務ID。

響應參數

任務執行成功

任務資料(如任務狀態、映像URL等)僅保留24小時,逾時後會被自動清除。請您務必及時儲存產生的映像。

{
    "request_id": "43d9e959-25bc-4dc7-9888-xxxxxx",
    "output": {
        "task_id": "858cad55-4bdc-4ba3-ae6c-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-12-16 04:21:02.275",
        "scheduled_time": "2025-12-16 04:21:02.304",
        "end_time": "2025-12-16 04:24:46.658",
        "finished": true,
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/1xxx.png?Expires=xxx",
                            "type": "image"
                        }
                    ]
                }
            },
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/1xxx.png?Expires=xxx",
                            "type": "image"
                        }
                    ]
                }
            }
        ]
    },
    "usage": {
        "size": "1280*1280",
        "total_tokens": 0,
        "image_count": 2,
        "output_tokens": 0,
        "input_tokens": 0
    }
}

任務執行異常

如果因為某種原因導致任務執行失敗,將返回相關資訊,可以通過code和message欄位明確指示錯誤原因。請參見錯誤資訊進行解決。

{
    "request_id": "a4d78a5f-655f-9639-8437-xxxxxx",
    "code": "InvalidParameter",
    "message": "num_images_per_prompt must be 1"
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

輪詢過程中的狀態流轉:

  • PENDING(排隊中) → RUNNING(處理中)→ SUCCEEDED(成功)/ FAILED(失敗)。

  • 初次查詢狀態通常為 PENDING(排隊中)或 RUNNING(處理中)。

  • 當狀態變為 SUCCEEDED 時,響應中將包含產生的映像url。

  • 若狀態為 FAILED,請檢查錯誤資訊並重試。

submit_time string

任務提交時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任務執行時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任務完成時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

finished bool

請求結束標誌符。

  • true:表示請求結束。

  • false:表示請求未結束。

choices array of object

模型產生的輸出內容。

屬性

finish_reason string

任務停止原因,自然停止時為stop

message object

模型返回的訊息。

屬性

role string

訊息的角色,固定為assistant

content array

屬性

type string

輸出的類型,枚舉值為text、image。

text string

產生的文字。

image string

產生映像的 URL,映像格式為PNG。

連結有效期間為24小時,請及時下載並儲存映像。

usage object

輸出資訊統計。只對成功的結果計數。

屬性

image_count integer

產生映像的張數。

size string

產生的映像解析度。樣本值:1328*1328。

input_tokens integer

輸入token數量。按圖片張數計費,當前固定為0。

output_tokens integer

輸出token數量。按圖片張數計費,當前固定為0。

total_tokens integer

總token數量。按圖片張數計費,當前固定為0。

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

使用限制

  • 資料時效:任務task_id和 映像url均只保留 24 小時,到期後將無法查詢或下載。

  • 內容審核:輸入的 prompt 和輸出的映像均會經過Alibaba Content Security Service審核,包含違規內容的請求將報錯“IPInfringementSuspect”或“DataInspectionFailed”,具體參見錯誤資訊

  • 網路訪問配置:映像連結儲存於阿里雲 OSS,如果業務系統因安全性原則無法訪問外部OSS連結,請將以下 OSS 網域名稱加入網路訪問白名單。

    # OSS網域名稱列表
    dashscope-result-bj.oss-cn-beijing.aliyuncs.com
    dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
    dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
    dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
    dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
    dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
    dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
    dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
    dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
    dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com

計費與限流

  • 模型免費額度和計費單價請參見模型價格

  • 模型限流請參見通義-文生圖-Z-Image

  • 計費說明:

    • 按成功產生的 映像張數 計費。僅當查詢結果介面返回task_statusSUCCEEDED 並成功產生映像後,才會計費。

    • 模型調用失敗或處理錯誤不產生任何費用,也不消耗免費額度

錯誤碼

如果模型調用失敗並返回報錯資訊,請參見錯誤資訊進行解決。

常見問題

Q: 如何查看模型調用量?

A: 模型調用完一小時後,請在模型觀測(新加坡)模型觀測(北京)頁面,查看模型的調用次數、成功率等指標。如何查看模型調用記錄?