全部產品
Search
文件中心

Alibaba Cloud Model Studio:千問-映像翻譯API參考

更新時間:Feb 10, 2026

千問-映像翻譯模型(Qwen-MT-Image)可精準翻譯映像中的文字,並保留原始排版。該模型還支援領域提示、敏感詞過濾、術語幹預等自訂功能。

重要

本文檔僅適用於中國內地部署模式,必須使用對應的API Key

模型概覽

en

源語種:英文

ja

日語

es

葡語

ar

阿拉伯語

模型名稱

模型簡介

輸出映像規格

qwen-mt-image

千問-映像翻譯模型

支援中/英文與其他語種之間的互譯,但不支援在非中/英語種之間直接翻譯(例如,從日語翻譯為韓語)。詳情請參見支援的語種

圖片格式:JPG。

前提條件

您需要已擷取API Key與API Host配置API Key到環境變數(準備下線,併入配置 API Key)。請將範例程式碼中的 DASHSCOPE_API_HOST 替換為擷取的 API Host。

HTTP調用

POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image2image/image-synthesis

HTTP API 採用非同步模式,調用流程分兩步:

  1. 建立任務擷取任務ID:發送一個請求建立任務,該請求會返回任務ID(task_id)

  2. 根據任務ID查詢結果:使用task_id輪詢任務狀態,直到任務完成並獲得映像URL。

步驟1:建立任務擷取任務ID

說明
  • 建立成功後,使用介面返回的 task_id 查詢結果,task_id 有效期間為 24 小時。請勿重複建立任務,輪詢擷取即可。

  • 新手指引請參見Postman

請求參數

映像翻譯

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image2image/image-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "qwen-mt-image",
    "input": {
        "image_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250916/arpjoo/p1000391.webp",
        "source_lang": "en",
        "target_lang": "ja",
        "ext": {
            "config": {
                "imageSegment": false
            }
        }
    }
}'

要求標頭(Headers)

Content-Type string (必選)

請求內容類型。此參數必須設定為application/json

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

X-DashScope-Async string (必選)

非同步處理配置參數。HTTP請求只支援非同步,必須設定為enable

重要

缺少此要求標頭將報錯:“current user api does not support synchronous calls”。

請求體(Request Body)

model string (必選)

模型名稱,必須設定為qwen-mt-image

input object (必選)

輸入參數對象,包含以下欄位:

屬性

image_url string (必選)

映像的公網可訪問的URL,支援 HTTP 和 HTTPS 協議。

  • 格式限制:JPG、JPEG、PNG、BMP、PNM、PPM、TIFF、WEBP

  • 尺寸限制:映像的寬度和高度均需在15-8192像素範圍內,寬高比在1:10至10:1範圍內。

  • 大小限制:不超過100MB

  • URL地址中不能包含中文字元。

  • 樣本https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250916/arpjoo/p1000391.webp

source_lang string (必選)

源語種

  • 支援值:語種全稱、語種編碼或auto(自動檢測),對大小寫不敏感

  • 限制:與target_lang不同,且至少有一項為中文或英文

  • 樣本Chineseenauto

target_lang string (必選)

目標語種

  • 支援值:語種全稱或語種編碼,對大小寫不敏感

  • 限制:與source_lang不同,且至少有一項為中文或英文

  • 樣本Chineseen

ext object (可選)

可選拓展欄位。

屬性

domainHint string (可選)

領域提示,為使譯文風格更貼合特定領域,可以使用英文描述使用情境、譯文風格等需求。

為確保翻譯效果,建議不超過200個英文單詞。

重要

領域提示句當前只支援英文

樣本:These sentences are from seller-buyer conversations on a B2C ecommerce platform. Translate them into clear, engaging customer service language, ensuring the translation is appropriate for handling potential issues or disputes.

sensitives array (可選)

配置敏感詞,以在翻譯前過濾圖片中完全符合的文本,對大小寫敏感

敏感詞的語種可與源語種不一致,支援全部的源語種目標語種。為確保翻譯效果,建議單次請求添加的敏感詞不超過50個。

樣本:["全場9折", "七天無理由退換"]

terminologies array (可選)

術語幹預,為特定術語設定譯文,以滿足特定領域的翻譯需求,術語對的語種需要與source_langtarget_lang對應。

屬性

src string (必選)

術語的源文本,語種需要與源語種source_lang一致。

tgt string (必選)

術語的目標文本,語種需要與目標語種target_lang一致。

樣本:[{"src": "應用程式介面", "tgt": "API"}, {"src": "機器學習", "tgt": "ML"}]

config object (可選)

屬性

imageSegment bool (可選)

是否開啟映像主體分割。開啟後,將跳過對映像中主體(如人物、商品、Logo)上文字的翻譯。

  • false:(預設值)翻譯映像中的所有文字。

  • true:不翻譯映像主體的文字。

注意:舊版本參數名為skipImgSegment(是否跳過映像主體分割)。為保持相容,該參數仍受支援,但建議使用新的 imageSegment參數。

響應參數

成功響應

請儲存 task_id,用於查詢任務狀態與結果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

異常響應

建立任務失敗,請參見錯誤資訊進行解決。

{
    "code": "InvalidApiKey",
    "message": "No API-key provided.",
    "request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

message string

請求失敗的詳細資料。請求成功時不會返回此參數,詳情請參見錯誤資訊

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

步驟2:根據任務ID查詢結果

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

說明
  • task_id 有效期間為24小時,若ID不存在或已到期,任務狀態將返回 UNKNOWN

  • 任務成功後返回的 url有效期間為24小時,請及時下載並儲存映像。

請求參數

查詢任務結果

您需要將86ecf553-d340-4e21-xxxxxxxxx替換為真實的task_id。

curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
要求標頭(Headers)

Authorization string(必選)

請求身份認證。介面使用阿里雲百鍊API-Key進行身份認證。樣本值:Bearer sk-xxxx。

URL路徑參數(Path parameters)

task_id string(必選)

任務ID。

響應參數

任務執行成功-存在可翻譯內容

任務資料(如任務狀態、映像URL等)僅保留24小時,逾時後會被自動清除。請您務必及時儲存產生的映像。

{
    "request_id": "5fec62eb-bf94-91f8-b9f4-f7f758e4e27e",
    "output": {
        "task_id": "72c52225-8444-4cab-ad0c-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-08-13 18:11:16.954",
        "scheduled_time": "2025-08-13 18:11:17.003",
        "end_time": "2025-08-13 18:11:23.860",
        "image_url": "http://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx?Expires=xxx"
    },
    "usage": {
        "image_count":1
    }
}

任務執行成功-無可翻譯內容

在映像中無可翻譯文本(例如,在識別出映像主體後,其餘部分無文字)時,任務仍會成功並正常計費,但會返回No text detected for translation的提示。

{
    "request_id": "0ccb84aa-e034-431d-9d54-08e14fxxxxxx",
    "output": {
        "task_id": "34ec4208-97d6-498b-a390-9173f7xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2026-01-12 17:56:23.625",
        "scheduled_time": "2026-01-12 17:56:23.656",
        "end_time": "2026-01-12 17:56:25.324",
        "image_url": "http://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx.jpg?Expires=xxx",
        "message": "No text detected for translation"
    },
    "usage": {
        "image_count": 1
    }
}

任務執行失敗

若任務執行失敗,task_status將置為 FAILED,並提供錯誤碼和資訊。請參見錯誤資訊進行解決。

{
    "request_id": "daad9007-6acd-9fb3-a6bc-d55902b9c9ff",
    "output": {
        "task_id": "fe8aa114-d9f1-4f76-b598-xxxxxx",
        "task_status": "FAILED",
        "submit_time": "2025-08-20 09:54:21.911",
        "scheduled_time": "2025-08-20 09:54:21.984",
        "end_time": "2025-08-20 12:55:00.818",
        "code": "InternalError",
        "message": "xxxxxx"
    }
}

output object

任務輸出資訊。

屬性

task_id string

任務ID。查詢有效期間24小時。

task_status string

任務狀態。

枚舉值

  • PENDING:任務排隊中

  • RUNNING:任務處理中

  • SUCCEEDED:任務執行成功

  • FAILED:任務執行失敗

  • CANCELED:任務已取消

  • UNKNOWN:任務不存在或狀態未知

submit_time string

任務提交時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任務執行時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任務完成時間。時區為UTC+8,格式為 YYYY-MM-DD HH:mm:ss.SSS。

image_url string

模型產生映像的URL地址,與原圖長寬相同,JPG格式。有效期間為24小時,請及時下載並儲存映像。

code string

請求失敗的錯誤碼。請求成功時不會返回此參數,詳情請參見錯誤資訊

message string

請求失敗的詳細資料,詳情請參見錯誤資訊

通常請求成功時不會返回此參數,僅在映像中無可翻譯文本(例如,在分割映像主體後,其餘部分無文字)時,任務仍會成功並正常計費,但會返回No text detected for translation的提示。

usage object

輸出資訊統計。只對成功的結果計數。

屬性

image_count integer

模型產生映像的數量,固定為1。

request_id string

請求唯一標識。可用於請求明細溯源和問題排查。

支援的語種

進行映像翻譯時,源語種或目標語種必須至少有一種是中文或英文。不支援在兩個非中、英語種之間直接翻譯(例如,從日語翻譯為韓語)。若不確定源語種,可將 source_lang 設定為 auto 進行自動檢測。

語種(中文名)

英文全稱

編碼

支援作為源語種

支援作為目標語種

簡體中文

Chinese

zh

支援

支援

英文

English

en

支援

支援

韓語

Korean

ko

支援

支援

日語

Japanese

ja

支援

支援

俄語

Russian

ru

支援

支援

西班牙語

Spanish

es

支援

支援

法語

French

fr

支援

支援

葡萄牙語

Portuguese

pt

支援

支援

意大利語

Italian

it

支援

支援

德語

German

de

支援

不支援

越南語

Vietnamese

vi

支援

支援

馬來語

Malay

ms

不支援

支援

泰語

Thai

th

不支援

支援

印尼語

Indonesian

id

不支援

支援

阿拉伯語

Arabian

ar

不支援

支援

計費與限流

  • 模型免費額度和計費單價請參見模型價格

  • 模型限流請參見限流

  • 計費說明:按成功產生的映像張數計費。模型調用失敗或處理錯誤不產生任何費用。

  • 注意:如果映像中無可翻譯文本,或在啟用主體識別功能後,非主體部分無文字時,任務仍記為成功正常計費,此時介面會返回No text detected for translation的提示。

映像存取權限配置

映像儲存於阿里雲 OSS,連結允許公開訪問,僅在 24 小時內有效。如果業務系統因安全性原則無法訪問阿里雲OSS連結,請將以下 OSS 網域名稱加入網路訪問白名單。

dashscope-result-bj.oss-cn-beijing.aliyuncs.com
dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com

錯誤碼

如果模型調用失敗並返回報錯資訊,請參見錯誤資訊進行解決。

常見問題

Q:為什麼圖中的內容沒有被翻譯?

A:因為啟用了主體分割功能,模型不會翻譯圖片中人物、商品、Logo等主體上的文字。若需翻譯所有文字,請將ext.config.imgSegment參數設定為false

Q:如何將臨時的映像連結轉為永久連結?

A:臨時連結無法直接轉為永久連結。需通過後端服務下載映像,再上傳至Object Storage Service服務(如阿里雲 OSS)以產生新的永久連結。

範例程式碼:下載映像到本地

import requests

def download_and_save_image(image_url, save_path):
    try:
        response = requests.get(image_url, stream=True, timeout=300) # 設定逾時
        response.raise_for_status() # 如果HTTP狀態代碼不是200,則引發異常
        with open(save_path, 'wb') as f:
            for chunk in response.iter_content(chunk_size=8192):
                f.write(chunk)
        print(f"映像已成功下載到: {save_path}")
        # 此處可以接上傳到永久儲存的邏輯
    except requests.exceptions.RequestException as e:
        print(f"映像下載失敗: {e}")

if __name__ == '__main__':
    image_url = "http://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx?Expires=xxx"
    save_path = "image-translation.jpg"
    download_and_save_image(image_url, save_path)

Q: 如何查看模型調用量?

A: 模型調用完一小時後,請在模型觀測頁面,查看模型的調用次數、成功率等指標。如何查看模型調用記錄