旗艦模型
國際(新加坡)
旗艦模型 |
適合複雜任務,能力最強 |
效果、速度、成本均衡 |
適合簡單任務,速度快、成本低 |
卓越的代碼模型,擅長工具調用和環境互動 |
最大上下文長度 (Token數) | 262,144 | 1,000,000 | 1,000,000 | 1,000,000 |
最低輸入價格 (每百萬Token) | $1.2 | $0.4 | $0.05 | $0.3 |
最低輸出價格 (每百萬Token) | $6 | $1.2 | $0.4 | $1.5 |
中國大陸(北京)
旗艦模型 |
適合複雜任務,能力最強 |
效果、速度、成本均衡 |
適合簡單任務,速度快、成本低 |
卓越的代碼模型,擅長工具調用和環境互動 |
最大上下文長度 (Token數) | 262,144 | 1,000,000 | 1,000,000 | 1,000,000 |
最低輸入價格 (每百萬Token) | $0.459 | $0.115 | $0.022 | $0.144 |
最低輸出價格 (每百萬Token) | $1.836 | $0.287 | $0.216 | $0.574 |
模型總覽
國際(新加坡)
類別 | 子類別 | 說明 |
文本產生 | 通義千問大語言模型:商業版(通義千問Max、通義千問Plus、通義千問Flash)、開源版(Qwen3、Qwen2.5) | |
視覺理解模型通義千問VL、視覺推理模型QVQ、全模態模型通義千問 Omni、即時多模態模型通義千問Omni-Realtime | ||
映像產生 | ||
語音合成與識別 | 通義千問語音合成、通義千問即時語音合成可實現文本轉語音,適用於智能語音客服、有聲讀物、車載導航、教育輔導等情境。 | |
通義千問即時語音辨識、通義千問錄音檔案識別、Qwen3-LiveTranslate-Flash-Realtime、Fun-ASR語音辨識可實現語音轉文本,適用於即時會議記錄、即時直播字幕、電話客服等情境。 | ||
視頻產生 | 一句話產生視頻,視頻風格豐富,畫質細膩。 | |
通用視頻編輯:基於輸入的文本、圖片和視頻,可執行多種視頻編輯任務。例如,通過提取輸入視頻的運動特徵,並結合提示詞產生新的視頻。 | ||
向量 | 將文本轉換成一組可以代表文字的數字,適用於搜尋、聚類、推薦、分類任務。 |
中國大陸(北京)
類別 | 模型 | 說明 |
文本產生 | ||
映像產生 |
| |
通用模型: | ||
語音合成與識別 | 通義千問語音合成、通義千問即時語音合成和CosyVoice語音合成可實現文本轉語音,適用於智能語音客服、有聲讀物、車載導航、教育輔導等情境。 | |
通義千問即時語音辨識、通義千問錄音檔案識別、Fun-ASR語音辨識、Paraformer語音辨識可實現語音轉文本,適用於即時會議記錄、即時直播字幕、電話客服等情境。 | ||
視頻編輯與產生 | 一句話產生視頻,視頻風格豐富,畫質細膩。 | |
| ||
| ||
向量 | 將文本轉換成一組可以代表文字的數字,用於搜尋、聚類、推薦、分類等。 | |
將文本、映像、語音轉換成一組數字,用於音視頻分類、映像分類、圖文檢索等。 |
文本產生-通義千問
以下是通義千問模型的商業版。相較於開源版,商業版具有最新的能力和改進。
商業版模型參數量暫不透出。
各模型會不定期更新升級。如需使用固定版本,請選擇快照版本。快照版本通常維護至下個快照版本發布時間的後一個月。
建議優先使用穩定版或最新版,限流條件更寬鬆。
通義千問Max
通義千問系列效果最好的模型,適合複雜、多步驟的任務。使用方法 | API參考 | 線上體驗
國際(新加坡)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每千Token) | ||||||||
qwen3-max 當前與qwen3-max-2025-09-23能力相同 Batch調用半價 | 穩定版 | 僅非思考 | 262,144 | 258,048 | - | 65,536 | 階梯計價,請參見表格下方說明。 | 各100萬Token 有效期間:百鍊開通後90天內 | |
qwen3-max-2025-09-23 | 快照版 | 僅非思考 | |||||||
qwen3-max-preview | 預覽版 | 思考 | 81,920 | 32,768 | |||||
非思考 | - | 65,536 | |||||||
以上模型根據本次請求的輸入 Token數,採取階梯計費。
單次請求的輸入Token數 | 輸入價格(每百萬Token) qwen3-max、qwen3-max-preview 支援上下文緩衝。 | 輸出價格(每百萬Token) |
0<Token≤32K | $1.2 | $6 |
32K<Token≤128K | $2.4 | $12 |
128K<Token≤252K | $3 | $15 |
中國大陸(北京)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每千Token) | |||||||
qwen3-max 當前與qwen3-max-2025-09-23能力相同 Batch調用半價 | 穩定版 | 僅非思考 | 262,144 | 258,048 | - | 65,536 | 階梯計價,請參見表格下方說明。 | |
qwen3-max-2025-09-23 | 快照版 | 僅非思考 | ||||||
qwen3-max-preview | 預覽版 | 思考 | 81,920 | 32,768 | ||||
非思考 | - | 65,536 | ||||||
以上模型根據本次請求的輸入 Token數,採取階梯計費。
模型名稱 | 單次請求的輸入Token數 | 輸入單價(每百萬Token) | 輸出單價(每百萬Token) 思維鏈+回答 |
qwen3-max Batch調用半價 上下文緩衝享有折扣 | 0<Token≤32K | $0.459 | $1.836 |
32K<Token≤128K | $0.918 | $3.672 | |
128K<Token≤252K | $1.377 | $5.508 | |
qwen3-max-2025-09-23 | 0<Token≤32K | $0.861 | $3.441 |
32K<Token≤128K | $1.434 | $5.735 | |
128K<Token≤252K | $2.151 | $8.602 | |
qwen3-max-preview 上下文緩衝享有折扣 | 0<Token≤32K | $0.861 | $3.441 |
32K<Token≤128K | $1.434 | $5.735 | |
128K<Token≤252K | $2.151 | $8.602 |
qwen3-max-preview 模型的思考模式:在整體推理能力上顯著提升,尤其在智能體編程、常識推理,以及數學、科學和通用任務方面表現更優。
通義千問Plus
能力均衡,推理效果、成本和速度介於通義千問-Max和通義千問-Flash之間,適合中等複雜任務。使用方法 | API參考 | 線上體驗|深度思考
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | ||||||
qwen-plus 當前與qwen-plus-2025-07-28能力相同 屬於Qwen3系列 | 穩定版 | 1,000,000 | 思考模式 995,904 非思考模式 997,952 預設均為262,144,可通過max_input_tokens 參數調整 | 32,768 思維鏈最長81,920 | 階梯計價,請參見表格下方說明。 | 各100萬Token 有效期間:百鍊開通後90天內 | |
qwen-plus-latest 當前與qwen-plus-2025-12-01能力相同 屬於Qwen3系列 | 最新版 | 思考模式 995,904 非思考模式 997,952 | |||||
qwen-plus-2025-12-01 屬於Qwen3系列 | 快照版 | 思考模式 995,904 非思考模式 997,952 | |||||
qwen-plus-2025-09-11 屬於Qwen3系列 | |||||||
qwen-plus-2025-07-28 又稱qwen-plus-0728 屬於Qwen3系列 | |||||||
qwen-plus-2025-07-14 又稱qwen-plus-0714 屬於Qwen3系列 | 131,072 | 思考模式 98,304 非思考模式 129,024 | 16,384 思維鏈最長38,912 | $0.4 | 思考模式 $4 非思考模式 $1.2 | ||
qwen-plus-2025-04-28 又稱qwen-plus-0428 屬於Qwen3系列 | |||||||
qwen-plus-2025-01-25 又稱qwen-plus-0125 | 129,024 | 8,192 | $1.2 | ||||
qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根據本次請求輸入的 Token數,採取階梯計費。
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 模式 | 輸出價格(每百萬Token) |
0<Token≤256K | $0.4 | 非思考模式 | $1.2 |
思考模式 | $4 | ||
256K<Token≤1M | $1.2 | 非思考模式 | $3.6 |
思考模式 | $12 |
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
qwen-plus 當前與qwen-plus-2025-07-28能力相同 屬於Qwen3系列 | 穩定版 | 1,000,000 | 思考模式 995,904 非思考模式 997,952 預設均為131,072,可通過max_input_tokens 參數調整 | 32,768 思維鏈最長81,920 | 階梯計價,請參見表格下方說明。 | |
qwen-plus-latest 當前與qwen-plus-2025-12-01能力相同 屬於Qwen3系列 | 最新版 | 思考模式 995,904 非思考模式 997,952 | ||||
qwen-plus-2025-12-01 屬於Qwen3系列 | 快照版 | 思考模式 995,904 非思考模式 997,952 | ||||
qwen-plus-2025-09-11 屬於Qwen3系列 | ||||||
qwen-plus-2025-07-28 又稱qwen-plus-0728 屬於Qwen3系列 | ||||||
qwen-plus-2025-07-14 又稱qwen-plus-0714 屬於Qwen3系列 | 131,072 | 思考模式 98,304 非思考模式 129,024 | 16,384 思維鏈最長38,912 | $0.115 | 思考模式 $1.147 非思考模式 $0.287 | |
qwen-plus-2025-04-28 又稱qwen-plus-0428 屬於Qwen3系列 | ||||||
qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根據本次請求輸入的 Token數,採取階梯計費。
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 模式 | 輸出價格(每百萬Token) |
0<Token≤128K | $0.115 | 非思考模式 | $0.287 |
思考模式 | $1.147 | ||
128K<Token≤256K | $0.345 | 非思考模式 | $2.868 |
思考模式 | $3.441 | ||
256K<Token≤1M | $0.689 | 非思考模式 | $6.881 |
思考模式 | $9.175 |
上述模型支援思考模式和非思考模式,您可以通過 enable_thinking 參數實現兩種模式的切換。除此之外,模型的能力得到了大幅提升:
推理能力:在數學、代碼和邏輯推理等評測中,顯著超過 QwQ 和同尺寸的非推理模型,達到同規模業界頂尖水平。
人類偏好能力:創意寫作、角色扮演、多輪對話、指令遵循能力均大幅提升,通用能力顯著超過同尺寸模型。
Agent 能力:在思考、非思考兩種模式下都達到業界領先水平,能精準調用外部工具。
多語言能力:支援100多種語言和方言,多語言翻譯、指令理解、常識推理能力都明顯提升。
回複格式:修複了之前版本存在的回複格式的問題,如異常 Markdown、中間截斷、錯誤輸出 boxed 等問題。
對於上述模型,開啟思考模式時如果沒有輸出思考過程,按非思考模式價格進行收費。
通義千問Flash
通義千問系列速度最快、成本極低的模型,適合簡單任務。通義千問Flash採用靈活的階梯定價,相比通義千問Turbo計費更合理。使用方法 | API參考 | 線上體驗 | 思考模式
國際(新加坡)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 輸入成本 | 輸出成本 思維鏈+輸出 | 免費額度 |
(Token數) | (每千Token) | ||||||||
qwen-flash 當前與 qwen-flash-2025-07-28能力相同 屬於Qwen3系列 Batch調用半價 | 穩定版 | 思考 | 1,000,000 | 995,904 | 81,920 | 32,768 | 階梯計價,請參見表格下方說明。 | 各100萬Token 有效期間:百鍊開通後90天內 | |
非思考 | 997,952 | - | |||||||
qwen-flash-2025-07-28 屬於Qwen3系列 | 快照版 | 思考 | 995,904 | 81,920 | |||||
非思考 | 997,952 | - | |||||||
以上模型根據本次請求輸入的 Token數採取階梯計費,其中qwen-flash支援緩衝和 Batch調用。
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 輸出價格(每百萬Token) |
0<Token≤256K | $0.05 | $0.4 |
256K<Token≤1M | $0.25 | $2 |
中國大陸(北京)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 輸入成本 | 輸出成本 思維鏈+輸出 |
(Token數) | (每千Token) | |||||||
qwen-flash 當前與 qwen-flash-2025-07-28能力相同 屬於Qwen3系列 | 穩定版 | 思考 | 1,000,000 | 995,904 | 81,920 | 32,768 | 階梯計價,請參見表格下方說明。 | |
非思考 | 997,952 | - | ||||||
qwen-flash-2025-07-28 屬於Qwen3系列 | 快照版 | 思考 | 995,904 | 81,920 | ||||
非思考 | 997,952 | - | ||||||
以上模型根據本次請求輸入的 Token數採取階梯計費,其中qwen-flash支援上下文緩衝。
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 輸出價格(每百萬Token) |
0<Token≤128K | $0.022 | $0.216 |
128K<Token≤256K | $0.087 | $0.861 |
256K<Token≤1M | $0.173 | $1.721 |
通義千問Turbo
通義千問Turbo 後續不再更新,建議替換為通義千問Flash。通義千問Flash採用靈活的階梯定價,計費更合理。使用方法 | API參考 | 線上體驗|深度思考
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | ||||||
qwen-turbo 當前與qwen-turbo-2025-04-28能力相同 屬於Qwen3系列 | 穩定版 | 思考模式 131,072 非思考模式 1,000,000 | 思考模式 98,304 非思考模式 1,000,000 | 16,384 思維鏈最長38,912 | $0.05 Batch調用半價 | 思考模式:$0.5 非思考模式:$0.2 Batch調用半價 | 各100萬Token 有效期間:百鍊開通後90天內 |
qwen-turbo-latest 始終與最新快照版能力相同 屬於Qwen3系列 | 最新版 | $0.05 | 思考模式:$0.5 非思考模式:$0.2 | ||||
qwen-turbo-2025-04-28 又稱qwen-turbo-0428 屬於Qwen3系列 | 快照版 | ||||||
qwen-turbo-2024-11-01 又稱qwen-turbo-1101 | 1,000,000 | 1,000,000 | 8,192 | $0.2 | |||
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
qwen-turbo 當前與 qwen-turbo-2025-04-28能力相同 屬於Qwen3系列 | 穩定版 | 思考模式 131,072 非思考模式 1,000,000 | 思考模式 98,304 非思考模式 1,000,000 | 16,384 思維鏈最長38,912 | $0.044 | 思考模式 $0.431 非思考模式 $0.087 |
qwen-turbo-latest 始終與最新快照版能力相同 屬於Qwen3系列 | 最新版 | |||||
qwen-turbo-2025-07-15 又稱qwen-turbo-0715 屬於Qwen3系列 | 快照版 | |||||
qwen-turbo-2025-04-28 又稱qwen-turbo-0428 屬於Qwen3系列 | ||||||
QwQ
基於 Qwen2.5 模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(IFEval、LiveBench等)達到DeepSeek-R1 滿血版水平。使用方法
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||||
qwq-plus | 穩定版 | 131,072 | 98,304 | 32,768 | 8,192 | $0.8 | $2.4 | 100萬 Token 有效期間:百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||||
qwq-plus 當前與qwq-plus-2025-03-05能力相同 | 穩定版 | 131,072 | 98,304 | 32,768 | 8,192 | $0.230 | $0.574 |
qwq-plus-latest 始終與最新快照版能力相同 | 最新版 | ||||||
qwq-plus-2025-03-05 又稱qwq-plus-0305 | 快照版 | ||||||
通義千問Long
通義千問系列上下文視窗最長,能力均衡且成本較低的模型,適合長文本分析、資訊抽取、總結摘要和分類打標等任務。使用方法 | 線上體驗
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
qwen-long-latest 始終與最新快照版能力相同 | 穩定版 | 10,000,000 | 10,000,000 | 32,768 | $0.072 | $0.287 |
qwen-long-2025-01-25 又稱qwen-long-0125 | 快照版 | |||||
通義千問Omni
Qwen-Omni 模型能夠接收文本、圖片、音頻、視頻等多種模態的組合輸入,並產生文本或語音形式的回複, 提供多種高表現力擬人音色,支援多語言和方言的語音輸出,可應用於視覺識別、情緒感知、教育培訓等音視訊交談情境。使用方法|API 參考
國際(新加坡)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 免費額度 |
(Token數) | |||||||
qwen3-omni-flash 當前與qwen3-omni-flash-2025-09-15能力相同 | 穩定版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | 各100萬Token(不區分模態) 有效期間:百鍊開通後90天內 |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-12-01 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-09-15 又稱qwen3-omni-flash-0915 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
免費額度用完後,輸入與輸出的計費規則如下,思考模式和非思考模式的計費相同,且思考模式下不支援輸出音頻。
|
|
中國大陸(北京)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 免費額度 |
(Token數) | |||||||
qwen3-omni-flash 當前與qwen3-omni-flash-2025-09-15能力相同 | 穩定版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | 無免費額度 |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-12-01 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-09-15 又稱qwen3-omni-flash-0915 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
免費額度用完後,輸入與輸出的計費規則如下,思考模式和非思考模式的計費相同,且思考模式下不支援輸出音頻。
|
|
建議優先使用Qwen3-Omni-Flash模型,相較於Qwen-Omni-Turbo(後續不再更新),模型的能力得到大幅提升:
屬於混合思考模型,支援思考模式和非思考模式,可通過
enable_thinking參數實現兩種模式的切換,預設不開啟思考模式。思考模式下不支援輸出音頻;在非思考模式下,對於模型輸出的音頻:
qwen3-omni-flash-2025-12-01支援的音色增加至49種,qwen3-omni-flash-2025-09-15、qwen3-omni-flash支援的音色增加至 17 種,Qwen-Omni-Turbo 僅支援 4 種;
支援語言增加至 10 種,Qwen-Omni-Turbo 僅支援 2 種。
通義千問Omni-Realtime
相比於通義千問Omni,支援音訊流式輸入,且內建 VAD(Voice Activity Detection,語音活動檢測)功能,可自動檢測使用者語音的開始和結束。使用方法|用戶端事件|服務端事件
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 免費額度 |
(Token數) | |||||
qwen3-omni-flash-realtime 當前能力等同 qwen3-omni-flash-realtime-2025-09-15 | 穩定版 | 65,536 | 49,152 | 16,384 | 各100萬Token(不區分模態) 有效期間:百鍊開通後90天內 |
qwen3-omni-flash-realtime-2025-12-01 | 快照版 | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
免費額度用完後,輸入與輸出的計費規則如下:
|
|
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 免費額度 |
(Token數) | |||||
qwen3-omni-flash-realtime 當前能力等同 qwen3-omni-flash-realtime-2025-09-15 | 穩定版 | 65,536 | 49,152 | 16,384 | 無免費額度 |
qwen3-omni-flash-realtime-2025-12-01 | 快照版 | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
免費額度用完後,輸入與輸出的計費規則如下:
|
|
建議優先使用Qwen3-Omni-Flash-Realtime 模型,相較於Qwen-Omni-Turbo-Realtime(後續不再更新),模型的能力得到大幅提升。對於模型輸出的音頻:
qwen3-omni-flash-realtime-2025-12-01支援的音色增加至49種,qwen3-omni-flash-realtime-2025-09-15、qwen3-omni-realtime-flash支援的音色增加至 17 種,Qwen-Omni-Turbo-Realtime 僅支援 4 種
支援的語言增加至 10 種,Qwen-Omni-Turbo-Realtime 僅支援 2 種
QVQ
QVQ是視覺推理模型,支援視覺輸入及思維鏈輸出,在數學、編程、視覺分析、創作以及通用任務上都表現了更強的能力。使用方法 | 線上體驗
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||||
qvq-max 當前與 qvq-max-2025-03-25能力相同 | 穩定版 | 131,072 | 106,496 單圖最大16384 | 16,384 | 8,192 | $1.2 | $4.8 | 各100萬 Token 有效期間:百鍊開通後90天內 |
qvq-max-latest 始終與最新快照版能力相同 | 最新版 | |||||||
qvq-max-2025-03-25 又稱qvq-max-0325 | 快照版 | |||||||
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||||
qvq-max 相比 qvq-plus 具有更強的視覺推理和指令遵循能力,在更多複雜任務中提供最佳效能。 當前與qvq-max-2025-03-25能力相同 | 穩定版 | 131,072 | 106,496 單圖最大16384 | 16,384 | 8,192 | $1.147 | $4.588 |
qvq-max-latest 始終與最新快照版能力相同 | 最新版 | ||||||
qvq-max-2025-05-15 又稱qvq-max-0515 | 快照版 | ||||||
qvq-max-2025-03-25 又稱qvq-max-0325 | |||||||
qvq-plus 當前與qvq-plus-2025-05-15能力相同 | 穩定版 | $0.287 | $0.717 | ||||
qvq-plus-latest 始終與最新快照版能力相同 | 最新版 | ||||||
qvq-plus-2025-05-15 又稱qvq-plus-0515 | 快照版 | ||||||
通義千問VL
通義千問VL是具有視覺(映像)理解能力的文本產生模型,不僅能進行OCR(圖片文字識別),還能進一步總結和推理,例如從商品照片中提取屬性,根據習題圖進行解題等。如何使用 | API參考 | 線上體驗
通義千問VL模型按輸入和輸出的總Token數進行計費。映像Token的計算規則視覺理解。
國際(新加坡)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 輸入成本 | 輸出成本 思維鏈+輸出 | 免費額度 |
(Token數) | (每百萬Token) | ||||||||
qwen3-vl-plus 當前與qwen3-vl-plus-2025-09-23能力相同 | 穩定版 | 思考 | 262,144 | 258,048 單圖最大16384 | 81,920 | 32,768 | 階梯計價,請參見表格下方說明。 | 各100萬Token 有效期間:百鍊開通後90天內 | |
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-plus-2025-12-19 | 快照版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-plus-2025-09-23 | 快照版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-flash 當前與qwen3-vl-flash-2025-10-15能力相同 | 穩定版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-flash-2025-10-15 | 快照版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
以上模型根據本次請求輸入的 Token數,採取階梯計費。思考模式與非思考模式的輸入輸出價格相同。
qwen3-vl-plus系列
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 輸出價格(每百萬Token) |
0<Token≤32K | $0.2 | $1.6 |
32K<Token≤128K | $0.3 | $2.4 |
128K<Token≤256K | $0.6 | $4.8 |
qwen3-vl-flash系列
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 輸出價格(每百萬Token) |
0<Token≤32K | $0.05 | $0.4 |
32K<Token≤128K | $0.075 | $0.6 |
128K<Token≤256K | $0.12 | $0.96 |
中國大陸(北京)
模型名稱 | 版本 | 模式 | 上下文長度 | 最大輸入 | 最長思維鏈 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | ||||||||
qwen3-vl-plus 當前與qwen3-vl-plus-2025-09-23能力相同 | 穩定版 | 思考 | 262,144 | 258,048 單圖最大16384 | 81,920 | 32,768 | 階梯計價,請參見表格下方說明。 | 無免費額度 | |
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-plus-2025-12-19 | 快照版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-plus-2025-09-23 | 快照版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-flash 當前與qwen3-vl-flash-2025-10-15能力相同 | 穩定版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
qwen3-vl-flash-2025-10-15 | 快照版 | 思考 | 258,048 單圖最大16384 | 81,920 | |||||
非思考 | 260,096 單圖最大16384 | - | |||||||
以上模型根據本次請求輸入的 Token數,採取階梯計費。思考模式與非思考模式的輸入輸出價格相同。
qwen3-vl-plus系列
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 輸出價格(每百萬Token) |
0<Token≤32K | $0.143353 | $1.433525 |
32K<Token≤128K | $0.215029 | $2.150288 |
128K<Token≤256K | $0.430058 | $4.300576 |
qwen3-vl-flash系列
單次請求的輸入Token數 | 輸入價格(每百萬Token) | 輸出價格(每百萬Token) |
0<Token≤32K | $0.022 | $0.215 |
32K<Token≤128K | $0.043 | $0.43 |
128K<Token≤256K | $0.086 | $0.859 |
通義千問OCR
通義千問OCR模型是專用於文字提取的模型。相較於通義千問VL模型,它更專註於文檔、表格、試題、手寫體文字等類型映像的文字提取能力。它能夠識別多種語言,包括英語、法語、日語、韓語、德語、俄語和意大利語等。使用方法 | API參考|線上體驗
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入單價 | 輸出單價 | 免費額度 |
(Token數) | (每百萬Token) | ||||||
qwen-vl-ocr | 穩定版 | 34,096 | 30,000 單圖最大30000 | 4096 | $0.72 | $0.72 | 各100萬Token 有效期間:百鍊開通後90天內 |
qwen-vl-ocr-2025-11-20 又稱qwen-vl-ocr-1120 基於Qwen3-VL架構,大幅提升文檔解析、文字定位能力。 | 快照版 | 38,192 | 8,192 | $0.07 | $0.16 | ||
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入單價 | 輸出單價 | 免費額度 |
(Token數) | (每百萬Token) | ||||||
qwen-vl-ocr 當前與qwen-vl-ocr-2025-08-28能力相同 | 穩定版 | 34,096 | 30,000 單圖最大30000 | 4,096 | $0.717 | $0.717 | 無免費額度 |
qwen-vl-ocr-latest 始終與最新版能力相同 | 最新版 | 38,192 | 8,192 | $0.043 | $0.072 | ||
qwen-vl-ocr-2025-11-20 又稱qwen-vl-ocr-1120 基於Qwen3-VL架構,大幅提升文檔解析、文字定位能力。 | 快照版 | ||||||
qwen-vl-ocr-2025-08-28 又稱qwen-vl-ocr-0828 | 34,096 | 4,096 | $0.717 | $0.717 | |||
qwen-vl-ocr-2025-04-13 又稱qwen-vl-ocr-0413 | |||||||
qwen-vl-ocr-2024-10-28 又稱qwen-vl-ocr-1028 | |||||||
通義千問數學模型
通義千問數學模型是專門用於數學解題的語言模型。使用方法 | API參考 | 線上體驗
僅支援中國大陸(北京)地區。
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
qwen-math-plus 當前與qwen-math-plus-2024-09-19能力相同 | 穩定版 | 4,096 | 3,072 | 3,072 | $0.574 | $1.721 |
qwen-math-plus-latest 始終與最新快照版能力相同 | 最新版 | |||||
qwen-math-plus-2024-09-19 又稱qwen-math-plus-0919 | 快照版 | |||||
qwen-math-plus-2024-08-16 又稱qwen-math-plus-0816 | ||||||
qwen-math-turbo 當前與qwen-math-turbo-2024-09-19能力相同 | 穩定版 | $0.287 | $0.861 | |||
qwen-math-turbo-latest 始終與最新快照版能力相同 | 最新版 | |||||
qwen-math-turbo-2024-09-19 又稱qwen-math-turbo-0919 | 快照版 | |||||
通義千問Coder
通義千問代碼模型。最新的 Qwen3-Coder-Plus 系列模型是基於 Qwen3 的代碼產生模型,具有強大的Coding Agent能力,擅長工具調用和環境互動,能夠實現自主編程,代碼能力卓越的同時兼具通用能力。使用方法 | API參考 | 線上體驗
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | ||||||
qwen3-coder-plus 當前與qwen3-coder-plus-2025-07-22能力相同 | 穩定版 | 1,000,000 | 997,952 | 65,536 | 階梯計價,請參見表格下方說明。 | 各100萬Token 有效期間:百鍊開通後90天內 | |
qwen3-coder-plus-2025-09-23 | 快照版 | ||||||
qwen3-coder-plus-2025-07-22 | 快照版 | ||||||
qwen3-coder-flash 當前與qwen3-coder-flash-2025-07-28能力相同 | 穩定版 | ||||||
qwen3-coder-flash-2025-07-28 | 快照版 | ||||||
上述模型根據本次請求輸入的Token數,採取階梯計費。
qwen3-coder-plus系列
qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 價格如下,其中 qwen3-coder-plus 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。
單次請求的輸入Token數 | 輸入成本(每百萬Token) | 輸出成本(每百萬Token) |
0<Token≤32K | $1 | $5 |
32K<Token≤128K | $1.8 | $9 |
128K<Token≤256K | $3 | $15 |
256K<Token≤1M | $6 | $60 |
qwen3-coder-flash系列
qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 價格如下,其中 qwen3-coder-flash 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。
單次請求的輸入Token數 | 輸入成本(每百萬Token) | 輸出成本(每百萬Token) |
0<Token≤32K | $0.3 | $1.5 |
32K<Token≤128K | $0.5 | $2.5 |
128K<Token≤256K | $0.8 | $4 |
256K<Token≤1M | $1.6 | $9.6 |
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
qwen3-coder-plus 當前與qwen3-coder-plus-2025-07-22能力相同 | 穩定版 | 1,000,000 | 997,952 | 65,536 | 階梯計價,請參見表格下方說明。 | |
qwen3-coder-plus-2025-09-23 | 快照版 | |||||
qwen3-coder-plus-2025-07-22 | 快照版 | |||||
qwen3-coder-flash 當前與qwen3-coder-flash-2025-07-28能力相同 | 穩定版 | |||||
qwen3-coder-flash-2025-07-28 | 快照版 | |||||
上述模型根據本次請求輸入的Token數,採取階梯計費。
qwen3-coder-plus系列
qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 價格如下,其中 qwen3-coder-plus 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。
單次請求的輸入Token數 | 輸入成本(每百萬Token) | 輸出成本(每百萬Token) |
0<Token≤32K | $0.574 | $2.294 |
32K<Token≤128K | $0.861 | $3.441 |
128K<Token≤256K | $1.434 | $5.735 |
256K<Token≤1M | $2.868 | $28.671 |
qwen3-coder-flash系列
qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 價格如下,其中 qwen3-coder-flash 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。
單次請求的輸入Token數 | 輸入成本(每百萬Token) | 輸出成本(每百萬Token) |
0<Token≤32K | $0.144 | $0.574 |
32K<Token≤128K | $0.216 | $0.861 |
128K<Token≤256K | $0.359 | $1.434 |
256K<Token≤1M | $0.717 | $3.584 |
通義千問翻譯模型
基於 Qwen 3全面升級的旗艦級翻譯大模型,支援92個語種(包括中、英、日、韓、法、西、德、泰、印尼、越、阿等)互譯,模型效能和翻譯效果全面升級,提供更穩定的術語定製、格式還原度、領域提示能力,讓譯文更精準、自然。使用方法
國際(新加坡)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||
qwen-mt-plus 屬於Qwen3-MT | 16,384 | 8,192 | 8,192 | $2.46 | $7.37 | 各100萬Token 有效期間:百鍊開通後90天內 |
qwen-mt-flash 屬於Qwen3-MT | $0.16 | $0.49 | ||||
qwen-mt-lite 屬於Qwen3-MT | $0.12 | $0.36 | ||||
qwen-mt-turbo 屬於Qwen3-MT | $0.16 | $0.49 | ||||
中國大陸(北京)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qwen-mt-plus 屬於Qwen3-MT | 16,384 | 8,192 | 8,192 | $0.259 | $0.775 |
qwen-mt-flash 屬於Qwen3-MT | $0.101 | $0.280 | |||
qwen-mt-lite 屬於Qwen3-MT | $0.086 | $0.229 | |||
qwen-mt-turbo 屬於Qwen3-MT | $0.101 | $0.280 | |||
通義千問資料採礦模型
通義千問資料採礦模型可以提取文檔中的結構化資訊並用於資料標註和內容審核等領域。使用方法 | API參考
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||
qwen-doc-turbo | 262,144 | 253,952 | 32,768 | $0.087 | $0.144 | 無免費額度 |
通義千問深入研究模型
通義千問深入研究模型可以拆解複雜問題,結合互連網搜尋進行推理分析並產生研究報告。使用方法 | API參考
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每千Token) | ||||
qwen-deep-research | 1,000,000 | 997,952 | 32,768 | $0.007742 | $0.023367 |
文本產生-通義千問-開源版
模型名稱中,xxb表示參數規模,例如qwen2-72b-instruct表示參數規模為72B,即720億。
百鍊支援調用通義千問的開源版,您無需本地部署模型。對於開源版,建議使用Qwen3和Qwen2.5模型。
Qwen3
2025 年 9月發布的 qwen3-next-80b-a3b-thinking 僅支援思考模式,相較於qwen3-235b-a22b-thinking-2507提升了指令遵循能力,總結回複更加精簡。
2025 年 9月發布的 qwen3-next-80b-a3b-instruct 僅支援非思考模式,相較於qwen3-235b-a22b-instruct-2507增強了中文理解、邏輯推理及文本產生能力。
2025 年 7月發布的 qwen3-235b-a22b-thinking-2507、qwen3-30b-a3b-thinking-2507 模型僅支援思考模式,是qwen3-235b-a22b(思考模式)與qwen3-30b-a3b (思考模式)的升級版。
2025 年 7月發布的 qwen3-235b-a22b-instruct-2507、qwen3-30b-a3b-instruct-2507 模型僅支援非思考模式,是qwen3-235b-a22b(非思考模式)與qwen3-30b-a3b (非思考模式)的升級版。
2025 年 4月發布的 Qwen3 模型支援思考模式和非思考模式,您可以通過 enable_thinking 參數實現兩種模式的切換。除此之外,Qwen3 模型的能力得到了大幅提升:
推理能力:在數學、代碼和邏輯推理等評測中,顯著超過 QwQ 和同尺寸的非推理模型,達到同規模業界頂尖水平。
人類偏好能力:創意寫作、角色扮演、多輪對話、指令遵循能力均大幅提升,通用能力顯著超過同尺寸模型。
Agent 能力:在推理、非推理兩種模式下都達到業界領先水平,能夠實現精準的外部工具調用。
多語言能力:支援100多種語言和方言,多語言翻譯、指令理解、常識推理能力都明顯提升。
回複格式問題修複:修複了之前版本存在的回複格式的問題,如異常 Markdown、中間截斷、錯誤輸出 boxed 等問題。
2025 年 4月發布的Qwen3 開源模型在思考模式下不支援非流式輸出方式。
Qwen3 開源模型開啟思考模式時如果沒有輸出思考過程,按非思考模式價格進行收費。
國際(新加坡)
模型名稱 | 模式 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||||
qwen3-next-80b-a3b-thinking | 僅支援思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.15 | $1.2 | 各100萬 Token 有效期間:百鍊開通後90天內 |
qwen3-next-80b-a3b-instruct | 不支援思考模式 | 129,024 | - | |||||
qwen3-235b-a22b-thinking-2507 | 僅支援思考模式 | 126,976 | 81,920 | $0.23 | $2.3 | |||
qwen3-235b-a22b-instruct-2507 | 不支援思考模式 | 129,024 | - | $0.92 | ||||
qwen3-30b-a3b-thinking-2507 | 僅支援思考模式 | 126,976 | 81,920 | $0.2 | $2.4 | |||
qwen3-30b-a3b-instruct-2507 | 不支援思考模式 | 129,024 | - | $0.8 | ||||
qwen3-235b-a22b 本模型與以下模型均於2025 年 4月發布 | 非思考 | 129,024 | - | 16,384 | $0.7 | $2.8 | ||
思考 | 98,304 | 38,912 | $8.4 | |||||
qwen3-32b | 非思考 | 129,024 | - | $0.16 | $0.64 | |||
思考 | 98,304 | 38,912 | ||||||
qwen3-30b-a3b | 非思考 | 129,024 | - | $0.2 | $0.8 | |||
思考 | 98,304 | 38,912 | $2.4 | |||||
qwen3-14b | 非思考 | 129,024 | - | 8,192 | $0.35 | $1.4 | ||
思考 | 98,304 | 38,912 | $4.2 | |||||
qwen3-8b | 非思考 | 129,024 | - | $0.18 | $0.7 | |||
思考 | 98,304 | 38,912 | $2.1 | |||||
qwen3-4b | 非思考 | 129,024 | - | $0.11 | $0.42 | |||
思考 | 98,304 | 38,912 | $1.26 | |||||
qwen3-1.7b | 非思考 | 32,768 | 30,720 | - | $0.42 | |||
思考 | 28,672 | 與輸入相加不超過30,720 | $1.26 | |||||
qwen3-0.6b | 非思考 | 30,720 | - | $0.42 | ||||
思考 | 28,672 | 與輸入相加不超過30,720 | $1.26 | |||||
中國大陸(北京)
模型名稱 | 模式 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||||
qwen3-next-80b-a3b-thinking | 僅思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.144 | $1.434 |
qwen3-next-80b-a3b-instruct | 僅非思考模式 | 129,024 | - | $0.574 | |||
qwen3-235b-a22b-thinking-2507 | 僅思考模式 | 126,976 | 81,920 | $0.287 | $2.868 | ||
qwen3-235b-a22b-instruct-2507 | 僅非思考模式 | 129,024 | - | $1.147 | |||
qwen3-30b-a3b-thinking-2507 | 僅思考模式 | 126,976 | 81,920 | $0.108 | $1.076 | ||
qwen3-30b-a3b-instruct-2507 | 僅非思考模式 | 129,024 | - | $0.431 | |||
qwen3-235b-a22b | 非思考 | 129,024 | - | 16,384 | $0.287 | $1.147 | |
思考 | 98,304 | 38,912 | $2.868 | ||||
qwen3-32b | 非思考 | 129,024 | - | $0.287 | $1.147 | ||
思考 | 98,304 | 38,912 | $2.868 | ||||
qwen3-30b-a3b | 非思考 | 129,024 | - | $0.108 | $0.431 | ||
思考 | 98,304 | 38,912 | $1.076 | ||||
qwen3-14b | 非思考 | 129,024 | - | 8,192 | $0.144 | $0.574 | |
思考 | 98,304 | 38,912 | $1.434 | ||||
qwen3-8b | 非思考 | 129,024 | - | $0.072 | $0.287 | ||
思考 | 98,304 | 38,912 | $0.717 | ||||
qwen3-4b | 非思考 | 129,024 | - | $0.044 | $0.173 | ||
思考 | 98,304 | 38,912 | $0.431 | ||||
qwen3-1.7b | 非思考 | 32,768 | 30,720 | - | $0.173 | ||
思考 | 28,672 | 與輸入相加不超過30,720 | $0.431 | ||||
qwen3-0.6b | 非思考 | 30,720 | - | $0.173 | |||
思考 | 28,672 | 與輸入相加不超過30,720 | $0.431 | ||||
QwQ-開源版
基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(IFEval、LiveBench等)達到DeepSeek-R1 滿血版水平,各指標均顯著超過同樣基於 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法|API 參考
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
qwq-32b | 131,072 | 98,304 | 32,768 | 8,192 | $0.287 | $0.861 |
QwQ-Preview
qwq-32b-preview 模型是由 Qwen 團隊於2024年開發的實驗性研究模型,專註於增強 AI 推理能力,尤其是數學和編程領域。qwq-32b-preview 模型的局限性請參見QwQ官方部落格。使用方法 | API參考|線上體驗
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qwq-32b-preview | 32,768 | 30,720 | 16,384 | $0.287 | $0.861 |
Qwen2.5
QVQ
qvq-72b-preview模型是由 Qwen 團隊開發的實驗性研究模型,專註於提升視覺推理能力,尤其在數學推理領域。qvq-72b-preview模型的局限性請參見QVQ官方部落格。使用方法 | API參考
如果希望模型先輸出思考過程再輸出回答內容,請使用商業版模型QVQ。
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qvq-72b-preview | 32,768 | 16,384 單圖最大16384 | 16,384 | $1.721 | $5.161 |
Qwen-Omni
基於Qwen2.5訓練的全新多模態理解產生大模型,支援文本、映像、語音、視頻輸入理解,具備文本和語音同時流式產生的能力,多模態內容理解速度顯著提升。使用方法|API 參考
國際(新加坡)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 免費額度 |
(Token數) | ||||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 | 100萬Token(不區分模態) 有效期間:百鍊開通後90天內 |
免費額度用完後,輸入與輸出的計費規則如下:
|
|
中國大陸(北京)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 |
(Token數) | |||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 |
輸入與輸出的計費規則如下:
|
|
Qwen3-Omni-Captioner
Qwen3-Omni-Captioner以通義千問3-Omni為基座的開源模型,無需任何提示,自動為複雜語音、環境聲、音樂、影視聲效等產生精準、全面的描述,能識別說話人情緒、音樂元素(如風格、樂器)、敏感資訊等,適用於音頻內容分析、安全性稽核、意圖識別、音頻剪輯等多個領域。使用方法|API 參考
國際(新加坡)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||
qwen3-omni-30b-a3b-captioner | 65,536 | 32,768 | 32,768 | $3.81 | $3.06 | 100萬Token 有效期間:阿里雲百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | (每百萬Token) | |||||
qwen3-omni-30b-a3b-captioner | 65,536 | 32,768 | 32,768 | $2.265 | $1.821 | 無免費額度 |
Qwen-VL
相較於Qwen2.5-VL,Qwen3-VL模型能力有極大提升:
智能體互動:可操作電腦或手機介面,識別 GUI 元素、理解功能、調用工具執行任務,在 OS World 等評測中達到頂尖水平。
視覺編碼:可通過映像或視頻產生代碼,用於將設計圖、網站截圖等產生HTML、CSS、JS 代碼。
空間感知:支援二維和三維定位,精準判斷物體方位、視角變化、遮擋關係。
長視頻理解:支援長達20分鐘的視頻內容理解,並能精確定位到秒級時刻。
深度思考:具有深度思考能力, 擅長捕捉細節、分析因果,在 MathVista、MMMU 等評測中達到頂尖水平。
文字識別:支援語言擴充至 33種,在複雜光線、模糊、傾斜等情境下表現更穩定;顯著提升生僻字、古籍字、專業術語的識別準確率。
國際(新加坡)
模型名稱 | 模式 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 思維鏈+輸出 | 免費額度 |
(Token數) | (每百萬Token) | |||||||
qwen3-vl-235b-a22b-thinking | 僅思考模式 | 126,976 | 81,920 | $0.4 | $4 | 各100萬 Token 有效期間:百鍊開通後90天內 | ||
qwen3-vl-235b-a22b-instruct | 僅非思考模式 | 129,024 | - | $1.6 | ||||
qwen3-vl-32b-thinking | 僅思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.16 | $0.64 | |
qwen3-vl-32b-instruct | 僅非思考模式 | 129,024 | - | |||||
qwen3-vl-30b-a3b-thinking | 僅思考模式 | 126,976 | 81,920 | $0.2 | $2.4 | |||
qwen3-vl-30b-a3b-instruct | 僅非思考模式 | 129,024 | - | $0.8 | ||||
qwen3-vl-8b-thinking | 僅思考模式 | 126,976 | 81,920 | $0.18 | $2.1 | |||
qwen3-vl-8b-instruct | 僅非思考模式 | 129,024 | - | $0.7 | ||||
中國大陸(北京)
模型名稱 | 模式 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 思維鏈+輸出 | 免費額度 |
(Token數) | (每百萬Token) | |||||||
qwen3-vl-235b-a22b-thinking | 僅思考模式 | 131,072 | 126,976 | 81,920 | $0.286705 | $2.867051 | 無免費額度 | |
qwen3-vl-235b-a22b-instruct | 僅非思考模式 | 129,024 | - | $1.146820 | ||||
qwen3-vl-32b-thinking | 僅思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.287 | $2.868 | |
qwen3-vl-32b-instruct | 僅非思考模式 | 129,024 | - | $1.147 | ||||
qwen3-vl-30b-a3b-thinking | 僅思考模式 | 126,976 | 81,920 | $0.108 | $1.076 | |||
qwen3-vl-30b-a3b-instruct | 僅非思考模式 | 129,024 | - | $0.431 | ||||
qwen3-vl-8b-thinking | 僅思考模式 | 126,976 | 81,920 | $0.072 | $0.717 | |||
qwen3-vl-8b-instruct | 僅非思考模式 | 129,024 | - | $0.287 | ||||
Qwen-Math
基於Qwen模型構建的專門用於數學解題的語言模型。Qwen2.5-Math支援中文和英文,並整合了多種推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API參考 | 線上體驗
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qwen2.5-math-72b-instruct | 4,096 | 3,072 | 3,072 | $0.574 | $1.721 |
qwen2.5-math-7b-instruct | $0.144 | $0.287 | |||
qwen2.5-math-1.5b-instruct | 限時免費 | ||||
Qwen-Coder
通義千問代碼模型開源版。最新的 Qwen3-Coder系列具有強大的Coding Agent能力,擅長工具調用和環境互動,能夠實現自主編程、代碼能力卓越的同時兼具通用能力。使用方法 | API參考
國際(新加坡)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 免費額度 |
(Token數) | ||||||
qwen3-coder-480b-a35b-instruct | 262,144 | 204,800 | 65,536 | 階梯計價,請參見表格下方說明。 | 各100萬Token 有效期間:百鍊開通後90天內 | |
qwen3-coder-30b-a3b-instruct | ||||||
qwen3-coder-480b-a35b-instruct 與 qwen3-coder-30b-a3b-instruct 根據本次請求輸入的 Token數,採取階梯計費。
模型名稱 | 單次請求的輸入 Token 數 | 輸入成本(每百萬Token) | 輸出成本(每百萬Token) |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $1.5 | $7.5 |
32K<Token≤128K | $2.7 | $13.5 | |
128K<Token≤200K | $4.5 | $22.5 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0.45 | $2.25 |
32K<Token≤128K | $0.75 | $3.75 | |
128K<Token≤200K | $1.2 | $6 |
中國大陸(北京)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qwen3-coder-480b-a35b-instruct | 262,144 | 204,800 | 65,536 | 階梯計價,請參見表格下方說明。 | |
qwen3-coder-30b-a3b-instruct | |||||
qwen2.5-coder-32b-instruct | 131,072 | 129,024 | 8,192 | $0.287 | $0.861 |
qwen2.5-coder-14b-instruct | |||||
qwen2.5-coder-7b-instruct | $0.144 | $0.287 | |||
qwen2.5-coder-3b-instruct | 32,768 | 30,720 | 限時免費體驗 | ||
qwen2.5-coder-1.5b-instruct | |||||
qwen2.5-coder-0.5b-instruct | |||||
qwen3-coder-480b-a35b-instruct 與 qwen3-coder-30b-a3b-instruct 根據本次請求輸入的 Token數,採取階梯計費。
模型名稱 | 單次請求的輸入 Token 數 | 輸入成本(每百萬Token) | 輸出成本(每百萬Token) |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $0.861 | $3.441 |
32K<Token≤128K | $1.291 | $5.161 | |
128K<Token≤200K | $2.151 | $8.602 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0.216 | $0.861 |
32K<Token≤128K | $0.323 | $1.291 | |
128K<Token≤200K | $0.538 | $2.151 |
文本產生-第三方模型
DeepSeek
DeepSeek 是由深度求索公司推出的大語言模型。API參考|線上體驗
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
deepseek-v3.2 685B 滿血版 | 131,072 | 98,304 | 32,768 | 65,536 | $0.287 | $0.431 |
deepseek-v3.2-exp 685B 滿血版 | ||||||
deepseek-v3.1 685B 滿血版 | $0.574 | $1.721 | ||||
deepseek-r1 685B 滿血版 | 16,384 | $2.294 | ||||
deepseek-r1-0528 685B 滿血版 | ||||||
deepseek-v3 671B 滿血版 | 131,072 | 不涉及 | $0.287 | $1.147 | ||
deepseek-r1-distill-qwen-1.5b 基於 Qwen2.5-Math-1.5B | 32,768 | 32,768 | 16,384 | 16,384 | 限時免費體驗 | |
deepseek-r1-distill-qwen-7b 基於 Qwen2.5-Math-7B | $0.072 | $0.144 | ||||
deepseek-r1-distill-qwen-14b 基於 Qwen2.5-14B | $0.144 | $0.431 | ||||
deepseek-r1-distill-qwen-32b 基於 Qwen2.5-32B | $0.287 | $0.861 | ||||
deepseek-r1-distill-llama-8b 基於 Llama-3.1-8B | 限時免費體驗 | |||||
deepseek-r1-distill-llama-70b 基於 Llama-3.3-70B | ||||||
Kimi
Kimi-K2 是由月之暗面公司推出的大語言模型,具有卓越的編碼和工具調用能力。使用方法|線上體驗
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大思維鏈長度 | 最大回複長度 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | |||||
kimi-k2-thinking | 262,144 | 229,376 | 32,768 | 16,384 | $0.574 | $2.294 |
Moonshot-Kimi-K2-Instruct | 131,072 | 131,072 | - | 8,192 | $0.574 | $2.294 |
映像產生
通義千問文生圖
通義千問文生圖模型在複雜文本渲染方面表現突出,特別是中英文文本渲染。當前qwen-image-plus與qwen-image能力相同,但qwen-image-plus價格更優惠。API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度 |
qwen-image-plus | $0.03/張 | 免費額度:各100張 有效期間:阿里雲百鍊開通後90天內 |
qwen-image | $0.035/張 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度 |
qwen-image-plus | $0.028671/張 | 無免費額度 |
qwen-image | $0.035/張 |
輸入提示詞 | 輸出映像 |
Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere. |
|
通義千問影像編輯
通義千問影像編輯模型支援精準的中英雙語文字編輯、調色、細節增強、風格遷移、增刪物體、改變位置和動作等操作,可實現複雜的圖文編輯。API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度 |
qwen-image-edit-plus 當前與qwen-image-edit-plus-2025-10-30能力相同 | $0.03/張 | 免費額度:各100張 有效期間:阿里雲百鍊開通後90天內 |
qwen-image-edit-plus-2025-12-15 | $0.03/張 | |
qwen-image-edit-plus-2025-10-30 | $0.03/張 | |
qwen-image-edit | $0.045/張 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度 |
qwen-image-edit-plus 當前與qwen-image-edit-plus-2025-10-30能力相同 | $0.028671/張 | 無免費額度 |
qwen-image-edit-plus-2025-12-15 | $0.028671/張 | |
qwen-image-edit-plus-2025-10-30 | $0.028671/張 | |
qwen-image-edit | $0.043/張 |
原圖 |
將圖中的人物改為站立姿勢,彎腰握住狗的前爪 |
原圖 |
將字母塊上的單詞'HEALTH INSURANCE’ 替換為'明天會更好' |
原圖 |
用淺藍色襯衫替換圓點襯衫 |
原圖 |
將圖中背景改為南極 |
原圖 |
產生人物的卡通頭像 |
原圖 |
刪除餐盤上的頭髮 |
通義千問映像翻譯
通義千問映像翻譯模型支援將11種語言圖片的文字翻譯成中文或英文,能精準保留原始排版與內容資訊,並提供術語定義、敏感詞過濾、映像主體檢測等自訂功能。API參考
僅支援中國大陸(北京)地區。
模型名稱 | 單價 | 免費額度 |
qwen-mt-image | $0.000431/張 | 無免費額度 |
原圖 |
日語 |
葡語 |
阿拉伯語 |
通義-文生圖-Z-Image
通義-文生圖-Z-Image 是一款輕量級文生圖模型,可快速產生高品質映像,支援中英雙語渲染、複雜語義理解和多風格題材,並可靈活適配多種解析度與寬高比。API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) 有效期間:阿里雲百鍊開通後90天內 |
z-image-turbo | 關閉提示詞改寫( 開啟提示詞改寫( | 100張 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度 |
z-image-turbo | 關閉提示詞改寫( 開啟提示詞改寫( | 無免費額度 |
輸入提示詞 | 輸出映像 |
Photo of a stylish young woman with short black hair standing confidently in front of a vibrant cartoon-style mural wall. She wears an all-black outfit: a puffed bomber jacket with a ruffled collar, cargo shorts, fishnet tights, and chunky black Doc Martens, with a gold chain dangling from her waist. The background features four colorful comic-style panels: one reads “GRAND STAGE” and includes sneakers and a Gatorade bottle; another displays green Nike sneakers and a slice of pizza; the third reads “HARAJUKU st” with floating shoes; and the fourth shows a blue mouse riding a skateboard with the text “Takeshita WELCOME.” Dominant bright colors include yellow, teal, orange, pink, and green. Speech bubbles, halftone patterns, and playful characters enhance the urban street-art aesthetic. Daylight evenly illuminates the scene, and the ground beneath her feet is white tiled pavement. Full-body portrait, centered composition, slightly tilted stance, direct eye contact with the camera. High detail, sharp focus, dynamic framing. |
|
通義萬相文生圖
通義萬相-文生圖模型通過文本即可產生精美的圖片。API參考 | 線上體驗
國際(新加坡)
模型名稱 | 說明 | 單價 | 免費額度(注) 有效期間:阿里雲百鍊開通後90天內 |
wan2.6-t2i | 萬相2.6。支援新增的同步介面,同時支援在總像素麵積與寬高比約束內,自由選尺寸。 | $0.03/張 | 50張 |
wan2.5-t2i-preview | 萬相2.5 preview。取消單邊限制,在總像素麵積與寬高比約束內,自由選尺寸。 | $0.03/張 | 50張 |
wan2.2-t2i-plus | 萬相2.2專業版。在創意性、穩定性、寫實質感上全面升級。 | $0.05/張 | 100張 |
wan2.2-t2i-flash | 萬相2.2極速版。在創意性、穩定性、寫實質感上全面升級。 | $0.025/張 | 100張 |
wan2.1-t2i-plus | 萬相2.1專業版。支援多種風格,產生映像細節豐富。 | $0.05/張 | 200張 |
wan2.1-t2i-turbo | 萬相2.1極速版。支援多種風格,產生速度快。 | $0.025/張 | 200張 |
中國大陸(北京)
模型名稱 | 說明 | 單價 | 免費額度(注) 有效期間:阿里雲百鍊開通後90天內 |
wan2.6-t2i | 萬相2.6。支援新增的同步介面,同時支援在總像素麵積與寬高比約束內,自由選尺寸。 | $0.028671/張 | 無免費額度 |
wan2.5-t2i-preview | 萬相2.5 preview。取消單邊限制,在總像素麵積與寬高比約束內,自由選尺寸。 | $0.028671/張 | 無免費額度 |
wan2.2-t2i-plus | 萬相2.2專業版。在創意性、穩定性、寫實質感上全面升級。 | $0.02007/張 | 無免費額度 |
wan2.2-t2i-flash | 萬相2.2極速版。在創意性、穩定性、寫實質感上全面升級。 | $0.028671/張 | 無免費額度 |
wanx2.1-t2i-plus | 萬相2.1專業版。支援多種風格,產生映像細節豐富。 | $0.028671/張 | 無免費額度 |
wanx2.1-t2i-turbo | 萬相2.1極速版。支援多種風格,產生速度快。 | $0.020070/張 | 無免費額度 |
wanx2.0-t2i-turbo | 萬相2.0極速版。擅長質感人像與創意設計,性價比高。 | $0.005735/張 | 無免費額度 |
輸入提示詞 | 輸出映像 |
一個用針氈製作的聖誕老人手持禮物,旁邊站著一隻白色的貓咪,背景中有許多五顏六色的禮物。整個情境應該是可愛、溫暖和舒適的,並且背景中還有一些綠色植物。 |
|
通義萬相映像產生與編輯2.6
通義萬相映像產生模型支援影像編輯、圖文混合輸出,滿足多樣化產生與整合需求。API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) 有效期間:阿里雲百鍊開通後90天內 |
wan2.6-image | $0.03/張 | 50張 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度 |
wan2.6-image | $0.028671/張 | 無免費額度 |
通義萬相通用影像編輯2.5
通義萬相-通用影像編輯2.5模型支援輸入文本、單圖或多圖實現基於主體一致性的影像編輯、多圖融合創作等能力。API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) 有效期間:阿里雲百鍊開通後90天內 |
wan2.5-i2i-preview | $0.03/張 | 50張 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度 |
wan2.5-i2i-preview | $0.028671/張 | 無免費額度 |
模型功能 | 輸入樣本 | 輸出映像 |
單圖編輯 |
|
將花卉連衣裙換成一件複古風格的蕾絲長裙,領口和袖口有精緻的刺繡細節。 |
多圖融合 |
|
將圖1中的鬧鐘放置到圖2的餐桌的花瓶旁邊位置 |
通義萬相通用影像編輯2.1
通義萬相-通用影像編輯模型通過簡單的指令即可實現多樣化的影像編輯,適用於擴圖、去浮水印、風格遷移、映像修複、映像美化等情境。使用方法 | API參考
僅支援中國大陸(北京)地區。
模型名稱 | 計費單價 | 免費額度 |
wanx2.1-imageedit | $0.020070/張 | 無免費額度 |
目前通用影像編輯支援以下功能:
模型功能 | 輸入映像 | 輸入提示詞 | 輸出映像 |
全域風格化 |
| 轉換成法國繪本風格 |
|
局部風格化 |
| 把房子變成木板風格。 |
|
指令編輯 |
| 把女孩的頭髮修改為紅色。 |
|
局部重繪 | 輸入映像
塗抹地區映像(白色為塗抹地區)
| 一隻陶瓷兔子抱著一朵陶瓷花。 | 輸出映像
|
去文字浮水印 |
| 去除映像中的文字。 |
|
擴圖 |
| 一位綠色仙子。 |
|
映像超分 | 模糊映像
| 映像超分。 | 清晰映像
|
映像上色 |
| 藍色背景,黃色的葉子。 |
|
線稿生圖 |
| 北歐極簡風格的客廳。 |
|
墊圖 |
| 卡通形象小心翼翼地探出頭,窺視著房間內一顆璀璨的藍色寶石。 |
|
AI試衣
AI試衣-Plus版相較於基礎版模型,在圖片清晰度、服飾紋理細節和logo還原效果等方面均有提升,但產生耗時較長,適用於對時效性要求不高的情境。API參考 | 線上體驗
AI試衣-圖片分割支援對模特圖、服飾圖進行分割,可用於AI試衣圖片的前後處理。API參考
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 樣本輸入 | 樣本輸出 |
aitryon-plus | AI試衣-Plus版 |
|
|
aitryon-parsing-v1 | AI試衣-圖片分割 |
AI試衣計費單價
模型服務 | 模型名稱 | 計量單價 | 折扣 | 階梯層級 |
AI試衣-Plus版 | aitryon-plus | $0.071677/張 | 無 | 無 |
AI試衣-圖片分割 | aitryon-parsing-v1 | $0.000574/張 | 無 | 無 |
視頻產生-通義萬相
文生視頻
通義萬相-文生視頻模型通過一句話即可產生視頻,視頻呈現豐富的藝術風格及影視級畫質。API參考|線上體驗
國際(新加坡)
模型名稱 | 說明 | 單價 | 免費額度(領取) 有效期間:阿里雲百鍊開通後90天內 |
wan2.6-t2v | 萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。 | 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.5-t2v-preview | 萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。 | 480P:$0.05/秒 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.2-t2v-plus | 萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。 | 480P:$0.02/秒 1080P:$0.10/秒 | 50秒 |
wan2.1-t2v-turbo | 萬相2.1極速版。產生速度快,表現均衡。 | $0.036/秒 | 200秒 |
wan2.1-t2v-plus | 萬相2.1專業版。產生細節豐富,畫面更具質感。 | $0.10/秒 | 200秒 |
中國大陸(北京)
模型名稱 | 說明 | 單價 | 免費額度 |
wan2.6-t2v | 萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。 | 720P:$0.086012/秒 1080P:0.143353/秒 | 無免費額度 |
wan2.5-t2v-preview | 萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。 | 480P:$0.043006/秒 720P:$0.086012/秒 1080P:$0.143353/秒 | 無免費額度 |
wan2.2-t2v-plus | 萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。 | 480P:$0.02007/秒 1080P:$0.100347/秒 | 無免費額度 |
wanx2.1-t2v-turbo | 產生速度更快,表現均衡。 | $0.034405/秒 | 無免費額度 |
wanx2.1-t2v-plus | 產生細節更豐富,畫面更具質感。 | $0.100347/秒 | 無免費額度 |
輸入提示詞 | 輸出視頻(wan2.6,多鏡頭視頻) |
Shot from a low angle, in a medium close-up, with warm tones, mixed lighting (the practical light from the desk lamp blends with the overcast light from the window), side lighting, and a central composition. In a classic detective office, wooden bookshelves are filled with old case files and ashtrays. A green desk lamp illuminates a case file spread out in the center of the desk. A fox, wearing a dark brown trench coat and a light gray fedora, sits in a leather chair, its fur crimson, its tail resting lightly on the edge, its fingers slowly turning yellowed pages. Outside, a steady drizzle falls beneath a blue sky, streaking the glass with meandering streaks. It slowly raises its head, its ears twitching slightly, its amber eyes gazing directly at the camera, its mouth clearly moving as it speaks in a smooth, cynical voice: 'The case was cold, colder than a fish in winter. But every chicken has its secrets, and I, for one, intended to find them '. |
圖生視頻-基於首幀
通義萬相-圖生視頻模型將輸入圖片作為視頻首幀,再根據提示詞產生視頻。視頻呈現豐富的藝術風格及影視級畫質。API參考|線上體驗
國際(新加坡)
模型名稱 | 說明 | 單價 | 免費額度(注) 有效期間:阿里雲百鍊開通後90天內 |
wan2.6-i2v | 萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。 | 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.5-i2v-preview | 萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。 | 480P:$0.05/秒 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.2-i2v-flash | 萬相2.2極速版。極致產生速度,在畫面細節表現、運動穩定性方面均有顯著提升。 | 480P:$0.015/秒 720P:$0.036/秒 | 50秒 |
wan2.2-i2v-plus | 萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。 | 480P:$0.02/秒 1080P:$0.10/秒 | 50秒 |
wan2.1-i2v-turbo | 萬相2.1極速版。產生速度快,表現均衡。 | $0.036/秒 | 200秒 |
wan2.1-i2v-plus | 萬相2.1專業版。產生細節豐富,畫面更具質感。 | $0.10/秒 | 200秒 |
中國大陸(北京)
模型名稱 | 說明 | 單價 | 免費額度 |
wan2.6-i2v | 萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。 | 720P:$0.086012/秒 1080P:$0.143353/秒 | 無免費額度 |
wan2.5-i2v-preview | 萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。 | 480P:$0.043006/秒 720P:$0.086012/秒 1080P:$0.143353/秒 | 無免費額度 |
wan2.2-i2v-plus | 萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。 | 480P:$0.02007/秒 1080P:$0.100347/秒 | 無免費額度 |
wanx2.1-i2v-turbo | 萬相2.1極速版。產生速度快,表現均衡。 | $0.034405/秒 | 無免費額度 |
wanx2.1-i2v-plus | 萬相2.1專業版。產生細節豐富,畫面更具質感。 | $0.100347/秒 | 無免費額度 |
輸入首幀映像和音頻 | 輸出視頻(wan2.6,多鏡頭視頻) |
輸入音頻: | |
輸入提示詞:一幅都市奇幻藝術的情境。一個充滿動感的塗鴉藝術角色。一個由噴漆所畫成的少年,正從一面混凝土牆上活過來。他一邊用極快的語速演唱一首英文rap,一邊擺著一個經典的、充滿活力的饒舌歌手姿勢。情境設定在夜晚一個充滿都市感的鐵路橋下。燈光來自一盞孤零零的街燈,營造齣電影般的氛圍,充滿高能量和驚人的細節。視頻的音頻部分完全由他的rap構成,沒有其他對話或雜音。 | |
圖生視頻-基於首尾幀
通義萬相-首尾幀生視頻模型,只需要提供首幀和尾幀圖片,便能根據提示詞產生一段絲滑流暢的動態視頻。視頻呈現豐富的藝術風格及影視級畫質。API參考|線上體驗
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) |
wan2.1-kf2v-plus | $0.10/秒 | 200秒 有效期間:百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度(注) |
wanx2.1-kf2v-plus | $0.100347/秒 | 無免費額度 |
輸入樣本 | 輸出視頻 | ||
首幀圖片 | 尾幀圖片 | 提示詞 | |
|
| 寫實風格,一隻黑色小貓好奇地看向天空,鏡頭從平視逐漸上升,最後俯拍小貓好奇的眼神。 | |
參考生視頻
通義萬相-參考生視頻模型支援參考輸入視頻中的角色形象和音色,搭配提示詞產生保持角色一致性的視頻。API參考
計費規則:輸入視頻和輸出視頻均計費,按視頻秒數計費,失敗不計費也不佔用免費額度。
輸入視頻的計費時間長度不超過 5 秒,具體規則參見計費與限流。
輸出視頻的計費時間長度為成功產生的視頻秒數。
國際(新加坡)
模型名稱 | 輸入單價 | 輸出單價 | 免費額度(注) |
wan2.6-r2v | 720P:$0.10/秒 1080P:$0.15/秒 | 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 有效期間:百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 輸入單價 | 輸出單價 | 免費額度(注) |
wan2.6-r2v | 720P:$0.086012/秒 1080P:$0.143353/秒 | 720P:$0.086012/秒 1080P:$0.143353/秒 | 無免費額度 |
通用視頻編輯
通義萬相-視頻編輯統一模型支援多模態輸入,包括文本、映像和視頻,能夠執行視頻產生與通用編輯任務。API參考 | 線上體驗
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) |
wan2.1-vace-plus | $0.1/秒 | 50秒 有效期間:百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 單價 | 免費額度(注) |
wanx2.1-vace-plus | $0.100347/秒 | 無免費額度 |
視頻編輯統一模型支援以下功能:
模型功能 | 輸入參考圖 | 輸入提示詞 | 輸出視頻 |
多圖參考 | 參考圖1(參考主體)
參考圖2(參考背景)
| 視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當她站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下她與大自然的美妙邂逅。 | 輸出視頻 |
視頻重繪 | 視頻展示了一輛黑色的蒸汽龐克風格汽車,紳士駕駛著,車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素,畫面複古與趣味 | ||
局部編輯 | 輸入視頻 輸入遮罩映像(白色地區表示編輯地區)
| 視頻展示了一家巴黎風情的法式咖啡館,一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯,輕輕啜飲,神情愜意。咖啡館裝飾雅緻,柔和的色調與溫暖燈光映照著獅子所在的地區。 | 根據提示詞修改編輯地區的內容 |
視頻延展 | 輸入首片段視頻(1秒) | 一隻戴著墨鏡的狗在街道上滑滑板,3D卡通。 | 輸出延長後的視頻(5秒) |
視頻畫面擴充 | 一位優雅的女士正在激情演奏小提琴,她身後是一支完整的交響樂團。 |
通義萬相-數字人
基於單張人物圖片和音頻,產生動作自然的說話、唱歌或表演視頻。使用時需依次調用下述模型。wan2.2-s2v 映像檢測 | wan2.2-s2v 視頻產生
僅支援中國大陸(北京)地區。
模型名稱 | 模型簡介 | 單價 |
wan2.2-s2v-detect | 檢查輸入映像是否滿足要求(如清晰度、單人、正面)。 | $0.000574/張 |
wan2.2-s2v | 根據檢測通過的圖片和一段音頻,產生人物動態視頻。 | 480P:$0.071677/秒 720P:$0.129018/秒 |
輸入樣本 | 輸出視頻 |
輸入音頻: |
通義萬相-圖生動作
提供標準和專業兩種服務模式,基於人物圖片和參考視頻,將視頻角色的動作、表情遷移到圖片角色中,產生人物動作視頻,賦予圖片角色動態表現力。API參考
國際(新加坡)
模型名稱 | 模型服務 | 服務簡介 | 計費單價 | 免費額度(查看) |
wan2.2-animate-move | 標準模式 | 產生速度快,滿足基礎動畫示範等輕需求,性價比高。 | $0.12/秒 | 兩種模式共50秒 |
專業模式 | 動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。 | $0.18/秒 |
中國大陸(北京)
模型名稱 | 模型服務 | 服務簡介 | 計費單價 | 免費額度(查看) |
wan2.2-animate-move | 標準模式 | 產生速度快,滿足基礎動畫示範等輕需求,性價比高。 | $0.06/秒 | 無免費額度 |
專業模式 | 動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。 | $0.09/秒 |
人物圖片 | 參考視頻 | 輸出視頻(標準模式) | 輸出視頻(專業模式) |
|
通義萬相-視頻換人
提供標準和專業兩種服務模式,基於人物圖片和參考視頻,將視頻中的主角替換為圖片中的角色,同時保留原視頻的情境、光照和色調。API 參考
國際(新加坡)
模型名稱 | 模型服務 | 服務簡介 | 計費單價 | 免費額度(查看) |
wan2.2-animate-mix | 標準模式 | 產生速度快,滿足基礎動畫示範等輕需求,性價比高。 | $0.18/秒 | 兩種服務共50秒 |
專業模式 | 動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。 | $0.26/秒 |
中國大陸(北京)
模型名稱 | 模型服務 | 服務簡介 | 計費單價 | 免費額度(查看) |
wan2.2-animate-mix | 標準模式 | 產生速度快,滿足基礎動畫示範等輕需求,性價比高。 | $0.09/秒 | 無免費額度 |
專業模式 | 動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。 | $0.13/秒 |
人物圖片 | 參考視頻 | 輸出視頻(標準模式) | 輸出視頻(專業模式) |
|
舞動人像AnimateAnyone
基於人物圖片和人物動作模板,產生人物動作視頻。直接使用時需依次調用下述三個模型。AnimateAnyone映像檢測 API詳情 | AnimateAnyone 動作模板產生| AnimateAnyone視頻產生API詳情
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 單價 |
animate-anyone-detect-gen2 | 檢測輸入的圖片是否符合要求 | $0.000574/張 |
animate-anyone-template-gen2 | 從人物運動視頻中提取人物動作並產生動作模板 | $0.011469/秒 |
animate-anyone-gen2 | 基於人物圖片和動作模板產生人物動作視頻 |
輸入:人物圖片 | 輸入:動作視頻 | 輸出(按圖片背景產生) | 輸出(按視頻背景產生) |
|
以上樣本,由整合了“舞動人像AnimateAnyone”的通義APP產生。
舞動人像AnimateAnyone模型的產生內容為視頻畫面,不包含音頻
悅動人像EMO
基於人物肖像圖片和人聲音頻檔案,產生人物肖像動態視頻。使用時需依次調用下述模型。EMO 映像檢測 | EMO 視頻產生
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 單價 |
emo-detect-v1 | 檢測輸入的圖片是否符合要求,不需要部署,可直接調用 | $0.000574/張 |
emo-v1 | 產生人物肖像動態視頻,不需要部署,可直接調用 |
|
輸入物:人物肖像圖片+人聲音頻檔案 | 輸出物:人物肖像動態視頻 |
人物肖像:
人聲音頻:參見右側視頻 | 人物視頻: 使用動作風格強度:活潑("style_level": "active") |
靈動人像LivePortrait
基於人物肖像圖片和人聲音頻檔案,快速、輕量地產生人物肖像動態視頻。與悅動人像EMO模型相比,產生速度快、價格低,但是產生效果不如悅動人像EMO模型。使用時需依次調用下述兩個模型。LivePortrait 映像檢測 | LivePortrait 視頻產生
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 單價 |
liveportrait-detect | 檢測輸入的圖片是否符合要求 | $0.000574/張 |
liveportrait | 產生人物肖像動態視頻 | $0.002868/秒 |
輸入物:人物肖像圖片+人聲音頻檔案 | 輸出物:人物肖像動態視頻 |
人物肖像:
人聲音頻:參見右側視頻 | 人物視頻: |
表情包Emoji
基於人臉圖片和預設的人臉動態模板,產生人臉動態視頻。該能力可用於表情包製作、視頻素材產生等情境。使用時需依次調用下述模型。Emoji 映像檢測 | Emoji 視頻產生
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 單價 |
emoji-detect-v1 | 檢測輸入圖片是否符合要求 | $0.000574/張 |
emoji-v1 | 基於人物肖像圖片和指定的表情包模板產生人物同款表情 | $0.011469/秒 |
輸入:人物肖像圖片 | 輸出:人物肖像動態視頻 |
| “開心”表情的模板序列:("input.driven_id": "mengwa_kaixin") |
聲動人像VideoRetalk
基於人物視頻和人聲音頻,產生人物講話口型與輸入音頻相匹配的視頻。使用時需調用下述模型。API參考
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 單價 |
videoretalk | 產生人物講話口型與輸入音頻相匹配的新視頻 | $0.011469/秒 |
視頻風格重繪
支援根據使用者輸入的文字內容,產生符合語義描述的不同風格的視頻,或者根據使用者輸入的視頻,進行視頻風格重繪。API參考
僅支援中國大陸(北京)地區。
模型名稱 | 說明 | 單價 | |
video-style-transform | 將輸入視頻轉換為日式漫畫、美式漫畫等風格 | 720P | $0.071677/秒 |
540P | $0.028671/秒 | ||
輸入視頻 | 輸出視頻(日式漫畫) |
語音合成(文本轉語音)
通義千問語音合成
支援輸入多語種混合文本,併流式輸出音頻。使用方法|API 參考
國際(新加坡)
模型名稱 | 版本 | 單價 | 最大輸入字元數 | 支援的語種 | 免費額度(注) |
qwen3-tts-flash 當前能力等同 qwen3-tts-flash-2025-11-27 | 穩定版 | $0.1/萬字元 | 600 | 中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 | 2025年11月13日0點前開通阿里雲百鍊:2000字元 2025年11月13日0點後開通阿里雲百鍊:1萬字元 有效期間:阿里雲百鍊開通後90天內 |
qwen3-tts-flash-2025-11-27 | 快照版 | 1萬字元 有效期間:阿里雲百鍊開通後90天內 | |||
qwen3-tts-flash-2025-09-18 | 快照版 | 2025年11月13日0點前開通阿里雲百鍊:2000字元 2025年11月13日0點後開通阿里雲百鍊:1萬字元 有效期間:阿里雲百鍊開通後90天內 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
中國大陸(北京)
通義千問3-TTS-Flash
模型名稱 | 版本 | 單價 | 最大輸入字元數 | 支援的語種 |
qwen3-tts-flash 當前能力等同 qwen3-tts-flash-2025-11-27 | 穩定版 | $0.114682/萬字元 | 600 | 中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 |
qwen3-tts-flash-2025-11-27 | 快照版 | |||
qwen3-tts-flash-2025-09-18 | 快照版 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
通義千問-TTS
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每千Token) | |||||
qwen-tts 當前與 qwen-tts-2025-04-10 能力相同 | 穩定版 | 8,192 | 512 | 7,680 | $0.230 | $1.434 |
qwen-tts-latest 始終與最新快照版能力相同 | 最新版 | |||||
qwen-tts-2025-05-22 | 快照版 | |||||
qwen-tts-2025-04-10 | ||||||
音頻轉換為 Token 的規則:每1秒的音頻對應 50個 Token 。若音頻時間長度不足1秒,則按 50個 Token 計算。
通義千問即時語音合成
支援文本的流式輸入併流式輸出音頻,具有根據常值內容與標點符號自適應調節語音語速的能力。使用方法 | API參考
通義千問3-TTS-VD-Realtime支援使用聲音設計音色進行即時語音合成,但不支援使用預設音色。
通義千問3-TTS-VC-Realtime支援使用聲音複刻音色進行即時語音合成,但不支援使用預設音色。
通義千問3-TTS-Flash-Realtime和通義千問-TTS-Realtime僅可使用預設音色,但不支援使用聲音複刻/設計音色。
國際(新加坡)
通義千問3-TTS-VD-Realtime
模型名稱 | 版本 | 單價 | 支援的語種 | 免費額度(注) |
qwen3-tts-vd-realtime-2025-12-16 | 快照版 | $0.143353/萬字元 | 中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 | 1萬字元 有效期間:阿里雲百鍊開通後90天內 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
通義千問3-TTS-VC-Realtime
模型名稱 | 版本 | 單價 | 支援的語種 | 免費額度(注) |
qwen3-tts-vc-realtime-2025-11-27 | 快照版 | $0.13/萬字元 | 中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 | 1萬字元 有效期間:阿里雲百鍊開通後90天內 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
通義千問3-TTS-Flash-Realtime
模型名稱 | 版本 | 單價 | 支援的語種 | 免費額度(注) |
qwen3-tts-flash-realtime 當前能力等同 qwen3-tts-flash-realtime-2025-11-27 | 穩定版 | $0.13/萬字元 | 中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 | 2025年11月13日0點前開通阿里雲百鍊:2000字元 2025年11月13日0點後開通阿里雲百鍊:1萬字元 有效期間:阿里雲百鍊開通後90天內 |
qwen3-tts-flash-realtime-2025-11-27 | 快照版 | 1萬字元 有效期間:阿里雲百鍊開通後90天內 | ||
qwen3-tts-flash-realtime-2025-09-18 | 快照版 | 2025年11月13日0點前開通阿里雲百鍊:2000字元 2025年11月13日0點後開通阿里雲百鍊:1萬字元 有效期間:阿里雲百鍊開通後90天內 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
中國大陸(北京)
通義千問3-TTS-VD-Realtime
模型名稱 | 版本 | 單價 | 支援的語種 |
qwen3-tts-vd-realtime-2025-12-16 | 快照版 | $0.143353/萬字元 | 中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
通義千問3-TTS-VC-Realtime
模型名稱 | 版本 | 單價 | 支援的語種 |
qwen3-tts-vc-realtime-2025-11-27 | 快照版 | $0.143353/萬字元 | 中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
通義千問3-TTS-Flash-Realtime
模型名稱 | 版本 | 單價 | 支援的語種 |
qwen3-tts-flash-realtime 當前能力等同 qwen3-tts-flash-realtime-2025-11-27 | 穩定版 | $0.143353/萬字元 | 中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語 |
qwen3-tts-flash-realtime-2025-11-27 | 快照版 | ||
qwen3-tts-flash-realtime-2025-09-18 | 快照版 |
按輸入的字元數計費,計算規則如下:
一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元
其他,如一個英文字母、一個標點符號、一個空格 = 1個字元
通義千問-TTS-Realtime
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 | 支援的語種 |
(Token數) | (每千Token) | ||||||
qwen-tts-realtime 當前能力等同 qwen-tts-realtime-2025-07-15 | 穩定版 | 8,192 | 512 | 7,680 | $0.345 | $1.721 | 中文、英文 |
qwen-tts-realtime-latest 當前能力等同 qwen-tts-realtime-2025-07-15 | 最新版 | 中文、英文 | |||||
qwen-tts-realtime-2025-07-15 | 快照版 | 中文、英文 | |||||
音頻轉換為 Token 的規則:每1秒的音頻對應 50個 Token 。若音頻時間長度不足1秒,則按 50個 Token 計算。
通義千問聲音複刻
聲音複刻依託大模型進行特徵提取,無需訓練即可複刻聲音。僅需提供 10~20 秒的音頻,即可產生高度相似且聽感自然的定製音色。使用方法 | API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) |
qwen-voice-enrollment | $0.01/音色 | 1000個音色 有效期間:阿里雲百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 單價 |
qwen-voice-enrollment | $0.01/音色 |
通義千問聲音設計
聲音設計通過文本描述產生定製化音色,支援多語言和多維度音色特徵定義,適用於廣告配音、角色塑造、有聲內容創作等多種應用。使用方法 | API參考
國際(新加坡)
模型名稱 | 單價 | 免費額度(注) |
qwen-voice-design | $0.2/音色 | 10個音色 有效期間:阿里雲百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 單價 |
qwen-voice-design | $0.2/音色 |
CosyVoice語音合成
CosyVoice是通義實驗室依託大規模預訓練語言模型,深度融合文本理解和語音產生的新一代產生式語音合成大模型,支援文本至語音的即時資料流式合成。使用方法 | API參考
僅支援中國大陸(北京)地區。
模型名稱 | 單價 |
cosyvoice-v3-plus | $0.286706/萬字元 |
cosyvoice-v3-flash | $0.14335/萬字元 |
cosyvoice-v2 | $0.286706/萬字元 |
字元計算規則:漢字(包括簡/繁體漢字、日文漢字和韓文漢字)按2個字元計算,其他所有字元(如字母、數字、日韓文假名/諺文等)均按 1個字元計算。SSML標籤內容不計費。
語音辨識(語音轉文本)與翻譯(語音轉成指定語種的文本)
通義千問3-LiveTranslate-Flash
通義千問3-LiveTranslate-Flash-Realtime
qwen3-livetranslate-flash-realtime 是一款多語言音視頻即時翻譯模型,可識別 18 種語言,並即時翻譯為 10 種語言的音頻。
核心特性:
多語言支援:支援 18 種語言及 6 種漢語方言。包括中文、英文、法語、德語、俄語、日語、韓語等。支援普通話、粵語、四川話等方言。
視覺增強:利用視覺內容提升翻譯準確性。模型通過分析口型、動作和畫面中的文字,改善在嘈雜環境下或一詞多義情境中的翻譯效果。
3秒延遲:實現低至 3 秒的同傳延遲。
無損同傳:通過語義單元預測技術,解決跨語言語序問題。即時翻譯品質接近離線翻譯結果。
音色自然:產生音色自然的擬人語音。模型能根據源語音內容,自適應調節語氣和情感。
國際(新加坡)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 | 免費額度 |
(Token數) | |||||
qwen3-livetranslate-flash-realtime 當前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22 | 穩定版 | 53,248 | 49,152 | 4,096 | 各100萬Token 有效期間:阿里雲百鍊開通後90天內 |
qwen3-livetranslate-flash-realtime-2025-09-22 | 快照版 | ||||
免費額度用完後,輸入與輸出的計費規則如下:
|
|
Token計算規則:
音頻:輸入或輸出每秒音頻均消耗 12.5 Token
圖片:每輸入 28*28 像素消耗 0.5 Token
中國大陸(北京)
模型名稱 | 版本 | 上下文長度 | 最大輸入 | 最大輸出 |
(Token數) | ||||
qwen3-livetranslate-flash-realtime 當前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22 | 穩定版 | 53,248 | 49,152 | 4,096 |
qwen3-livetranslate-flash-realtime-2025-09-22 | 快照版 | |||
輸入與輸出的計費規則如下:
|
|
Token計算規則:
音頻:輸入或輸出每秒音頻均消耗 12.5 Token
圖片:每輸入 28*28 像素消耗 0.5 Token
通義千問錄音檔案識別
基於通義千問多模態基座,支援多語言識別、歌唱識別、雜訊拒識等功能。使用方法 | API參考
國際(新加坡)
通義千問3-ASR-Flash-Filetrans
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 單價 | 免費額度(注) |
qwen3-asr-flash-filetrans 當前等同qwen3-asr-flash-filetrans-2025-11-17 | 穩定版 | 中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語 | 任意 | $0.000035/秒 | 36,000秒(10小時) 有效期間:阿里雲百鍊開通後90天內 |
qwen3-asr-flash-filetrans-2025-11-17 | 快照版 |
通義千問3-ASR-Flash
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 單價 | 免費額度(注) |
qwen3-asr-flash 當前等同qwen3-asr-flash-2025-09-08 | 穩定版 | 中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語 | 16kHz | $0.000035/秒 | 36,000秒(10小時) 有效期間:阿里雲百鍊開通後90天內 |
qwen3-asr-flash-2025-09-08 | 快照版 |
中國大陸(北京)
通義千問3-ASR-Flash-Filetrans
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 單價 |
qwen3-asr-flash-filetrans 當前等同qwen3-asr-flash-filetrans-2025-11-17 | 穩定版 | 中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語 | 任意 | $0.000032/秒 |
qwen3-asr-flash-filetrans-2025-11-17 | 快照版 |
通義千問3-ASR-Flash
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 單價 |
qwen3-asr-flash 當前等同qwen3-asr-flash-2025-09-08 | 穩定版 | 中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語 | 16kHz | $0.000032/秒 |
qwen3-asr-flash-2025-09-08 | 快照版 |
通義千問即時語音辨識
通義千問即時語音辨識大模型具備自動語種識別功能,可識別 11 種語音類型,並能在複雜音頻環境下較為準確地轉錄。使用方法 | API參考
國際(新加坡)
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 單價 | 免費額度(注) |
qwen3-asr-flash-realtime 當前等同qwen3-asr-flash-realtime-2025-10-27 | 穩定版 | 中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語 | 8kHz、16kHz | $0.00009/秒 | 36,000秒(10小時) 有效期間:阿里雲百鍊開通後90天內 |
qwen3-asr-flash-realtime-2025-10-27 | 快照版 |
中國大陸(北京)
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 單價 |
qwen3-asr-flash-realtime 當前等同qwen3-asr-flash-realtime-2025-10-27 | 穩定版 | 中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語 | 8kHz、16kHz | $0.000047/秒 |
qwen3-asr-flash-realtime-2025-10-27 | 快照版 |
Paraformer語音辨識
Paraformer是通義實驗室旗下的語音辨識模型,提供錄音檔案識別和即時語音辨識兩個版本。
錄音檔案識別
僅支援中國大陸(北京)地區。
模型名稱 | 支援的語言 | 支援的採樣率 | 適用情境 | 支援的音頻格式 | 單價 |
paraformer-v2 | 中文(普通話、粵語、吳語、閩南語、東北話、甘肅話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英文、日語、韓語、德語、法語、俄語 | 任意 | ApsaraVideo for Live | aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv | $0.000012/秒 |
paraformer-8k-v2 | 中文普通話 | 8kHz | 電話語音 |
即時語音辨識
僅支援中國大陸(北京)地區。
模型名稱 | 支援的語言 | 支援的採樣率 | 適用情境 | 支援的音頻格式 | 單價 |
paraformer-realtime-v2 | 中文(普通話、粵語、吳語、閩南語、東北話、甘肅話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英文、日語、韓語、德語、法語、俄語 支援多個語種自由切換 | 任意 | ApsaraVideo for Live、會議等 | pcm、wav、mp3、opus、speex、aac、amr | $0.000035/秒 |
paraformer-realtime-8k-v2 | 中文普通話 | 8kHz | 電話客服等 |
Fun-ASR語音辨識
Fun-ASR是通義百聆旗下語音辨識模型,提供錄音檔案識別和即時語音辨識兩個版本。
錄音檔案識別
國際(新加坡)
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 適用情境 | 支援的音頻格式 | 單價 | 免費額度(注) |
fun-asr 當前等同fun-asr-2025-11-07 | 穩定版 | 中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語 | 任意 | ApsaraVideo for Live、電話語音、會議同傳等 | aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv | $0.000035/秒 | 36,000秒(10小時) 有效期間90天 |
fun-asr-2025-11-07 相較fun-asr-2025-08-25做了遠場VAD最佳化,識別更准 | 快照版 | ||||||
fun-asr-2025-08-25 | 中文(普通話)、英文 | ||||||
fun-asr-mtl 當前等同fun-asr-mtl-2025-08-25 | 穩定版 | 中文(普通話、粵語)、英文、日語、韓語、越南語、印尼語、泰語、馬來語、菲律賓語、阿拉伯語、印地語、保加利亞語、克羅地亞語、捷克語、丹麥語、荷蘭語、愛沙尼亞語、芬蘭語、希臘語、匈牙利語、愛爾蘭語、拉脫維亞語、立陶宛語、馬爾他語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、瑞典語 | |||||
fun-asr-mtl-2025-08-25 | 快照版 |
中國大陸(北京)
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 適用情境 | 支援的音頻格式 | 單價 |
fun-asr 當前等同fun-asr-2025-11-07 | 穩定版 | 中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語 | 任意 | ApsaraVideo for Live、電話語音、會議同傳等 | aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv | $0.000032/秒 |
fun-asr-2025-11-07 相較fun-asr-2025-08-25做了遠場VAD最佳化,識別更准 | 快照版 | |||||
fun-asr-2025-08-25 | 中文(普通話)、英文 | |||||
fun-asr-mtl 當前等同fun-asr-mtl-2025-08-25 | 穩定版 | 中文(普通話、粵語)、英文、日語、韓語、越南語、印尼語、泰語、馬來語、菲律賓語、阿拉伯語、印地語、保加利亞語、克羅地亞語、捷克語、丹麥語、荷蘭語、愛沙尼亞語、芬蘭語、希臘語、匈牙利語、愛爾蘭語、拉脫維亞語、立陶宛語、馬爾他語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、瑞典語 | ||||
fun-asr-mtl-2025-08-25 | 快照版 |
即時語音辨識
國際(新加坡)
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 適用情境 | 支援的音頻格式 | 單價 | 免費額度(注) |
fun-asr-realtime 當前等同fun-asr-realtime-2025-11-07 | 穩定版 | 中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語 | 16kHz | ApsaraVideo for Live、會議、電話客服等 | pcm、wav、mp3、opus、speex、aac、amr | $0.00009/秒 | 36,000秒(10小時) 有效期間90天 |
fun-asr-realtime-2025-11-07 | 快照版 |
中國大陸(北京)
模型名稱 | 版本 | 支援的語言 | 支援的採樣率 | 適用情境 | 支援的音頻格式 | 單價 |
fun-asr-realtime 當前等同fun-asr-realtime-2025-11-07 | 穩定版 | 中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語 | 16kHz | ApsaraVideo for Live、會議、電話客服等 | pcm、wav、mp3、opus、speex、aac、amr | $0.000047/秒 |
fun-asr-realtime-2025-11-07 相較fun-asr-realtime-2025-09-15做了遠場VAD最佳化,識別更准 | 快照版 | |||||
fun-asr-realtime-2025-09-15 | 中文(普通話)、英文 |
文本向量
文本向量模型用於將文本轉換成一組可以代表文字的數字,適用於搜尋、聚類、推薦、分類任務。模型根據輸入Token數計費。API參考
國際(新加坡)
模型名稱 | 向量維度 | 批次大小 | 單批次最大處理Token數(注) | 支援語種 | 單價 (每百萬輸入Token) | 免費額度 |
text-embedding-v4 屬於Qwen3-Embedding系列 | 2,048、1,536、1,024(預設)、768、512、256、128、64 | 10 | 8,192 | 中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種及多種程式設計語言 | $0.07 | 100萬Token 有效期間:百鍊開通後90天內 |
text-embedding-v3 | 1,024(預設)、768或512 | 10 | 8,192 | 中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等50+語種 | 50萬Token 有效期間:百鍊開通後90天內 |
中國大陸(北京)
模型名稱 | 向量維度 | 批次大小 | 單批次最大處理Token數(注) | 支援語種 | 單價 (每百萬輸入Token) | 免費額度 |
text-embedding-v4 屬於Qwen3-Embedding系列 | 2,048、1,536、1,024(預設)、768、512、256、128、64 | 10 | 8,192 | 中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種及多種程式設計語言 | $0.072 | 無免費額度 |
批次大小指單次API調用中能處理的文本數量上限。例如,text-embedding-v4的批次大小為10,意味著一次請求最多可傳入10個文本進行向量化,且每個文本不得超過 8192 個Token。這個限制適用於:
字串數組輸入:數組最多包含10個元素。
檔案輸入:文字檔最多包含10行文本。
多模態向量
多模態向量模型將文本、映像或視頻轉換成一組由浮點數組成的向量,適用於視頻分類、映像分類、圖文檢索等。API參考
國際(新加坡)
模型名稱 | 資料類型 | 向量維度 | 單價(每百萬輸入Token) | 免費額度(注) |
tongyi-embedding-vision-plus | float(32) | 1,152 | $0.09 | 100萬Token 有效期間:百鍊開通後90天內 |
tongyi-embedding-vision-flash | float(32) | 768 | 圖片/視頻:$0.03 文本:$0.09 |
中國大陸(北京)
模型名稱 | 資料類型 | 向量維度 | 單價(每千輸入Token) | 免費額度(注) |
multimodal-embedding-v1 | float(32) | 1,024 | 免費試用 | 無Token額度限制 |
文本排序
通常用於語義檢索,即給定查詢 (Query) 和一系列候選文本 (Documents),會根據與查詢的語義相關性從高到低對候選文本進行排序。API參考
僅支援中國大陸(北京)地區。
模型名稱 | 最大Document數量 | 單行最大輸入Token | 最大輸入Token | 支援語言 | 單價(每百萬輸入Token) |
gte-rerank-v2 | 500 | 4,000 | 30,000 | 中、英、日、韓、泰語、西、法、葡、德、印尼語、阿拉伯語等50+語種 | $0.115 |
單行最大輸入Token:每個Query或Document的最大Token數量為4,000。如果輸入內容超過此長度,將會被截斷。
最大Document數量:每次請求中Document的最大數量為500。
最大輸入Token:每次請求中所有Query和Document的Token總數不得超過30,000。
行業
意圖理解
通義意圖理解模型,能夠在百毫秒級時間內快速、準確地解析使用者意圖,並選擇合適工具來解決使用者問題。API參考|使用方法
僅支援中國大陸(北京)地區。
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
tongyi-intent-detect-v3 | 8,192 | 8,192 | 1,024 | $0.058 | $0.144 |
角色扮演
通義千問的角色扮演模型,適合擬人化的對話情境(如虛擬社交、遊戲NPC、IP複刻、硬體/玩具/車機等)。相比於其它通義千問模型,提升了人設還原、話題推進、傾聽共情等能力。使用方法
國際(新加坡)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qwen-plus-character-ja | 8,192 | 7,680 | 512 | $0.5 | $1.4 |
中國大陸(北京)
模型名稱 | 上下文長度 | 最大輸入 | 最大輸出 | 輸入成本 | 輸出成本 |
(Token數) | (每百萬Token) | ||||
qwen-plus-character | 32,768 | 32,000 | 4,096 | $0.115 | $0.287 |


























































