全部產品
Search
文件中心

Alibaba Cloud Model Studio:模型列表

更新時間:Dec 24, 2025

旗艦模型

國際(新加坡)

旗艦模型

通義new 通義千問Max

適合複雜任務,能力最強

通義new 通義千問Plus

效果、速度、成本均衡

通義new 通義千問Flash

適合簡單任務,速度快、成本低

通義new 通義千問Coder

卓越的代碼模型,擅長工具調用和環境互動

最大上下文長度

(Token數)

262,144

1,000,000

1,000,000

1,000,000

最低輸入價格

(每百萬Token)

$1.2

$0.4

$0.05

$0.3

最低輸出價格

(每百萬Token)

$6

$1.2

$0.4

$1.5

中國大陸(北京)

旗艦模型

通義new 通義千問Max

適合複雜任務,能力最強

通義new 通義千問Plus

效果、速度、成本均衡

通義new 通義千問Flash

適合簡單任務,速度快、成本低

通義new 通義千問Coder

卓越的代碼模型,擅長工具調用和環境互動

最大上下文長度

(Token數)

262,144

1,000,000

1,000,000

1,000,000

最低輸入價格

(每百萬Token)

$0.459

$0.115

$0.022

$0.144

最低輸出價格

(每百萬Token)

$1.836

$0.287

$0.216

$0.574

模型總覽

國際(新加坡)

類別

子類別

說明

文本產生

通用大語言模型

通義千問大語言模型:商業版(通義千問Max通義千問Plus通義千問Flash)、開源版(Qwen3Qwen2.5

多模態模型

視覺理解模型通義千問VL、視覺推理模型QVQ、全模態模型通義千問 Omni、即時多模態模型通義千問Omni-Realtime

領域模型

代碼模型翻譯模型角色扮演模型

映像產生

文生圖

影像編輯

  • 通義千問影像編輯:支援中英文提示詞輸入,可實現風格遷移、文字修改、物體編輯等複雜圖文編輯操作。

  • 通義萬相影像編輯:可產生映像或編輯映像,適用於產生證件照、電商主圖、模特圖、各種風格人像圖(動漫、國風、二次元等),也可用於摳圖、產生背景、更改圖片元素等。

語音合成與識別

語音合成(文本轉語音)

通義千問語音合成通義千問即時語音合成可實現文本轉語音,適用於智能語音客服、有聲讀物、車載導航、教育輔導等情境。

語音辨識與翻譯

通義千問即時語音辨識通義千問錄音檔案識別Qwen3-LiveTranslate-Flash-RealtimeFun-ASR語音辨識可實現語音轉文本,適用於即時會議記錄、即時直播字幕、電話客服等情境。

視頻產生

文生視頻

一句話產生視頻,視頻風格豐富,畫質細膩。

圖生視頻

  • 首幀生視頻:將輸入圖片作為視頻首幀,並根據提示詞產生視頻。

  • 首尾幀生視頻:只需要提供首幀和尾幀圖片,便能根據提示詞產生一段絲滑流暢的動態視頻。

  • 多圖生視頻:支援輸入一張或多張圖片,參考圖片中的主體或背景,並結合提示詞產生視頻。

通用視頻編輯

通用視頻編輯:基於輸入的文本、圖片和視頻,可執行多種視頻編輯任務。例如,通過提取輸入視頻的運動特徵,並結合提示詞產生新的視頻。

向量

文本向量

將文本轉換成一組可以代表文字的數字,適用於搜尋、聚類、推薦、分類任務。

中國大陸(北京)

類別

模型

說明

文本產生

通用大語言模型

多模態模型

視覺理解模型通義千問VL、視覺推理模型QVQ、全模態模型通義千問Omni

領域模型

代碼模型數學模型翻譯模型資料採礦模型深入研究模型意圖理解模型角色扮演模型

映像產生

文生圖

  • 通義千問文生圖:在複雜文本渲染方面表現突出,特別是中英文文本渲染。

  • 通義萬相文生圖:適用於產生證件照、電商主圖、模特圖、各種風格人像圖(動漫、國風、二次元等)。

  • 通義-文生圖-Z-Image:輕量級文生圖模型,可快速產生高品質映像,支援中英雙語渲染、複雜語義理解和多風格題材。

影像編輯

通用模型:

  • 通義千問影像編輯:支援中英文提示詞輸入,可實現風格遷移、文字修改、物體編輯等複雜圖文編輯操作。

  • 通義萬相影像編輯:可產生映像或編輯映像,適用於產生證件照、電商主圖、模特圖、各種風格人像圖(動漫、國風、二次元等),也可用於摳圖、產生背景、更改圖片元素等。

更多模型:通義千問映像翻譯AI試衣

語音合成與識別

語音合成(文本轉語音)

通義千問語音合成通義千問即時語音合成CosyVoice語音合成可實現文本轉語音,適用於智能語音客服、有聲讀物、車載導航、教育輔導等情境。

語音辨識與翻譯

通義千問即時語音辨識通義千問錄音檔案識別Fun-ASR語音辨識Paraformer語音辨識可實現語音轉文本,適用於即時會議記錄、即時直播字幕、電話客服等情境。

視頻編輯與產生

文生視頻

一句話產生視頻,視頻風格豐富,畫質細膩。

圖生視頻

  • 首幀生視頻:以輸入映像作為視頻首幀,結合提示詞產生完整視頻。

  • 首尾幀生視頻:提供首幀與尾幀映像,結合提示詞產生過渡自然的視頻。

  • 多圖生視頻:支援輸入一張或多張圖片,參考圖片中的主體或背景,並結合提示詞產生視頻。

  • 圖+動作模板產生舞蹈視頻:舞動人像AnimateAnyone基於人物圖片和動作視頻產生舞蹈視頻。

  • 圖+音頻產生對口型視頻

    • 通義萬相-數字人基於人物圖片和音頻,動作幅度大且自然,支援全身、半身、肖像等多種畫幅,適合唱歌、表演等情境。

    • 悅動人像EMO基於人物圖片和音頻,口型與表情表現力強,支援肖像、半身,適合人物特寫情境。

    • 靈動人像LivePortrait基於人物圖片和音頻,適合語音播報情境。

  • 圖+表情模板產生表情包視頻:表情包Emoji基於人臉圖片和預設的人臉動態模板,產生人臉表情包視頻。

通用視頻編輯

  • 通用視頻編輯:基於輸入的文本提示詞、圖片和視頻,可執行多種視頻編輯任務。例如,通過提取輸入視頻的運動特徵,並結合提示詞產生新的視頻。

  • 視頻口型替換:聲動人像VideoRetalk基於人物視頻和音頻,適合短視頻製作、視頻翻譯等情境。

  • 視頻風格轉換:視頻風格重繪可將視頻轉換為日式漫畫、美式漫畫等風格。

向量

文本向量

將文本轉換成一組可以代表文字的數字,用於搜尋、聚類、推薦、分類等。

多模態向量

將文本、映像、語音轉換成一組數字,用於音視頻分類、映像分類、圖文檢索等。

文本產生-通義千問

以下是通義千問模型的商業版。相較於開源版,商業版具有最新的能力和改進。

商業版模型參數量暫不透出。
各模型會不定期更新升級。如需使用固定版本,請選擇快照版本。快照版本通常維護至下個快照版本發布時間的後一個月。
建議優先使用穩定版或最新版,限流條件更寬鬆。

通義千問Max

通義千問系列效果最好的模型,適合複雜、多步驟的任務。使用方法 | API參考 | 線上體驗

國際(新加坡)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每千Token)

qwen3-max

當前與qwen3-max-2025-09-23能力相同
Batch調用半價

穩定版

僅非思考

262,144

258,048

-

65,536

階梯計價,請參見表格下方說明。

各100萬Token

有效期間:百鍊開通後90天內

qwen3-max-2025-09-23

快照版

僅非思考

qwen3-max-preview

預覽版

思考

81,920

32,768

非思考

-

65,536

以上模型根據本次請求的輸入 Token數,採取階梯計費。

單次請求的輸入Token數

輸入價格(每百萬Token)

qwen3-max、qwen3-max-preview 支援上下文緩衝

輸出價格(每百萬Token)

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen-max

當前與qwen-max-2025-01-25能力相同

穩定版

32,768

30,720

8,192

$1.6

Batch調用半價

$6.4

Batch調用半價

各100萬Token

有效期間:百鍊開通後90天內

qwen-max-latest

始終與最新快照版能力相同

最新版

$1.6

$6.4

qwen-max-2025-01-25

又稱qwen-max-0125、Qwen2.5-Max

快照版

中國大陸(北京)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

輸入成本

輸出成本

(Token數)

(每千Token)

qwen3-max

當前與qwen3-max-2025-09-23能力相同
Batch調用半價

穩定版

僅非思考

262,144

258,048

-

65,536

階梯計價,請參見表格下方說明。

qwen3-max-2025-09-23

快照版

僅非思考

qwen3-max-preview

預覽版

思考

81,920

32,768

非思考

-

65,536

以上模型根據本次請求的輸入 Token數,採取階梯計費。

模型名稱

單次請求的輸入Token數

輸入單價(每百萬Token)

輸出單價(每百萬Token)

思維鏈+回答

qwen3-max

Batch調用半價
上下文緩衝享有折扣

0<Token≤32K

$0.459

$1.836

32K<Token≤128K

$0.918

$3.672

128K<Token≤252K

$1.377

$5.508

qwen3-max-2025-09-23

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.434

$5.735

128K<Token≤252K

$2.151

$8.602

qwen3-max-preview

上下文緩衝享有折扣

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.434

$5.735

128K<Token≤252K

$2.151

$8.602

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-max

當前與qwen-max-2024-09-19能力相同

穩定版

32,768

30,720

8,192

$0.345

$1.377

qwen-max-latest

始終與最新快照版能力相同

最新版

131,072

129,024

qwen-max-2025-01-25

又稱qwen-max-0125、Qwen2.5-Max

快照版

qwen-max-2024-09-19

又稱qwen-max-0919

32,768

30,720

$2.868

$8.602

qwen3-max-preview 模型的思考模式:在整體推理能力上顯著提升,尤其在智能體編程、常識推理,以及數學、科學和通用任務方面表現更優。

通義千問Plus

能力均衡,推理效果、成本和速度介於通義千問-Max和通義千問-Flash之間,適合中等複雜任務。使用方法 | API參考 | 線上體驗深度思考

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen-plus

當前與qwen-plus-2025-07-28能力相同
屬於Qwen3系列

穩定版

1,000,000

思考模式

995,904

非思考模式

997,952

預設均為262,144,可通過max_input_tokens 參數調整

32,768

思維鏈最長81,920

階梯計價,請參見表格下方說明。

各100萬Token

有效期間:百鍊開通後90天內

qwen-plus-latest

當前與qwen-plus-2025-12-01能力相同
屬於Qwen3系列

最新版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-12-01

屬於Qwen3系列

快照版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-09-11

屬於Qwen3系列

qwen-plus-2025-07-28

又稱qwen-plus-0728
屬於Qwen3系列

qwen-plus-2025-07-14

又稱qwen-plus-0714
屬於Qwen3系列

131,072

思考模式

98,304

非思考模式

129,024

16,384

思維鏈最長38,912

$0.4

思考模式

$4

非思考模式

$1.2

qwen-plus-2025-04-28

又稱qwen-plus-0428
屬於Qwen3系列

qwen-plus-2025-01-25

又稱qwen-plus-0125

129,024

8,192

$1.2

qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根據本次請求輸入的 Token數,採取階梯計費。

單次請求的輸入Token數

輸入價格(每百萬Token)

模式

輸出價格(每百萬Token)

0<Token≤256K

$0.4

非思考模式

$1.2

思考模式

$4

256K<Token≤1M

$1.2

非思考模式

$3.6

思考模式

$12

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-plus

當前與qwen-plus-2025-07-28能力相同
屬於Qwen3系列

穩定版

1,000,000

思考模式

995,904

非思考模式

997,952

預設均為131,072,可通過max_input_tokens 參數調整

32,768

思維鏈最長81,920

階梯計價,請參見表格下方說明。

qwen-plus-latest

當前與qwen-plus-2025-12-01能力相同
屬於Qwen3系列

最新版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-12-01

屬於Qwen3系列

快照版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-09-11

屬於Qwen3系列

qwen-plus-2025-07-28

又稱qwen-plus-0728
屬於Qwen3系列

qwen-plus-2025-07-14

又稱qwen-plus-0714
屬於Qwen3系列

131,072

思考模式

98,304

非思考模式

129,024

16,384

思維鏈最長38,912

$0.115

思考模式

$1.147

非思考模式

$0.287

qwen-plus-2025-04-28

又稱qwen-plus-0428
屬於Qwen3系列

qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根據本次請求輸入的 Token數,採取階梯計費。

單次請求的輸入Token數

輸入價格(每百萬Token)

模式

輸出價格(每百萬Token)

0<Token≤128K

$0.115

非思考模式

$0.287

思考模式

$1.147

128K<Token≤256K

$0.345

非思考模式

$2.868

思考模式

$3.441

256K<Token≤1M

$0.689

非思考模式

$6.881

思考模式

$9.175

上述模型支援思考模式和非思考模式,您可以通過 enable_thinking 參數實現兩種模式的切換。除此之外,模型的能力得到了大幅提升:

  1. 推理能力:在數學、代碼和邏輯推理等評測中,顯著超過 QwQ 和同尺寸的非推理模型,達到同規模業界頂尖水平。

  2. 人類偏好能力:創意寫作、角色扮演、多輪對話、指令遵循能力均大幅提升,通用能力顯著超過同尺寸模型。

  3. Agent 能力:在思考、非思考兩種模式下都達到業界領先水平,能精準調用外部工具。

  4. 多語言能力:支援100多種語言和方言,多語言翻譯、指令理解、常識推理能力都明顯提升。

  5. 回複格式:修複了之前版本存在的回複格式的問題,如異常 Markdown、中間截斷、錯誤輸出 boxed 等問題。

對於上述模型,開啟思考模式時如果沒有輸出思考過程,按非思考模式價格進行收費。

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-plus-2025-01-25

又稱qwen-plus-0125

快照版

131,072

129,024

8,192

$0.115

$0.287

qwen-plus-2025-01-12

又稱qwen-plus-0112

qwen-plus-2024-12-20

又稱qwen-plus-1220

qwen-plus-2024-11-27

又稱qwen-plus-1127

qwen-plus-2024-11-25

又稱qwen-plus-1125

qwen-plus-2024-09-19

又稱qwen-plus-0919

qwen-plus-2024-08-06

又稱qwen-plus-0806

128,000

$0.574

$1.721

通義千問Flash

通義千問系列速度最快、成本極低的模型,適合簡單任務。通義千問Flash採用靈活的階梯定價,相比通義千問Turbo計費更合理。使用方法 | API參考 | 線上體驗 | 思考模式

國際(新加坡)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

輸入成本

輸出成本

思維鏈+輸出

免費額度

(注)

(Token數)

(每千Token)

qwen-flash

當前與 qwen-flash-2025-07-28能力相同
屬於Qwen3系列
Batch調用半價

穩定版

思考

1,000,000

995,904

81,920

32,768

階梯計價,請參見表格下方說明。

各100萬Token

有效期間:百鍊開通後90天內

非思考

997,952

-

qwen-flash-2025-07-28

屬於Qwen3系列

快照版

思考

995,904

81,920

非思考

997,952

-

以上模型根據本次請求輸入的 Token數採取階梯計費,其中qwen-flash支援緩衝Batch調用

單次請求的輸入Token數

輸入價格(每百萬Token)

輸出價格(每百萬Token)

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

中國大陸(北京)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

輸入成本

輸出成本

思維鏈+輸出

(Token數)

(每千Token)

qwen-flash

當前與 qwen-flash-2025-07-28能力相同
屬於Qwen3系列

穩定版

思考

1,000,000

995,904

81,920

32,768

階梯計價,請參見表格下方說明。

非思考

997,952

-

qwen-flash-2025-07-28

屬於Qwen3系列

快照版

思考

995,904

81,920

非思考

997,952

-

以上模型根據本次請求輸入的 Token數採取階梯計費,其中qwen-flash支援上下文緩衝

單次請求的輸入Token數

輸入價格(每百萬Token)

輸出價格(每百萬Token)

0<Token≤128K

$0.022

$0.216

128K<Token≤256K

$0.087

$0.861

256K<Token≤1M

$0.173

$1.721

通義千問Turbo

通義千問Turbo 後續不再更新,建議替換為通義千問Flash。通義千問Flash採用靈活的階梯定價,計費更合理。使用方法 | API參考 | 線上體驗深度思考

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen-turbo

當前與qwen-turbo-2025-04-28能力相同
屬於Qwen3系列

穩定版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思維鏈最長38,912

$0.05

Batch調用半價

思考模式:$0.5

非思考模式:$0.2

Batch調用半價

各100萬Token

有效期間:百鍊開通後90天內

qwen-turbo-latest

始終與最新快照版能力相同
屬於Qwen3系列

最新版

$0.05

思考模式:$0.5

非思考模式:$0.2

qwen-turbo-2025-04-28

又稱qwen-turbo-0428
屬於Qwen3系列

快照版

qwen-turbo-2024-11-01

又稱qwen-turbo-1101

1,000,000

1,000,000

8,192

$0.2

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-turbo

當前與 qwen-turbo-2025-04-28能力相同
屬於Qwen3系列

穩定版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思維鏈最長38,912

$0.044

思考模式

$0.431

非思考模式

$0.087

qwen-turbo-latest

始終與最新快照版能力相同
屬於Qwen3系列

最新版

qwen-turbo-2025-07-15

又稱qwen-turbo-0715
屬於Qwen3系列

快照版

qwen-turbo-2025-04-28

又稱qwen-turbo-0428
屬於Qwen3系列

QwQ

基於 Qwen2.5 模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(IFEval、LiveBench等)達到DeepSeek-R1 滿血版水平。使用方法

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwq-plus

穩定版

131,072

98,304

32,768

8,192

$0.8

$2.4

100萬 Token

有效期間:百鍊開通後90天內

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwq-plus

當前與qwq-plus-2025-03-05能力相同

穩定版

131,072

98,304

32,768

8,192

$0.230

$0.574

qwq-plus-latest

始終與最新快照版能力相同

最新版

qwq-plus-2025-03-05

又稱qwq-plus-0305

快照版

通義千問Long

通義千問系列上下文視窗最長,能力均衡且成本較低的模型,適合長文本分析、資訊抽取、總結摘要和分類打標等任務。使用方法 | 線上體驗

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-long-latest

始終與最新快照版能力相同

穩定版

10,000,000

10,000,000

32,768

$0.072

$0.287

qwen-long-2025-01-25

又稱qwen-long-0125

快照版

通義千問Omni

Qwen-Omni 模型能夠接收文本、圖片、音頻、視頻等多種模態的組合輸入,並產生文本或語音形式的回複, 提供多種高表現力擬人音色,支援多語言和方言的語音輸出,可應用於視覺識別、情緒感知、教育培訓等音視訊交談情境。使用方法API 參考

國際(新加坡)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

免費額度

(注)

(Token數)

qwen3-omni-flash

當前與qwen3-omni-flash-2025-09-15能力相同

穩定版

思考模式

65,536

16,384

32,768

16,384

各100萬Token(不區分模態)

有效期間:百鍊開通後90天內

非思考模式

49,152

-

qwen3-omni-flash-2025-12-01

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

qwen3-omni-flash-2025-09-15

又稱qwen3-omni-flash-0915

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

免費額度用完後,輸入與輸出的計費規則如下,思考模式和非思考模式的計費相同,且思考模式下不支援輸出音頻。

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.43

輸入:音頻

$3.81

輸入:圖片/視頻

$0.78

輸出計費項目

單價(每百萬 Token)

輸出:文本

$1.66(輸入僅包含文本時)

$3.06(輸入包含圖片/視頻/音頻時)

輸出:文本+音頻

思考模式下無此項計費。

$15.11(音頻)

輸出的文本不計費。

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen-omni-turbo

當前與qwen-omni-turbo-2025-03-26能力相同

穩定版

32,768

30,720

2,048

各100萬Token(不區分模態)

有效期間:百鍊開通後90天內

qwen-omni-turbo-latest

始終與最新快照版
能力相同

最新版

qwen-omni-turbo-2025-03-26

又稱qwen-omni-turbo-0326

快照版

商業版模型的免費額度用完後,輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.07

輸入:音頻

$4.44

輸入:圖片/視頻

$0.21

輸出計費項目

單價(每百萬 Token)

輸出:文本

$0.27(輸入僅包含文本時)

$0.63(輸入包含圖片/視頻/音頻時)

輸出:文本+音頻

$8.89(音頻)

輸出的文本不計費。

中國大陸(北京)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

免費額度

(注)

(Token數)

qwen3-omni-flash

當前與qwen3-omni-flash-2025-09-15能力相同

穩定版

思考模式

65,536

16,384

32,768

16,384

無免費額度

非思考模式

49,152

-

qwen3-omni-flash-2025-12-01

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

qwen3-omni-flash-2025-09-15

又稱qwen3-omni-flash-0915

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

免費額度用完後,輸入與輸出的計費規則如下,思考模式和非思考模式的計費相同,且思考模式下不支援輸出音頻。

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.258

輸入:音頻

$2.265

輸入:圖片/視頻

$0.473

輸出計費項目

單價(每百萬 Token)

輸出:文本

$0.989(輸入僅包含文本時)

$1.821(輸入包含圖片/視頻/音頻時)

輸出:文本+音頻

思考模式下無此項計費。

$8.974(音頻)

輸出的文本不計費。

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen-omni-turbo

當前與qwen-omni-turbo-2025-03-26能力相同

穩定版

32,768

30,720

2,048

無免費額度

qwen-omni-turbo-latest

始終與最新快照版
能力相同

最新版

qwen-omni-turbo-2025-03-26

又稱qwen-omni-turbo-0326

快照版

qwen-omni-turbo-2025-01-19

又稱qwen-omni-turbo-0119

輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.058

輸入:音頻

$3.584

輸入:圖片/視頻

$0.216

輸出計費項目

單價(每百萬 Token)

輸出:文本

$0.230(輸入僅包含文本時)

$0.646(輸入包含圖片/音頻/視頻時)

輸出:文本+音頻

$7.168(音頻)

輸出的文本不計費。

計費樣本:某次請求輸入了1000 Token 的文本和1000 Token 的圖片,輸出了1000 Token 的文本和1000 Token 的音頻,則該請求花費:$0.000058(文本輸入)+ $0.000216(圖片輸入)+ $0.007168(音訊輸出)

建議優先使用Qwen3-Omni-Flash模型相較於Qwen-Omni-Turbo(後續不再更新),模型的能力得到大幅提升:

  • 屬於混合思考模型支援思考模式和非思考模式,可通過 enable_thinking 參數實現兩種模式的切換,預設不開啟思考模式。

  • 思考模式下不支援輸出音頻;在非思考模式下,對於模型輸出的音頻:

    • qwen3-omni-flash-2025-12-01支援的音色增加至49種,qwen3-omni-flash-2025-09-15、qwen3-omni-flash支援的音色增加至 17 種,Qwen-Omni-Turbo 僅支援 4 種;

    • 支援語言增加至 10 種,Qwen-Omni-Turbo 僅支援 2 種。

通義千問Omni-Realtime

相比於通義千問Omni,支援音訊流式輸入,且內建 VAD(Voice Activity Detection,語音活動檢測)功能,可自動檢測使用者語音的開始和結束。使用方法用戶端事件服務端事件

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen3-omni-flash-realtime

當前能力等同 qwen3-omni-flash-realtime-2025-09-15

穩定版

65,536

49,152

16,384

各100萬Token(不區分模態)

有效期間:百鍊開通後90天內

qwen3-omni-flash-realtime-2025-12-01

快照版

qwen3-omni-flash-realtime-2025-09-15

免費額度用完後,輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.52

輸入:音頻

$4.57

輸入:圖片

$0.94

輸出計費項目

單價(每百萬 Token)

輸出:文本

$1.99(輸入僅包含文本時)

$3.67(輸入包含圖片/音頻時)

輸出:文本+音頻

$18.13(音頻)

輸出的文本不計費。

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen-omni-turbo-realtime

當前能力等同 qwen-omni-turbo-realtime-2025-05-08

穩定版

32,768

30,720

2,048

各100萬Token(不區分模態)

有效期間:百鍊開通後90天內

qwen-omni-turbo-realtime-latest

能力始終等同最新快照版

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

免費額度用完後,輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.270

輸入:音頻

$4.440

輸入:圖片

$0.840

輸出計費項目

單價(每百萬Token)

輸出:文本

$1.070(輸入僅包含文本時)

$2.520(輸入包含圖片/音頻時)

輸出:文本+音頻

$8.890(音頻)

輸出的文本不計費。

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen3-omni-flash-realtime

當前能力等同 qwen3-omni-flash-realtime-2025-09-15

穩定版

65,536

49,152

16,384

無免費額度

qwen3-omni-flash-realtime-2025-12-01

快照版

qwen3-omni-flash-realtime-2025-09-15

免費額度用完後,輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.315

輸入:音頻

$2.709

輸入:圖片

$0.559

輸出計費項目

單價(每百萬 Token)

輸出:文本

$1.19(輸入僅包含文本時)

$2.179(輸入包含圖片/音頻時)

輸出:文本+音頻

$10.766(音頻)

輸出的文本不計費。

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen-omni-turbo-realtime

當前與qwen-omni-turbo-2025-05-08能力相同

穩定版

32,768

30,720

2,048

無免費額度

qwen-omni-turbo-realtime-latest

始終與最新快照版能力相同

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.230

輸入:音頻

$3.584

輸入:圖片

$0.861

輸出計費項目

單價(每百萬 Token)

輸出:文本

$0.918(輸入僅包含文本時)

$2.581(輸入包含圖片/音頻時)

輸出:文本+音頻

$7.168(音頻)

輸出的文本不計費。

建議優先使用Qwen3-Omni-Flash-Realtime 模型相較於Qwen-Omni-Turbo-Realtime(後續不再更新),模型的能力得到大幅提升。對於模型輸出的音頻:

  • qwen3-omni-flash-realtime-2025-12-01支援的音色增加至49種,qwen3-omni-flash-realtime-2025-09-15、qwen3-omni-realtime-flash支援的音色增加至 17 種,Qwen-Omni-Turbo-Realtime 僅支援 4 種

  • 支援的語言增加至 10 種,Qwen-Omni-Turbo-Realtime 僅支援 2 種

QVQ

QVQ是視覺推理模型,支援視覺輸入及思維鏈輸出,在數學、編程、視覺分析、創作以及通用任務上都表現了更強的能力。使用方法 | 線上體驗

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qvq-max

當前與 qvq-max-2025-03-25能力相同

穩定版

131,072

106,496

單圖最大16384

16,384

8,192

$1.2

$4.8

各100萬 Token

有效期間:百鍊開通後90天內

qvq-max-latest

始終與最新快照版能力相同

最新版

qvq-max-2025-03-25

又稱qvq-max-0325

快照版

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

(Token數)

(每百萬Token)

qvq-max

相比 qvq-plus 具有更強的視覺推理和指令遵循能力,在更多複雜任務中提供最佳效能。
當前與qvq-max-2025-03-25能力相同

穩定版

131,072

106,496

單圖最大16384

16,384

8,192

$1.147

$4.588

qvq-max-latest

始終與最新快照版能力相同

最新版

qvq-max-2025-05-15

又稱qvq-max-0515

快照版

qvq-max-2025-03-25

又稱qvq-max-0325

qvq-plus

當前與qvq-plus-2025-05-15能力相同

穩定版

$0.287

$0.717

qvq-plus-latest

始終與最新快照版能力相同

最新版

qvq-plus-2025-05-15

又稱qvq-plus-0515

快照版

通義千問VL

通義千問VL是具有視覺(映像)理解能力的文本產生模型,不僅能進行OCR(圖片文字識別),還能進一步總結和推理,例如從商品照片中提取屬性,根據習題圖進行解題等。如何使用 | API參考 | 線上體驗

通義千問VL模型按輸入和輸出的總Token數進行計費。映像Token的計算規則視覺理解

國際(新加坡)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

輸入成本

輸出成本

思維鏈+輸出

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-vl-plus

當前與qwen3-vl-plus-2025-09-23能力相同

穩定版

思考

262,144

258,048

單圖最大16384

81,920

32,768

階梯計價,請參見表格下方說明。

各100萬Token

有效期間:百鍊開通後90天內

非思考

260,096

單圖最大16384

-

qwen3-vl-plus-2025-12-19

快照版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

qwen3-vl-plus-2025-09-23

快照版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

qwen3-vl-flash

當前與qwen3-vl-flash-2025-10-15能力相同

穩定版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

qwen3-vl-flash-2025-10-15

快照版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

以上模型根據本次請求輸入的 Token數,採取階梯計費。思考模式與非思考模式的輸入輸出價格相同。

qwen3-vl-plus系列

單次請求的輸入Token數

輸入價格(每百萬Token)

輸出價格(每百萬Token)

0<Token≤32K

$0.2

$1.6

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-flash系列

單次請求的輸入Token數

輸入價格(每百萬Token)

輸出價格(每百萬Token)

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

更多模型

Qwen-VL-Max

Qwen-VL-Max效果優於Qwen-VL-Plus,以下模型均屬於Qwen2.5-VL系列。

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen-vl-max

相比qwen-vl-plus再次提升視覺推理和指令遵循能力,在更多複雜任務中提供最佳效能。
當前與qwen-vl-max-2025-08-13能力相同

穩定版

131,072

129,024

單圖最大16384

8,192

$0.8

Batch調用半價

$3.2

Batch調用半價

各100萬Token

有效期間:百鍊開通後90天內

qwen-vl-max-latest

始終與最新快照版能力相同

最新版

$0.8

$3.2

qwen-vl-max-2025-08-13

又稱qwen-vl-max-0813
視覺理解指標全面提升,數學、推理、物體識別、多語言處理能力顯著增強。

快照版

qwen-vl-max-2025-04-08

又稱qwen-vl-max-0408
屬於Qwen2.5-VL系列模型,擴充上下文至128k,顯著增強數學和推理能力。
Qwen-VL-Plus

Qwen-VL-Plus模型在效果、成本上比較均衡。以下模型均屬於Qwen2.5-VL系列。

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen-vl-plus

當前與qwen-vl-plus-2025-08-15能力相同

穩定版

131,072

129,024

單圖最大16384

8,192

$0.21

Batch調用半價

$0.63

Batch調用半價

各100萬Token

有效期間:百鍊開通後90天內

qwen-vl-plus-latest

始終與最新快照版能力相同

最新版

$0.21

$0.63

qwen-vl-plus-2025-08-15

又稱qwen-vl-plus-0815
在物體識別與定位、多語言處理的能力上有顯著提升

快照版

qwen-vl-plus-2025-05-07

又稱qwen-vl-plus-0507
顯著提升數學、推理、監控視頻內容的理解能力

qwen-vl-plus-2025-01-25

又稱qwen-vl-plus-0125
屬於Qwen2.5-VL系列模型,擴充上下文至128k,顯著增強映像和視頻的理解能力。

中國大陸(北京)

模型名稱

版本

模式

上下文長度

最大輸入

最長思維鏈

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-vl-plus

當前與qwen3-vl-plus-2025-09-23能力相同

穩定版

思考

262,144

258,048

單圖最大16384

81,920

32,768

階梯計價,請參見表格下方說明。

無免費額度

非思考

260,096

單圖最大16384

-

qwen3-vl-plus-2025-12-19

快照版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

qwen3-vl-plus-2025-09-23

快照版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

qwen3-vl-flash

當前與qwen3-vl-flash-2025-10-15能力相同

穩定版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

qwen3-vl-flash-2025-10-15

快照版

思考

258,048

單圖最大16384

81,920

非思考

260,096

單圖最大16384

-

以上模型根據本次請求輸入的 Token數,採取階梯計費。思考模式與非思考模式的輸入輸出價格相同。

qwen3-vl-plus系列

單次請求的輸入Token數

輸入價格(每百萬Token)

輸出價格(每百萬Token)

0<Token≤32K

$0.143353

$1.433525

32K<Token≤128K

$0.215029

$2.150288

128K<Token≤256K

$0.430058

$4.300576

qwen3-vl-flash系列

單次請求的輸入Token數

輸入價格(每百萬Token)

輸出價格(每百萬Token)

0<Token≤32K

$0.022

$0.215

32K<Token≤128K

$0.043

$0.43

128K<Token≤256K

$0.086

$0.859

更多模型

通義千問VL-Max系列
qwen-vl-max-2025-01-25及以後更新的模型均屬於Qwen2.5-VL系列。

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-vl-max

相比qwen-vl-plus再次提升視覺推理和指令遵循能力,在更多複雜任務中提供最佳效能
當前與qwen-vl-max-2025-08-13能力相同

穩定版

131,072

129,024

單圖最大16384

8,192

$0.23

$0.574

qwen-vl-max-latest

始終與最新快照版能力相同

最新版

qwen-vl-max-2025-08-13

又稱qwen-vl-max-0813
視覺理解指標全面提升,數學、推理、物體識別、多語言處理能力顯著增強。

快照版

qwen-vl-max-2025-04-08

又稱qwen-vl-max-0408
增強數學和推理能力

$0.431

$1.291

qwen-vl-max-2025-04-02

又稱qwen-vl-max-0402
顯著提高解決複雜數學問題的準確性

qwen-vl-max-2025-01-25

又稱qwen-vl-max-0125

升級至Qwen2.5-VL系列,擴充上下文至128k,顯著增強映像和視頻的理解能力

qwen-vl-max-2024-12-30

又稱qwen-vl-max-1230

32,768

30,720

單圖最大16384

2,048

$0.431

$1.291

qwen-vl-max-2024-11-19

又稱qwen-vl-max-1119

qwen-vl-max-2024-10-30

又稱qwen-vl-max-1030

$2.868

qwen-vl-max-2024-08-09

又稱qwen-vl-max-0809
通義千問VL-Plus系列
qwen-vl-plus-2025-01-25及以後更新的模型均屬於Qwen2.5-VL系列。

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-vl-plus

當前與qwen-vl-plus-2025-08-15能力相同

穩定版

131,072

129,024

單圖最大16384

8,192

$0.115

$0.287

qwen-vl-plus-latest

始終與最新快照版能力相同

最新版

qwen-vl-plus-2025-08-15

又稱qwen-vl-plus-0815
在物體識別與定位、多語言處理的能力上有顯著提升

快照版

qwen-vl-plus-2025-07-10

又稱qwen-vl-plus-0710
進一步提升監控視頻內容的理解能力

32,768

30,720

單圖最大16384

$0.022

$0.216

qwen-vl-plus-2025-05-07

又稱qwen-vl-plus-0507
顯著提升數學、推理、監控視頻內容的理解能力

131,072

129,024

單圖最大16384

$0.216

$0.646

qwen-vl-plus-2025-01-25

又稱qwen-vl-plus-0125

升級至Qwen2.5-VL系列,擴充上下文至128k,顯著增強映像和視頻理解能力

qwen-vl-plus-2025-01-02

又稱qwen-vl-plus-0102

32,768

30,720

單圖最大16384

2,048

qwen-vl-plus-2024-08-09

又稱qwen-vl-plus-0809

通義千問OCR

通義千問OCR模型是專用於文字提取的模型。相較於通義千問VL模型,它更專註於文檔、表格、試題、手寫體文字等類型映像的文字提取能力。它能夠識別多種語言,包括英語、法語、日語、韓語、德語、俄語和意大利語等。使用方法 | API參考線上體驗

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入單價

輸出單價

免費額度

(注)

(Token數)

(每百萬Token)

qwen-vl-ocr

穩定版

34,096

30,000

單圖最大30000

4096

$0.72

$0.72

各100萬Token

有效期間:百鍊開通後90天內

qwen-vl-ocr-2025-11-20

又稱qwen-vl-ocr-1120
基於Qwen3-VL架構,大幅提升文檔解析、文字定位能力。

快照版

38,192

8,192

$0.07

$0.16

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入單價

輸出單價

免費額度

(注)

(Token數)

(每百萬Token)

qwen-vl-ocr

當前與qwen-vl-ocr-2025-08-28能力相同

穩定版

34,096

30,000

單圖最大30000

4,096

$0.717

$0.717

無免費額度

qwen-vl-ocr-latest

始終與最新版能力相同

最新版

38,192

8,192

$0.043

$0.072

qwen-vl-ocr-2025-11-20

又稱qwen-vl-ocr-1120
基於Qwen3-VL架構,大幅提升文檔解析、文字定位能力。

快照版

qwen-vl-ocr-2025-08-28

又稱qwen-vl-ocr-0828

34,096

4,096

$0.717

$0.717

qwen-vl-ocr-2025-04-13

又稱qwen-vl-ocr-0413

qwen-vl-ocr-2024-10-28

又稱qwen-vl-ocr-1028

通義千問數學模型

通義千問數學模型是專門用於數學解題的語言模型。使用方法 | API參考 | 線上體驗

說明

僅支援中國大陸(北京)地區。

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-math-plus

當前與qwen-math-plus-2024-09-19能力相同

穩定版

4,096

3,072

3,072

$0.574

$1.721

qwen-math-plus-latest

始終與最新快照版能力相同

最新版

qwen-math-plus-2024-09-19

又稱qwen-math-plus-0919

快照版

qwen-math-plus-2024-08-16

又稱qwen-math-plus-0816

qwen-math-turbo

當前與qwen-math-turbo-2024-09-19能力相同

穩定版

$0.287

$0.861

qwen-math-turbo-latest

始終與最新快照版能力相同

最新版

qwen-math-turbo-2024-09-19

又稱qwen-math-turbo-0919

快照版

通義千問Coder

通義千問代碼模型。最新的 Qwen3-Coder-Plus 系列模型是基於 Qwen3 的代碼產生模型,具有強大的Coding Agent能力,擅長工具調用和環境互動,能夠實現自主編程,代碼能力卓越的同時兼具通用能力。使用方法 | API參考 | 線上體驗

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-coder-plus

當前與qwen3-coder-plus-2025-07-22能力相同

穩定版

1,000,000

997,952

65,536

階梯計價,請參見表格下方說明。

各100萬Token

有效期間:百鍊開通後90天內

qwen3-coder-plus-2025-09-23

快照版

qwen3-coder-plus-2025-07-22

快照版

qwen3-coder-flash

當前與qwen3-coder-flash-2025-07-28能力相同

穩定版

qwen3-coder-flash-2025-07-28

快照版

上述模型根據本次請求輸入的Token數,採取階梯計費。

qwen3-coder-plus系列

qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 價格如下,其中 qwen3-coder-plus 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。

單次請求的輸入Token數

輸入成本(每百萬Token)

輸出成本(每百萬Token)

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-flash系列

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 價格如下,其中 qwen3-coder-flash 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。

單次請求的輸入Token數

輸入成本(每百萬Token)

輸出成本(每百萬Token)

0<Token≤32K

$0.3

$1.5

32K<Token≤128K

$0.5

$2.5

128K<Token≤256K

$0.8

$4

256K<Token≤1M

$1.6

$9.6

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen3-coder-plus

當前與qwen3-coder-plus-2025-07-22能力相同

穩定版

1,000,000

997,952

65,536

階梯計價,請參見表格下方說明。

qwen3-coder-plus-2025-09-23

快照版

qwen3-coder-plus-2025-07-22

快照版

qwen3-coder-flash

當前與qwen3-coder-flash-2025-07-28能力相同

穩定版

qwen3-coder-flash-2025-07-28

快照版

上述模型根據本次請求輸入的Token數,採取階梯計費。

qwen3-coder-plus系列

qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 價格如下,其中 qwen3-coder-plus 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。

單次請求的輸入Token數

輸入成本(每百萬Token)

輸出成本(每百萬Token)

0<Token≤32K

$0.574

$2.294

32K<Token≤128K

$0.861

$3.441

128K<Token≤256K

$1.434

$5.735

256K<Token≤1M

$2.868

$28.671

qwen3-coder-flash系列

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 價格如下,其中 qwen3-coder-flash 支援上下文緩衝,命中隱式緩衝的輸入文本按單價的 20% 計費,命中顯式緩衝的輸入文本按單價的 10% 計費。

單次請求的輸入Token數

輸入成本(每百萬Token)

輸出成本(每百萬Token)

0<Token≤32K

$0.144

$0.574

32K<Token≤128K

$0.216

$0.861

128K<Token≤256K

$0.359

$1.434

256K<Token≤1M

$0.717

$3.584

更多模型

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-coder-plus

當前與qwen-coder-plus-2024-11-06能力相同

穩定版

131,072

129,024

8,192

$0.502

$1.004

qwen-coder-plus-latest

與qwen-coder-plus的最新快照版能力相同

最新版

qwen-coder-plus-2024-11-06

又稱qwen-coder-plus-1106

快照版

qwen-coder-turbo

當前與qwen-coder-turbo-2024-09-19能力相同

穩定版

131,072

129,024

8,192

$0.287

$0.861

qwen-coder-turbo-latest

與qwen-coder-turbo的最新快照版能力相同

最新版

qwen-coder-turbo-2024-09-19

又稱qwen-coder-turbo-0919

快照版

通義千問翻譯模型

基於 Qwen 3全面升級的旗艦級翻譯大模型,支援92個語種(包括中、英、日、韓、法、西、德、泰、印尼、越、阿等)互譯,模型效能和翻譯效果全面升級,提供更穩定的術語定製、格式還原度、領域提示能力,讓譯文更精準、自然。使用方法

國際(新加坡)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

規則說明

(Token數)

(每百萬Token)

qwen-mt-plus

屬於Qwen3-MT

16,384

8,192

8,192

$2.46

$7.37

各100萬Token

有效期間:百鍊開通後90天內

qwen-mt-flash

屬於Qwen3-MT

$0.16

$0.49

qwen-mt-lite

屬於Qwen3-MT

$0.12

$0.36

qwen-mt-turbo

屬於Qwen3-MT

$0.16

$0.49

中國大陸(北京)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-mt-plus

屬於Qwen3-MT

16,384

8,192

8,192

$0.259

$0.775

qwen-mt-flash

屬於Qwen3-MT

$0.101

$0.280

qwen-mt-lite

屬於Qwen3-MT

$0.086

$0.229

qwen-mt-turbo

屬於Qwen3-MT

$0.101

$0.280

通義千問資料採礦模型

通義千問資料採礦模型可以提取文檔中的結構化資訊並用於資料標註和內容審核等領域。使用方法 | API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(Token數)

(每百萬Token)

qwen-doc-turbo

262,144

253,952

32,768

$0.087

$0.144

無免費額度

通義千問深入研究模型

通義千問深入研究模型可以拆解複雜問題,結合互連網搜尋進行推理分析並產生研究報告。使用方法 | API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每千Token)

qwen-deep-research

1,000,000

997,952

32,768

$0.007742

$0.023367

文本產生-通義千問-開源版

  • 模型名稱中,xxb表示參數規模,例如qwen2-72b-instruct表示參數規模為72B,即720億。

  • 百鍊支援調用通義千問的開源版,您無需本地部署模型。對於開源版,建議使用Qwen3和Qwen2.5模型。

Qwen3

2025 年 9月發布的 qwen3-next-80b-a3b-thinking 僅支援思考模式,相較於qwen3-235b-a22b-thinking-2507提升了指令遵循能力,總結回複更加精簡。

2025 年 9月發布的 qwen3-next-80b-a3b-instruct 僅支援非思考模式,相較於qwen3-235b-a22b-instruct-2507增強了中文理解、邏輯推理及文本產生能力。

2025 年 7月發布的 qwen3-235b-a22b-thinking-2507、qwen3-30b-a3b-thinking-2507 模型僅支援思考模式,是qwen3-235b-a22b(思考模式)與qwen3-30b-a3b (思考模式)的升級版。

2025 年 7月發布的 qwen3-235b-a22b-instruct-2507、qwen3-30b-a3b-instruct-2507 模型僅支援非思考模式,是qwen3-235b-a22b(非思考模式)與qwen3-30b-a3b (非思考模式)的升級版。

2025 年 4月發布的 Qwen3 模型支援思考模式和非思考模式,您可以通過 enable_thinking 參數實現兩種模式的切換。除此之外,Qwen3 模型的能力得到了大幅提升:

  1. 推理能力:在數學、代碼和邏輯推理等評測中,顯著超過 QwQ 和同尺寸的非推理模型,達到同規模業界頂尖水平。

  2. 人類偏好能力:創意寫作、角色扮演、多輪對話、指令遵循能力均大幅提升,通用能力顯著超過同尺寸模型。

  3. Agent 能力:在推理、非推理兩種模式下都達到業界領先水平,能夠實現精準的外部工具調用。

  4. 多語言能力:支援100多種語言和方言,多語言翻譯、指令理解、常識推理能力都明顯提升。

    支援的語言

    英語(English)

    簡體中文(Simplified Chinese)

    繁體中文(Traditional Chinese)

    法語(French)

    西班牙語(Spanish)

    阿拉伯語(Arabic),使用阿拉伯字母。是眾多阿拉伯國家的官方語言。

    俄語(Russian),使用西裡爾字母。在俄羅斯及其他一些國家是官方語言。

    葡萄牙語(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙語國家是官方語言。

    德語(German),使用拉丁字母。在德國和奧地利等地是官方語言。

    意大利語(Italian),使用拉丁字母。在意大利、聖馬力諾以及瑞士的部分地區是官方語言。

    荷蘭語(Dutch),使用拉丁字母。在荷蘭、比利時部分地區(弗拉芒地區)和蘇里南是官方語言。

    丹麥語(Danish),使用拉丁字母。在丹麥是官方語言。

    愛爾蘭語(Irish),使用拉丁字母。在愛爾蘭是官方語言之一。

    威爾士語(Welsh),使用拉丁字母。在威爾士使用,是官方語言之一。

    芬蘭語(Finnish),使用拉丁字母。在芬蘭是官方語言。

    冰島語(Icelandic),使用拉丁字母。在冰島是官方語言。

    瑞典語(Swedish),使用拉丁字母。是瑞典的官方語言。

    新挪威語(Norwegian Nynorsk),使用拉丁字母。在挪威與書面挪威語共同使用,屬主流語言的一部分。

    書面挪威語(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流語言的一部分。

    日語(Japanese),使用日文字母。在日本是官方語言。

    朝鮮語/韓語(Korean),使用韓字(Hangul)。在韓國和朝鮮是官方語言。

    越南語(Vietnamese),使用拉丁字母。在越南是官方語言。

    泰語(Thai),使用泰文字母。在泰國是官方語言。

    印尼語(Indonesian),使用拉丁字母。是印尼的官方語言。

    馬來語(Malay),使用拉丁字母。是馬來西亞等地的主要語言。

    緬甸語(Burmese),使用緬甸字母。在緬甸是官方語言。

    他加祿語(Tagalog),使用拉丁字母。菲律賓的主要語言之一。

    高棉語(Khmer),使用高棉字母。在柬埔寨是官方語言。

    寮國語(Lao),使用寮國字母。在寮國是官方語言。

    印地語(Hindi),使用天城文(Devanagari)。是印度的官方語言之一。

    孟加拉語(Bengali),使用孟加拉字母。在孟加拉國和印度西孟加拉邦是官方語言。

    烏爾都語(Urdu),使用阿拉伯字母。在巴基斯坦是官方語言之一,也在印度使用。

    尼泊爾語(Nepali),使用天城字母。在尼泊爾是官方語言。

    希伯來語(Hebrew),使用希伯來字母。在以色列是官方語言。

    土耳其語(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方語言。

    波斯語(Persian),使用阿拉伯字母。在伊朗和塔吉克等地是官方語言。

    波蘭語(Polish),使用拉丁字母。在波蘭是官方語言。

    烏克蘭語(Ukrainian),使用西裡爾字母。在烏克蘭是官方語言。

    捷克語(Czech),使用拉丁字母。在捷克是官方語言。

    羅馬尼亞語(Romanian),使用拉丁字母。在羅馬尼亞和摩爾多瓦是官方語言。

    保加利亞語(Bulgarian),使用西裡爾字母。在保加利亞是官方語言。

    斯洛伐克語(Slovak),使用拉丁字母。在斯洛伐克是官方語言。

    匈牙利語(Hungarian),使用拉丁字母。在匈牙利是官方語言。

    斯洛文尼亞語(Slovenian),使用拉丁字母。在斯洛文尼亞是官方語言。

    拉脫維亞語(Latvian),使用拉丁字母。在拉脫維亞是官方語言。

    愛沙尼亞語(Estonian),使用拉丁字母。在愛沙尼亞是官方語言。

    立陶宛語(Lithuanian),使用拉丁字母。在立陶宛是官方語言。

    白俄羅斯語(Belarusian),使用西裡爾字母。在白俄羅斯是官方語言之一。

    希臘語(Greek),使用希臘字母。在希臘和塞浦路斯是官方語言。

    克羅地亞語(Croatian),使用拉丁字母。在克羅地亞是官方語言。

    馬其頓語(Macedonian),使用西裡爾字母。是北馬其頓的官方語言。

    馬爾他語(Maltese),使用拉丁字母。在馬爾他是官方語言。

    塞爾維亞語(Serbian),使用西裡爾字母。在塞爾維亞是官方語言。

    波斯尼亞語(Bosnian),使用拉丁字母。在波斯尼亞黑塞哥維那是官方語言之一。

    格魯吉亞語(Georgian),使用格魯吉亞字母(Georgian script)。在格魯吉亞是官方語言。

    亞美尼亞語(Armenian),使用亞美尼亞字母。在亞美尼亞是官方語言。

    北阿塞拜疆語(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方語言。

    哈薩克語(Kazakh),使用西裡爾字母。在哈薩克是官方語言。

    北烏茲別克語(Northern Uzbek),使用拉丁字母。在烏茲別克是官方語言。

    塔吉克語(Tajik),使用西裡爾字母。在塔吉克是官方語言。

    斯瓦西裡語(Swahili),使用拉丁字母。在東非許多國家是通用語或官方語言。

    南非語(Afrikaans),使用拉丁字母。主要在南非和納米比亞使用。

    粵語(Cantonese),使用繁體字。主要在中國廣東省、香港和澳門使用,是這些地區的主要語言之一。

    盧森堡語(Luxembourgish),使用拉丁字母。在盧森堡和德國部分地區使用,是官方語言之一。

    林堡語(Limburgish),使用拉丁字母。主要在荷蘭、比利時和德國部分地區使用。

    加泰羅尼亞語(Catalan),使用拉丁字母。在加泰羅尼亞和其他部分西班牙地區使用。

    加利西亞語(Galician),使用拉丁字母。主要在西班牙加利西亞地區使用。

    阿斯圖里亞斯語(Asturian),使用拉丁字母。主要在西班牙阿斯圖里亞斯地區使用。

    巴斯克語(Basque),使用拉丁字母。主要在西班牙和法國的巴斯克地區使用,是西班牙巴斯克自治區的官方語言之一。

    奧克語(Occitan),使用拉丁字母。主要在法國南部地區使用。

    威尼斯語(Venetian),使用拉丁字母。主要在意大利威尼斯地區使用。

    撒丁語(Sardinian),使用拉丁字母。主要在意大利撒丁島使用。

    西西里語(Sicilian),使用拉丁字母。主要在意大利西西里島使用。

    弗留利語(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亞使用。

    隆巴底語(Lombard),使用拉丁字母。主要在意大利倫巴第地區使用。

    利古裡亞語(Ligurian),使用拉丁字母。主要在意大利利古裡亞地區使用。

    法羅語(Faroese),使用拉丁字母。主要在法羅群島使用,是法羅群島的官方語言之一。

    托斯克阿爾巴尼亞語(Tosk Albanian),使用拉丁字母。主要是阿爾巴尼亞南部方言。

    西裡西亞語(Silesian),使用拉丁字母。主要在波蘭使用。

    巴什基爾語(Bashkir),使用西裡爾字母。主要在俄羅斯巴什科爾托斯坦使用。

    韃靼語(Tatar),使用西裡爾字母。主要在俄羅斯塔塔爾斯坦使用。

    美索不達米亞阿拉伯語(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

    內志阿拉伯語(Najdi Arabic),使用阿拉伯字母。主要在沙地阿拉伯的內志地區使用。

    埃及阿拉伯語(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

    黎凡特阿拉伯語(Levantine Arabic),使用阿拉伯字母。主要在敘利亞和黎巴嫩使用。

    閃米特阿拉伯語(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也門和沙地阿拉伯的哈德拉莫地區使用。

    達裡語(Dari),使用阿拉伯字母。在阿富汗是官方語言之一。

    突尼斯阿拉伯語(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

    摩洛哥阿拉伯語(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

    克裡奧爾語(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

    托克皮辛語(Tok Pisin),使用拉丁字母。在巴布亞新畿內亞是主要的通用語之一。

    意第緒(Eastern Yiddish),使用希伯來字母。主要在猶太社區中使用。

    信德阿拉伯語(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方語言之一。

    僧伽羅語(Sinhala),使用僧伽羅字母。在斯裡蘭卡是官方語言之一。

    泰盧固語(Telugu),使用泰盧固字母。在印度安得拉邦和特倫甘納邦是官方語言之一。

    旁遮普語(Punjabi),使用古爾穆奇字母。在印度旁遮普邦使用,是印度的官方語言之一。

    泰米爾語(Tamil),使用泰米爾字母。在印度泰米爾納德邦和斯裡蘭卡是官方語言之一。

    古吉拉特語(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方語言之一。

    馬拉雅拉姆語(Malayalam),使用馬拉雅拉姆字母。在印度喀拉拉邦是官方語言之一。

    馬拉地語(Marathi),使用天城字母。在印度馬哈拉施特拉邦是官方語言之一。

    卡納達語(Kannada),使用卡納達字母。在印度卡納塔克邦是官方語言之一。

    馬加拉語(Magahi),使用天城文本。主要在印度比哈爾邦使用。

    奧裡亞語(Oriya),使用烏爾都語字母。在印度奧迪沙邦是官方語言之一。

    阿瓦德語(Awadhi),使用天城字母。主要在印度北方邦使用。

    邁蒂利語(Maithili),使用天城字母。在印度比哈爾邦和尼泊爾特萊平原使用,是印度的官方語言之一。

    阿薩姆語(Assamese),使用孟加拉字母。在印度阿薩姆邦是官方語言之一。

    切蒂斯格爾語(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格爾邦使用。

    比哈爾語(Bhojpuri),使用天城字母。在印度和尼泊爾部分地區使用。

    米南加保語(Minangkabau),使用拉丁字母。主要在印尼蘇門答臘島使用。

    巴厘語(Balinese),使用拉丁字母。主要在印尼巴厘島使用。

    爪哇語(Javanese),使用拉丁字母(也慣用爪哇文字)。在印尼爪哇島廣泛使用。

    班章語(Banjar),使用拉丁字母。主要在印尼加裡曼丹島使用。

    巽他語(Sundanese),使用拉丁字母(雖然傳統上使用巽他文字)。主要在印尼爪哇島的西部使用。

    宿務語(Cebuano),使用拉丁字母。主要在菲律賓宿務地區使用。

    邦阿西楠語(Pangasinan),使用拉丁字母。主要在菲律賓邦阿西楠語省使用。

    伊洛卡諾語(Iloko),使用拉丁字母。主要在菲律賓使用。

    瓦萊語(Waray (Philippines)),使用拉丁字母。主要在菲律賓使用。

    海地語(Haitian),使用拉丁字母。在海地是官方語言之一。

    帕皮阿門托語(Papiamento),使用拉丁字母。主要在加勒比地區如阿魯巴島和庫拉索島使用。

  5. 回複格式問題修複:修複了之前版本存在的回複格式的問題,如異常 Markdown、中間截斷、錯誤輸出 boxed 等問題。

2025 年 4月發布的Qwen3 開源模型在思考模式下不支援非流式輸出方式。
Qwen3 開源模型開啟思考模式時如果沒有輸出思考過程,按非思考模式價格進行收費。

思考模式 | 非思考模式 | 使用方法

國際(新加坡)

模型名稱

模式

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-next-80b-a3b-thinking

僅支援思考模式

131,072

126,976

81,920

32,768

$0.15

$1.2

各100萬 Token

有效期間:百鍊開通後90天內

qwen3-next-80b-a3b-instruct

不支援思考模式

129,024

-

qwen3-235b-a22b-thinking-2507

僅支援思考模式

126,976

81,920

$0.23

$2.3

qwen3-235b-a22b-instruct-2507

不支援思考模式

129,024

-

$0.92

qwen3-30b-a3b-thinking-2507

僅支援思考模式

126,976

81,920

$0.2

$2.4

qwen3-30b-a3b-instruct-2507

不支援思考模式

129,024

-

$0.8

qwen3-235b-a22b

本模型與以下模型均於2025 年 4月發布

非思考

129,024

-

16,384

$0.7

$2.8

思考

98,304

38,912

$8.4

qwen3-32b

非思考

129,024

-

$0.16

$0.64

思考

98,304

38,912

qwen3-30b-a3b

非思考

129,024

-

$0.2

$0.8

思考

98,304

38,912

$2.4

qwen3-14b

非思考

129,024

-

8,192

$0.35

$1.4

思考

98,304

38,912

$4.2

qwen3-8b

非思考

129,024

-

$0.18

$0.7

思考

98,304

38,912

$2.1

qwen3-4b

非思考

129,024

-

$0.11

$0.42

思考

98,304

38,912

$1.26

qwen3-1.7b

非思考

32,768

30,720

-

$0.42

思考

28,672

與輸入相加不超過30,720

$1.26

qwen3-0.6b

非思考

30,720

-

$0.42

思考

28,672

與輸入相加不超過30,720

$1.26

中國大陸(北京)

模型名稱

模式

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen3-next-80b-a3b-thinking

僅思考模式

131,072

126,976

81,920

32,768

$0.144

$1.434

qwen3-next-80b-a3b-instruct

僅非思考模式

129,024

-

$0.574

qwen3-235b-a22b-thinking-2507

僅思考模式

126,976

81,920

$0.287

$2.868

qwen3-235b-a22b-instruct-2507

僅非思考模式

129,024

-

$1.147

qwen3-30b-a3b-thinking-2507

僅思考模式

126,976

81,920

$0.108

$1.076

qwen3-30b-a3b-instruct-2507

僅非思考模式

129,024

-

$0.431

qwen3-235b-a22b

非思考

129,024

-

16,384

$0.287

$1.147

思考

98,304

38,912

$2.868

qwen3-32b

非思考

129,024

-

$0.287

$1.147

思考

98,304

38,912

$2.868

qwen3-30b-a3b

非思考

129,024

-

$0.108

$0.431

思考

98,304

38,912

$1.076

qwen3-14b

非思考

129,024

-

8,192

$0.144

$0.574

思考

98,304

38,912

$1.434

qwen3-8b

非思考

129,024

-

$0.072

$0.287

思考

98,304

38,912

$0.717

qwen3-4b

非思考

129,024

-

$0.044

$0.173

思考

98,304

38,912

$0.431

qwen3-1.7b

非思考

32,768

30,720

-

$0.173

思考

28,672

與輸入相加不超過30,720

$0.431

qwen3-0.6b

非思考

30,720

-

$0.173

思考

28,672

與輸入相加不超過30,720

$0.431

QwQ-開源版

基於 Qwen2.5-32B 模型訓練的 QwQ 推理模型,通過強化學習大幅度提升了模型推理能力。模型數學代碼等核心指標(AIME 24/25、LiveCodeBench)以及部分通用指標(IFEval、LiveBench等)達到DeepSeek-R1 滿血版水平,各指標均顯著超過同樣基於 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法API 參考

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwq-32b

131,072

98,304

32,768

8,192

$0.287

$0.861

QwQ-Preview

qwq-32b-preview 模型是由 Qwen 團隊於2024年開發的實驗性研究模型,專註於增強 AI 推理能力,尤其是數學和編程領域。qwq-32b-preview 模型的局限性請參見QwQ官方部落格使用方法 | API參考線上體驗

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwq-32b-preview

32,768

30,720

16,384

$0.287

$0.861

Qwen2.5

Qwen2.5是Qwen大型語言模型系列。針對Qwen2.5,我們發布了一系列基礎語言模型和指令調優語言模型,參數規模從70億到720億不等。Qwen2.5在Qwen2基礎上進行了以下改進:

  • 在我們最新的大規模資料集上進行預訓練,包含多達18萬億個Token。

  • 由於我們在這些領域的專業專家模型,模型的知識顯著增多,編碼和數學能力也大幅提高。

  • 在遵循指令、產生長文本(超過8K個標記)、理解結構化資料(例如表格)和產生結構化輸出(尤其是JSON)方面有顯著改進。對系統提示的多樣性更具彈性,增強了聊天機器人的角色扮演實現和條件設定。

  • 支援超過29種語言,包括中文、英語、法語、西班牙語、葡萄牙語、德語、意大利語、俄語、日語、韓語、越南語、泰語、阿拉伯語等。

使用方法API參考線上體驗

國際(新加坡)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(Token數)

(每百萬Token)

qwen2.5-14b-instruct-1m

1,008,192

1,000,000

8,192

$0.805

$3.22

各100萬 Token

有效期間:百鍊開通後90天內

qwen2.5-7b-instruct-1m

$0.368

$1.47

qwen2.5-72b-instruct

131,072

129,024

$1.4

$5.6

qwen2.5-32b-instruct

$0.7

$2.8

qwen2.5-14b-instruct

$0.35

$1.4

qwen2.5-7b-instruct

$0.175

$0.7

中國大陸(北京)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen2.5-14b-instruct-1m

1,000,000

1,000,000

8,192

$0.144

$0.431

qwen2.5-7b-instruct-1m

$0.072

$0.144

qwen2.5-72b-instruct

131,072

129,024

$0.574

$1.721

qwen2.5-32b-instruct

$0.287

$0.861

qwen2.5-14b-instruct

$0.144

$0.431

qwen2.5-7b-instruct

$0.072

$0.144

qwen2.5-3b-instruct

32,768

30,720

$0.044

$0.130

qwen2.5-1.5b-instruct

限時免費

qwen2.5-0.5b-instruct

QVQ

qvq-72b-preview模型是由 Qwen 團隊開發的實驗性研究模型,專註於提升視覺推理能力,尤其在數學推理領域。qvq-72b-preview模型的局限性請參見QVQ官方部落格使用方法 | API參考

如果希望模型先輸出思考過程再輸出回答內容,請使用商業版模型QVQ。
說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qvq-72b-preview

32,768

16,384

單圖最大16384

16,384

$1.721

$5.161

Qwen-Omni

基於Qwen2.5訓練的全新多模態理解產生大模型,支援文本、映像、語音、視頻輸入理解,具備文本和語音同時流式產生的能力,多模態內容理解速度顯著提升。使用方法API 參考

國際(新加坡)

模型名稱

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen2.5-omni-7b

32,768

30,720

2,048

100萬Token(不區分模態)

有效期間:百鍊開通後90天內

免費額度用完後,輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.10

輸入:音頻

$6.76

輸入:圖片/視頻

$0.28

輸出計費項目

單價(每百萬 Token)

輸出:文本

$0.40(輸入僅包含文本時)

$0.84(輸入包含圖片/音頻/視頻時)

輸出:文本+音頻

$13.51(音頻)

輸出的文本不計費。

中國大陸(北京)

模型名稱

上下文長度

最大輸入

最大輸出

(Token數)

qwen2.5-omni-7b

32,768

30,720

2,048

輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:文本

$0.087

輸入:音頻

$5.448

輸入:圖片/視頻

$0.287

輸出計費項目

單價(每百萬 Token)

輸出:文本

$0.345(輸入僅包含文本時)

$0.861(輸入包含圖片/音頻/視頻時)

輸出:文本+音頻

$10.895(音頻)

輸出的文本不計費。

Qwen3-Omni-Captioner

Qwen3-Omni-Captioner以通義千問3-Omni為基座的開源模型,無需任何提示,自動為複雜語音、環境聲、音樂、影視聲效等產生精準、全面的描述,能識別說話人情緒、音樂元素(如風格、樂器)、敏感資訊等,適用於音頻內容分析、安全性稽核、意圖識別、音頻剪輯等多個領域。使用方法API 參考

國際(新加坡)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-omni-30b-a3b-captioner

65,536

32,768

32,768

$3.81

$3.06

100萬Token

有效期間:阿里雲百鍊開通後90天內

中國大陸(北京)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-omni-30b-a3b-captioner

65,536

32,768

32,768

$2.265

$1.821

無免費額度

Qwen-VL

阿里雲的通義千問VL開源版。使用方法 | API參考

相較於Qwen2.5-VL,Qwen3-VL模型能力有極大提升:

  • 智能體互動:可操作電腦或手機介面,識別 GUI 元素、理解功能、調用工具執行任務,在 OS World 等評測中達到頂尖水平。

  • 視覺編碼:可通過映像或視頻產生代碼,用於將設計圖、網站截圖等產生HTML、CSS、JS 代碼。

  • 空間感知:支援二維和三維定位,精準判斷物體方位、視角變化、遮擋關係。

  • 長視頻理解:支援長達20分鐘的視頻內容理解,並能精確定位到秒級時刻。

  • 深度思考:具有深度思考能力, 擅長捕捉細節、分析因果,在 MathVista、MMMU 等評測中達到頂尖水平。

  • 文字識別:支援語言擴充至 33種,在複雜光線、模糊、傾斜等情境下表現更穩定;顯著提升生僻字、古籍字、專業術語的識別準確率。

    支援的語言

    支援的語言共33種,分別為中文、日語、韓語、印尼語、越南語、泰語、英語、法語、德語、俄語、葡萄牙語、西班牙語、意大利語、瑞典語、丹麥語、捷克語、挪威語、荷蘭語、芬蘭語、土耳其語、波蘭語、斯瓦希裡語、羅馬尼亞語、塞爾維亞語、希臘語、哈薩克語、烏茲別克語、宿務語、阿拉伯語、烏爾都語、波斯語、印地語 / 天城語、希伯來語。

國際(新加坡)

模型名稱

模式

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

思維鏈+輸出

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-vl-235b-a22b-thinking

僅思考模式

126,976

81,920

$0.4

$4

各100萬 Token

有效期間:百鍊開通後90天內

qwen3-vl-235b-a22b-instruct

僅非思考模式

129,024

-

$1.6

qwen3-vl-32b-thinking

僅思考模式

131,072

126,976

81,920

32,768

$0.16

$0.64

qwen3-vl-32b-instruct

僅非思考模式

129,024

-

qwen3-vl-30b-a3b-thinking

僅思考模式

126,976

81,920

$0.2

$2.4

qwen3-vl-30b-a3b-instruct

僅非思考模式

129,024

-

$0.8

qwen3-vl-8b-thinking

僅思考模式

126,976

81,920

$0.18

$2.1

qwen3-vl-8b-instruct

僅非思考模式

129,024

-

$0.7

更多模型

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

單圖最大16384

8,192

$2.8

$8.4

各100萬 Token

有效期間:百鍊開通後90天內

qwen2.5-vl-32b-instruct

$1.4

$4.2

qwen2.5-vl-7b-instruct

$0.35

$1.05

qwen2.5-vl-3b-instruct

$0.21

$0.63

中國大陸(北京)

模型名稱

模式

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

思維鏈+輸出

免費額度

(注)

(Token數)

(每百萬Token)

qwen3-vl-235b-a22b-thinking

僅思考模式

131,072

126,976

81,920

$0.286705

$2.867051

無免費額度

qwen3-vl-235b-a22b-instruct

僅非思考模式

129,024

-

$1.146820

qwen3-vl-32b-thinking

僅思考模式

131,072

126,976

81,920

32,768

$0.287

$2.868

qwen3-vl-32b-instruct

僅非思考模式

129,024

-

$1.147

qwen3-vl-30b-a3b-thinking

僅思考模式

126,976

81,920

$0.108

$1.076

qwen3-vl-30b-a3b-instruct

僅非思考模式

129,024

-

$0.431

qwen3-vl-8b-thinking

僅思考模式

126,976

81,920

$0.072

$0.717

qwen3-vl-8b-instruct

僅非思考模式

129,024

-

$0.287

更多模型

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

(每百萬Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

單圖最大16384

8,192

$2.294

$6.881

無免費額度

qwen2.5-vl-32b-instruct

$1.147

$3.441

qwen2.5-vl-7b-instruct

$0.287

$0.717

qwen2.5-vl-3b-instruct

$0.173

$0.517

qwen2-vl-72b-instruct

32,768

30,720

單圖最大16384

2,048

$2.294

$6.881

Qwen-Math

基於Qwen模型構建的專門用於數學解題的語言模型。Qwen2.5-Math支援中文英文,並整合了多種推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API參考 | 線上體驗

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen2.5-math-72b-instruct

4,096

3,072

3,072

$0.574

$1.721

qwen2.5-math-7b-instruct

$0.144

$0.287

qwen2.5-math-1.5b-instruct

限時免費

Qwen-Coder

通義千問代碼模型開源版。最新的 Qwen3-Coder系列具有強大的Coding Agent能力,擅長工具調用和環境互動,能夠實現自主編程、代碼能力卓越的同時兼具通用能力。使用方法 | API參考

國際(新加坡)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

免費額度

(注)

(Token數)

qwen3-coder-480b-a35b-instruct

262,144

204,800

65,536

階梯計價,請參見表格下方說明。

各100萬Token

有效期間:百鍊開通後90天內

qwen3-coder-30b-a3b-instruct

qwen3-coder-480b-a35b-instruct 與 qwen3-coder-30b-a3b-instruct 根據本次請求輸入的 Token數,採取階梯計費。

模型名稱

單次請求的輸入 Token 數

輸入成本(每百萬Token)

輸出成本(每百萬Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$1.5

$7.5

32K<Token≤128K

$2.7

$13.5

128K<Token≤200K

$4.5

$22.5

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.45

$2.25

32K<Token≤128K

$0.75

$3.75

128K<Token≤200K

$1.2

$6

中國大陸(北京)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen3-coder-480b-a35b-instruct

262,144

204,800

65,536

階梯計價,請參見表格下方說明。

qwen3-coder-30b-a3b-instruct

qwen2.5-coder-32b-instruct

131,072

129,024

8,192

$0.287

$0.861

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

$0.144

$0.287

qwen2.5-coder-3b-instruct

32,768

30,720

限時免費體驗

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

qwen3-coder-480b-a35b-instruct 與 qwen3-coder-30b-a3b-instruct 根據本次請求輸入的 Token數,採取階梯計費。

模型名稱

單次請求的輸入 Token 數

輸入成本(每百萬Token)

輸出成本(每百萬Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.291

$5.161

128K<Token≤200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.216

$0.861

32K<Token≤128K

$0.323

$1.291

128K<Token≤200K

$0.538

$2.151

文本產生-第三方模型

DeepSeek

DeepSeek 是由深度求索公司推出的大語言模型。API參考線上體驗

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

(Token數)

(每百萬Token)

deepseek-v3.2

685B 滿血版

131,072

98,304

32,768

65,536

$0.287

$0.431

deepseek-v3.2-exp

685B 滿血版

deepseek-v3.1

685B 滿血版

$0.574

$1.721

deepseek-r1

685B 滿血版

16,384

$2.294

deepseek-r1-0528

685B 滿血版

deepseek-v3

671B 滿血版

131,072

不涉及

$0.287

$1.147

deepseek-r1-distill-qwen-1.5b

基於 Qwen2.5-Math-1.5B

32,768

32,768

16,384

16,384

限時免費體驗

deepseek-r1-distill-qwen-7b

基於 Qwen2.5-Math-7B

$0.072

$0.144

deepseek-r1-distill-qwen-14b

基於 Qwen2.5-14B

$0.144

$0.431

deepseek-r1-distill-qwen-32b

基於 Qwen2.5-32B

$0.287

$0.861

deepseek-r1-distill-llama-8b

基於 Llama-3.1-8B

限時免費體驗

deepseek-r1-distill-llama-70b

基於 Llama-3.3-70B

Kimi

Kimi-K2 是由月之暗面公司推出的大語言模型,具有卓越的編碼和工具調用能力。使用方法線上體驗

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大思維鏈長度

最大回複長度

輸入成本

輸出成本

(Token數)

(每百萬Token)

kimi-k2-thinking

262,144

229,376

32,768

16,384

$0.574

$2.294

Moonshot-Kimi-K2-Instruct

131,072

131,072

-

8,192

$0.574

$2.294

映像產生

通義千問文生圖

通義千問文生圖模型在複雜文本渲染方面表現突出,特別是中英文文本渲染。當前qwen-image-plus與qwen-image能力相同,但qwen-image-plus價格更優惠。API參考

國際(新加坡)

模型名稱

單價

免費額度

qwen-image-plus

$0.03/張

免費額度:各100張

有效期間:阿里雲百鍊開通後90天內

qwen-image

$0.035/張

中國大陸(北京)

模型名稱

單價

免費額度

qwen-image-plus

$0.028671/張

無免費額度

qwen-image

$0.035/張

輸入提示詞

輸出映像

Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere.

image

通義千問影像編輯

通義千問影像編輯模型支援精準的中英雙語文字編輯、調色、細節增強、風格遷移、增刪物體、改變位置和動作等操作,可實現複雜的圖文編輯。API參考

國際(新加坡)

模型名稱

單價

免費額度

qwen-image-edit-plus

當前與qwen-image-edit-plus-2025-10-30能力相同

$0.03/張

免費額度:各100張

有效期間:阿里雲百鍊開通後90天內

qwen-image-edit-plus-2025-12-15

$0.03/張

qwen-image-edit-plus-2025-10-30

$0.03/張

qwen-image-edit

$0.045/張

中國大陸(北京)

模型名稱

單價

免費額度

qwen-image-edit-plus

當前與qwen-image-edit-plus-2025-10-30能力相同

$0.028671/張

無免費額度

qwen-image-edit-plus-2025-12-15

$0.028671/張

qwen-image-edit-plus-2025-10-30

$0.028671/張

qwen-image-edit

$0.043/張

dog_and_girl (1)

原圖

狗修改圖

將圖中的人物改為站立姿勢,彎腰握住狗的前爪

image

原圖

image

將字母塊上的單詞'HEALTH INSURANCE’ 替換為'明天會更好'

5

原圖

5out

用淺藍色襯衫替換圓點襯衫

6

原圖

6out

將圖中背景改為南極

7

原圖

7out

產生人物的卡通頭像

image

原圖

image

刪除餐盤上的頭髮

通義千問映像翻譯

通義千問映像翻譯模型支援將11種語言圖片的文字翻譯成中文或英文,能精準保留原始排版與內容資訊,並提供術語定義、敏感詞過濾、映像主體檢測等自訂功能。API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

單價

免費額度

qwen-mt-image

$0.000431/張

無免費額度

en

原圖

ja

日語

es

葡語

ar

阿拉伯語

通義-文生圖-Z-Image

通義-文生圖-Z-Image 是一款輕量級文生圖模型,可快速產生高品質映像,支援中英雙語渲染、複雜語義理解和多風格題材,並可靈活適配多種解析度與寬高比。API參考

國際(新加坡)

模型名稱

單價

免費額度(注)

有效期間:阿里雲百鍊開通後90天內

z-image-turbo

關閉提示詞改寫(prompt_extend=false):$0.015/張

開啟提示詞改寫(prompt_extend=true):$0.03/張

100張

中國大陸(北京)

模型名稱

單價

免費額度

z-image-turbo

關閉提示詞改寫(prompt_extend=false):$0.01434/張

開啟提示詞改寫(prompt_extend=true):$0.02868/張

無免費額度

輸入提示詞

輸出映像

Photo of a stylish young woman with short black hair standing confidently in front of a vibrant cartoon-style mural wall. She wears an all-black outfit: a puffed bomber jacket with a ruffled collar, cargo shorts, fishnet tights, and chunky black Doc Martens, with a gold chain dangling from her waist. The background features four colorful comic-style panels: one reads “GRAND STAGE” and includes sneakers and a Gatorade bottle; another displays green Nike sneakers and a slice of pizza; the third reads “HARAJUKU st” with floating shoes; and the fourth shows a blue mouse riding a skateboard with the text “Takeshita WELCOME.” Dominant bright colors include yellow, teal, orange, pink, and green. Speech bubbles, halftone patterns, and playful characters enhance the urban street-art aesthetic. Daylight evenly illuminates the scene, and the ground beneath her feet is white tiled pavement. Full-body portrait, centered composition, slightly tilted stance, direct eye contact with the camera. High detail, sharp focus, dynamic framing.

b16c8008-83c1-4c80-ae22-786a2299bec3-1-轉換自-png

通義萬相文生圖

通義萬相-文生圖模型通過文本即可產生精美的圖片。API參考線上體驗

國際(新加坡)

模型名稱

說明

單價

免費額度(注)

有效期間:阿里雲百鍊開通後90天內

wan2.6-t2i 推薦

萬相2.6。支援新增的同步介面,同時支援在總像素麵積與寬高比約束內,自由選尺寸。

$0.03/張

50張

wan2.5-t2i-preview 推薦

萬相2.5 preview。取消單邊限制,在總像素麵積與寬高比約束內,自由選尺寸。

$0.03/張

50張

wan2.2-t2i-plus

萬相2.2專業版。在創意性、穩定性、寫實質感上全面升級。

$0.05/張

100張

wan2.2-t2i-flash

萬相2.2極速版。在創意性、穩定性、寫實質感上全面升級。

$0.025/張

100張

wan2.1-t2i-plus

萬相2.1專業版。支援多種風格,產生映像細節豐富。

$0.05/張

200張

wan2.1-t2i-turbo

萬相2.1極速版。支援多種風格,產生速度快。

$0.025/張

200張

中國大陸(北京)

模型名稱

說明

單價

免費額度(注)

有效期間:阿里雲百鍊開通後90天內

wan2.6-t2i 推薦

萬相2.6。支援新增的同步介面,同時支援在總像素麵積與寬高比約束內,自由選尺寸。

$0.028671/張

無免費額度

wan2.5-t2i-preview 推薦

萬相2.5 preview。取消單邊限制,在總像素麵積與寬高比約束內,自由選尺寸。

$0.028671/張

無免費額度

wan2.2-t2i-plus

萬相2.2專業版。在創意性、穩定性、寫實質感上全面升級。

$0.02007/張

無免費額度

wan2.2-t2i-flash

萬相2.2極速版。在創意性、穩定性、寫實質感上全面升級。

$0.028671/張

無免費額度

wanx2.1-t2i-plus

萬相2.1專業版。支援多種風格,產生映像細節豐富。

$0.028671/張

無免費額度

wanx2.1-t2i-turbo

萬相2.1極速版。支援多種風格,產生速度快。

$0.020070/張

無免費額度

wanx2.0-t2i-turbo

萬相2.0極速版。擅長質感人像與創意設計,性價比高。

$0.005735/張

無免費額度

輸入提示詞

輸出映像

一個用針氈製作的聖誕老人手持禮物旁邊站著一隻白色的貓咪,背景中有許多五顏六色的禮物。整個情境應該是可愛、溫暖和舒適的,並且背景中還有一些綠色植物。

image

通義萬相映像產生與編輯2.6

通義萬相映像產生模型支援影像編輯、圖文混合輸出,滿足多樣化產生與整合需求。API參考

國際(新加坡)

模型名稱

單價

免費額度(注)

有效期間:阿里雲百鍊開通後90天內

wan2.6-image

$0.03/張

50張

中國大陸(北京)

模型名稱

單價

免費額度

wan2.6-image

$0.028671/張

無免費額度

通義萬相通用影像編輯2.5

通義萬相-通用影像編輯2.5模型支援輸入文本、單圖或多圖實現基於主體一致性的影像編輯、多圖融合創作等能力。API參考

國際(新加坡)

模型名稱

單價

免費額度(注)

有效期間:阿里雲百鍊開通後90天內

wan2.5-i2i-preview

$0.03/張

50張

中國大陸(北京)

模型名稱

單價

免費額度

wan2.5-i2i-preview

$0.028671/張

無免費額度

模型功能

輸入樣本

輸出映像

單圖編輯

damotest2023_Portrait_photography_outdoors_fashionable_beauty_409ae3c1-19e8-4515-8e50-b3c9072e1282_2-轉換自-png

a26b226d-f044-4e95-a41c-d1c0d301c30b-轉換自-png

將花卉連衣裙換成一件複古風格的蕾絲長裙,領口和袖口有精緻的刺繡細節。

多圖融合

image

p1028883

將圖1中的鬧鐘放置到圖2的餐桌的花瓶旁邊位置

通義萬相通用影像編輯2.1

通義萬相-通用影像編輯模型通過簡單的指令即可實現多樣化的影像編輯,適用於擴圖、去浮水印、風格遷移、映像修複、映像美化等情境。使用方法API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

計費單價

免費額度

wanx2.1-imageedit

$0.020070/張

無免費額度

目前通用影像編輯支援以下功能:

模型功能

輸入映像

輸入提示詞

輸出映像

全域風格化

image

轉換成法國繪本風格

image

局部風格化

image

把房子變成木板風格。

image

指令編輯

image

把女孩的頭髮修改為紅色。

image

局部重繪

輸入映像

image

塗抹地區映像(白色為塗抹地區)

image

一隻陶瓷兔子抱著一朵陶瓷花。

輸出映像

image

去文字浮水印

image

去除映像中的文字。

image

擴圖

20250319105917

一位綠色仙子。

image

映像超分

模糊映像

image

映像超分。

清晰映像

image

映像上色

image

藍色背景,黃色的葉子。

image

線稿生圖

image

北歐極簡風格的客廳。

image

墊圖

image

卡通形象小心翼翼地探出頭,窺視著房間內一顆璀璨的藍色寶石。

image

AI試衣

  • AI試衣-Plus版相較於基礎版模型,在圖片清晰度、服飾紋理細節和logo還原效果等方面均有提升,但產生耗時較長,適用於對時效性要求不高的情境。API參考 | 線上體驗

  • AI試衣-圖片分割支援對模特圖、服飾圖進行分割,可用於AI試衣圖片的前後處理。API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

樣本輸入

樣本輸出

aitryon-plus

AI試衣-Plus版

output26

output29

aitryon-parsing-v1

AI試衣-圖片分割

AI試衣計費單價

模型服務

模型名稱

計量單價

折扣

階梯層級

AI試衣-Plus版

aitryon-plus

$0.071677/張

AI試衣-圖片分割

aitryon-parsing-v1

$0.000574/張

視頻產生-通義萬相

文生視頻

通義萬相-文生視頻模型通過一句話即可產生視頻,視頻呈現豐富的藝術風格及影視級畫質。API參考線上體驗

國際(新加坡)

模型名稱

說明

單價

免費額度(領取)

有效期間:阿里雲百鍊開通後90天內

wan2.6-t2v推薦

萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.5-t2v-preview推薦

萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。

480P:$0.05/秒

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.2-t2v-plus

萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。

480P:$0.02/秒

1080P:$0.10/秒

50秒

wan2.1-t2v-turbo

萬相2.1極速版。產生速度快,表現均衡。

$0.036/秒

200秒

wan2.1-t2v-plus

萬相2.1專業版。產生細節豐富,畫面更具質感。

$0.10/秒

200秒

中國大陸(北京)

模型名稱

說明

單價

免費額度

wan2.6-t2v推薦

萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。

720P:$0.086012/秒

1080P:0.143353/秒

無免費額度

wan2.5-t2v-preview推薦

萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。

480P:$0.043006/秒

720P:$0.086012/秒

1080P:$0.143353/秒

無免費額度

wan2.2-t2v-plus

萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。

480P:$0.02007/秒

1080P:$0.100347/秒

無免費額度

wanx2.1-t2v-turbo

產生速度更快,表現均衡。

$0.034405/秒

無免費額度

wanx2.1-t2v-plus

產生細節更豐富,畫面更具質感。

$0.100347/秒

無免費額度

輸入提示詞

輸出視頻(wan2.6,多鏡頭視頻)

Shot from a low angle, in a medium close-up, with warm tones, mixed lighting (the practical light from the desk lamp blends with the overcast light from the window), side lighting, and a central composition. In a classic detective office, wooden bookshelves are filled with old case files and ashtrays. A green desk lamp illuminates a case file spread out in the center of the desk. A fox, wearing a dark brown trench coat and a light gray fedora, sits in a leather chair, its fur crimson, its tail resting lightly on the edge, its fingers slowly turning yellowed pages. Outside, a steady drizzle falls beneath a blue sky, streaking the glass with meandering streaks. It slowly raises its head, its ears twitching slightly, its amber eyes gazing directly at the camera, its mouth clearly moving as it speaks in a smooth, cynical voice: 'The case was cold, colder than a fish in winter. But every chicken has its secrets, and I, for one, intended to find them '.

圖生視頻-基於首幀

通義萬相-圖生視頻模型將輸入圖片作為視頻首幀,再根據提示詞產生視頻。視頻呈現豐富的藝術風格及影視級畫質。API參考線上體驗

國際(新加坡)

模型名稱

說明

單價

免費額度(注)

有效期間:阿里雲百鍊開通後90天內

wan2.6-i2v推薦

萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.5-i2v-preview推薦

萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。

480P:$0.05/秒

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.2-i2v-flash

萬相2.2極速版。極致產生速度,在畫面細節表現、運動穩定性方面均有顯著提升。

480P:$0.015/秒

720P:$0.036/秒

50秒

wan2.2-i2v-plus

萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。

480P:$0.02/秒

1080P:$0.10/秒

50秒

wan2.1-i2v-turbo

萬相2.1極速版。產生速度快,表現均衡。

$0.036/秒

200秒

wan2.1-i2v-plus

萬相2.1專業版。產生細節豐富,畫面更具質感。

$0.10/秒

200秒

中國大陸(北京)

模型名稱

說明

單價

免費額度

wan2.6-i2v推薦

萬相2.6。新增多鏡頭敘事能力,同時支援自動配音和傳入自訂音頻檔案。

720P:$0.086012/秒

1080P:$0.143353/秒

無免費額度

wan2.5-i2v-preview推薦

萬相2.5 preview。支援自動配音和傳入自訂音頻檔案。

480P:$0.043006/秒

720P:$0.086012/秒

1080P:$0.143353/秒

無免費額度

wan2.2-i2v-plus 推薦

萬相2.2專業版。在畫面細節表現、運動穩定性方面均有顯著提升。

480P:$0.02007/秒

1080P:$0.100347/秒

無免費額度

wanx2.1-i2v-turbo

萬相2.1極速版。產生速度快,表現均衡。

$0.034405/秒

無免費額度

wanx2.1-i2v-plus

萬相2.1專業版。產生細節豐富,畫面更具質感。

$0.100347/秒

無免費額度

輸入首幀映像和音頻

輸出視頻(wan2.6,多鏡頭視頻)

rap-轉換自-png

輸入音頻

輸入提示詞:一幅都市奇幻藝術的情境。一個充滿動感的塗鴉藝術角色。一個由噴漆所畫成的少年,正從一面混凝土牆上活過來。他一邊用極快的語速演唱一首英文rap,一邊擺著一個經典的、充滿活力的饒舌歌手姿勢。情境設定在夜晚一個充滿都市感的鐵路橋下。燈光來自一盞孤零零的街燈,營造齣電影般的氛圍,充滿高能量和驚人的細節。視頻的音頻部分完全由他的rap構成,沒有其他對話或雜音。

圖生視頻-基於首尾幀

通義萬相-首尾幀生視頻模型,只需要提供首幀和尾幀圖片,便能根據提示詞產生一段絲滑流暢的動態視頻。視頻呈現豐富的藝術風格及影視級畫質。API參考線上體驗

國際(新加坡)

模型名稱

單價

免費額度(注)

wan2.1-kf2v-plus

$0.10/秒

200秒

有效期間:百鍊開通後90天內

中國大陸(北京)

模型名稱

單價

免費額度(注)

wanx2.1-kf2v-plus

$0.100347/秒

無免費額度

輸入樣本

輸出視頻

首幀圖片

尾幀圖片

提示詞

first_frame

last_frame

寫實風格,一隻黑色小貓好奇地看向天空,鏡頭從平視逐漸上升,最後俯拍小貓好奇的眼神。

參考生視頻

通義萬相-參考生視頻模型支援參考輸入視頻中的角色形象和音色,搭配提示詞產生保持角色一致性的視頻。API參考

計費規則:輸入視頻和輸出視頻均計費,按視頻秒數計費,失敗不計費也不佔用免費額度。

  • 輸入視頻的計費時間長度不超過 5 秒,具體規則參見計費與限流

  • 輸出視頻的計費時間長度為成功產生的視頻秒數

國際(新加坡)

模型名稱

輸入單價

輸出單價

免費額度(注)

wan2.6-r2v

720P:$0.10/秒

1080P:$0.15/秒

720P:$0.10/秒

1080P:$0.15/秒

50秒

有效期間:百鍊開通後90天內

中國大陸(北京)

模型名稱

輸入單價

輸出單價

免費額度(注)

wan2.6-r2v

720P:$0.086012/秒

1080P:$0.143353/秒

720P:$0.086012/秒

1080P:$0.143353/秒

無免費額度

通用視頻編輯

通義萬相-視頻編輯統一模型支援多模態輸入,包括文本、映像和視頻,能夠執行視頻產生與通用編輯任務。API參考線上體驗

國際(新加坡)

模型名稱

單價

免費額度(注)

wan2.1-vace-plus

$0.1/秒

50秒

有效期間:百鍊開通後90天內

中國大陸(北京)

模型名稱

單價

免費額度(注)

wanx2.1-vace-plus

$0.100347/秒

無免費額度

視頻編輯統一模型支援以下功能:

模型功能

輸入參考圖

輸入提示詞

輸出視頻

多圖參考

參考圖1(參考主體)

image

參考圖2(參考背景)

image

視頻中,一位女孩自晨霧繚繞的古老森林深處款款走出,她步伐輕盈,鏡頭捕捉她每一個靈動瞬間。當她站定,環顧四周蔥鬱林木時,她臉上綻放出驚喜與喜悅交織的笑容。這一幕,定格在了光影交錯的瞬間,記錄下她與大自然的美妙邂逅。

輸出視頻

視頻重繪

視頻展示了一輛黑色的蒸汽龐克風格汽車,紳士駕駛著,車輛裝飾著齒輪和銅管。背景是蒸汽驅動的糖果工廠和複古元素,畫面複古與趣味

局部編輯

輸入視頻

輸入遮罩映像(白色地區表示編輯地區)

mask

視頻展示了一家巴黎風情的法式咖啡館,一隻穿著西裝的獅子優雅地品著咖啡。它一手端著咖啡杯,輕輕啜飲,神情愜意。咖啡館裝飾雅緻,柔和的色調與溫暖燈光映照著獅子所在的地區。

根據提示詞修改編輯地區的內容

視頻延展

輸入首片段視頻(1秒)

一隻戴著墨鏡的狗在街道上滑滑板,3D卡通。

輸出延長後的視頻(5秒)

視頻畫面擴充

一位優雅的女士正在激情演奏小提琴,她身後是一支完整的交響樂團

通義萬相-數字人

基於單張人物圖片和音頻,產生動作自然的說話、唱歌或表演視頻。使用時需依次調用下述模型。wan2.2-s2v 映像檢測 | wan2.2-s2v 視頻產生

說明

僅支援中國大陸(北京)地區。

模型名稱

模型簡介

單價

wan2.2-s2v-detect

檢查輸入映像是否滿足要求(如清晰度、單人、正面)。

$0.000574/張

wan2.2-s2v

根據檢測通過的圖片和一段音頻,產生人物動態視頻。

480P:$0.071677/秒

720P:$0.129018/秒

輸入樣本

輸出視頻

p1001125-轉換自-jpeg

輸入音頻:

通義萬相-圖生動作

提供標準和專業兩種服務模式,基於人物圖片和參考視頻,將視頻角色的動作、表情遷移到圖片角色中,產生人物動作視頻,賦予圖片角色動態表現力。API參考

國際(新加坡)

模型名稱

模型服務

服務簡介

計費單價

免費額度(查看)

wan2.2-animate-move

標準模式wan-std

產生速度快,滿足基礎動畫示範等輕需求,性價比高。

$0.12/秒

兩種模式共50秒

專業模式wan-pro

動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。

$0.18/秒

中國大陸(北京)

模型名稱

模型服務

服務簡介

計費單價

免費額度(查看)

wan2.2-animate-move

標準模式wan-std

產生速度快,滿足基礎動畫示範等輕需求,性價比高。

$0.06/秒

無免費額度

專業模式wan-pro

動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。

$0.09/秒

人物圖片

參考視頻

輸出視頻(標準模式)

輸出視頻(專業模式)

move_input_image

通義萬相-視頻換人

提供標準和專業兩種服務模式,基於人物圖片和參考視頻,將視頻中的主角替換為圖片中的角色,同時保留原視頻的情境、光照和色調。API 參考

國際(新加坡)

模型名稱

模型服務

服務簡介

計費單價

免費額度(查看)

wan2.2-animate-mix

標準模式wan-std

產生速度快,滿足基礎動畫示範等輕需求,性價比高。

$0.18/秒

兩種服務共50秒

專業模式wan-pro

動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。

$0.26/秒

中國大陸(北京)

模型名稱

模型服務

服務簡介

計費單價

免費額度(查看)

wan2.2-animate-mix

標準模式wan-std

產生速度快,滿足基礎動畫示範等輕需求,性價比高。

$0.09/秒

無免費額度

專業模式wan-pro

動畫流暢度高,動作表情過渡自然,效果更接近真實拍攝。

$0.13/秒

人物圖片

參考視頻

輸出視頻(標準模式)

輸出視頻(專業模式)

mix_input_image

舞動人像AnimateAnyone

基於人物圖片和人物動作模板,產生人物動作視頻。直接使用時需依次調用下述三個模型。AnimateAnyone映像檢測 API詳情 | AnimateAnyone 動作模板產生AnimateAnyone視頻產生API詳情

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

單價

animate-anyone-detect-gen2

檢測輸入的圖片是否符合要求

$0.000574/張

animate-anyone-template-gen2

從人物運動視頻中提取人物動作並產生動作模板

$0.011469/秒

animate-anyone-gen2

基於人物圖片和動作模板產生人物動作視頻

輸入:人物圖片

輸入:動作視頻

輸出(按圖片背景產生)

輸出(按視頻背景產生)

04-9_16

說明
  • 以上樣本,由整合了“舞動人像AnimateAnyone”的通義APP產生。

  • 舞動人像AnimateAnyone模型的產生內容為視頻畫面,不包含音頻

悅動人像EMO

基於人物肖像圖片和人聲音頻檔案,產生人物肖像動態視頻。使用時需依次調用下述模型。EMO 映像檢測 | EMO 視頻產生

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

單價

emo-detect-v1

檢測輸入的圖片是否符合要求,不需要部署,可直接調用

$0.000574/張

emo-v1

產生人物肖像動態視頻,不需要部署,可直接調用

  • 產生1:1畫幅視頻:$0.011469/秒

  • 產生3:4畫幅視頻:$0.022937/秒

輸入物:人物肖像圖片+人聲音頻檔案

輸出物:人物肖像動態視頻

人物肖像:

上春山

人聲音頻:參見右側視頻

人物視頻:

使用動作風格強度:活潑("style_level": "active")

靈動人像LivePortrait

基於人物肖像圖片和人聲音頻檔案,快速、輕量地產生人物肖像動態視頻。與悅動人像EMO模型相比,產生速度快、價格低,但是產生效果不如悅動人像EMO模型。使用時需依次調用下述兩個模型。LivePortrait 映像檢測 | LivePortrait 視頻產生

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

單價

liveportrait-detect

檢測輸入的圖片是否符合要求

$0.000574/張

liveportrait

產生人物肖像動態視頻

$0.002868/秒

輸入物:人物肖像圖片+人聲音頻檔案

輸出物:人物肖像動態視頻

人物肖像:

Emoji男孩

人聲音頻:參見右側視頻

人物視頻:

表情包Emoji

基於人臉圖片和預設的人臉動態模板,產生人臉動態視頻。該能力可用於表情包製作、視頻素材產生等情境。使用時需依次調用下述模型。Emoji 映像檢測Emoji 視頻產生

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

單價

emoji-detect-v1

檢測輸入圖片是否符合要求

$0.000574/張

emoji-v1

基於人物肖像圖片和指定的表情包模板產生人物同款表情

$0.011469/秒

輸入:人物肖像圖片

輸出:人物肖像動態視頻

image.png

“開心”表情的模板序列:("input.driven_id": "mengwa_kaixin")

聲動人像VideoRetalk

基於人物視頻和人聲音頻,產生人物講話口型與輸入音頻相匹配的視頻。使用時需調用下述模型。API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

單價

videoretalk

產生人物講話口型與輸入音頻相匹配的新視頻

$0.011469/秒

視頻風格重繪

支援根據使用者輸入的文字內容,產生符合語義描述的不同風格的視頻,或者根據使用者輸入的視頻,進行視頻風格重繪。API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

說明

單價

video-style-transform

將輸入視頻轉換為日式漫畫、美式漫畫等風格

720P

$0.071677/秒

540P

$0.028671/秒

輸入視頻

輸出視頻(日式漫畫)

語音合成(文本轉語音)

通義千問語音合成

支援輸入多語種混合文本,併流式輸出音頻。使用方法API 參考

國際(新加坡)

模型名稱

版本

單價

最大輸入字元數

支援的語種

免費額度(注)

qwen3-tts-flash

當前能力等同 qwen3-tts-flash-2025-11-27

穩定版

$0.1/萬字元

600

中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

2025年11月13日0點前開通阿里雲百鍊:2000字元

2025年11月13日0點後開通阿里雲百鍊:1萬字元

有效期間:阿里雲百鍊開通後90天內

qwen3-tts-flash-2025-11-27

快照版

1萬字元

有效期間:阿里雲百鍊開通後90天內

qwen3-tts-flash-2025-09-18

快照版

2025年11月13日0點前開通阿里雲百鍊:2000字元

2025年11月13日0點後開通阿里雲百鍊:1萬字元

有效期間:阿里雲百鍊開通後90天內

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

中國大陸(北京)

通義千問3-TTS-Flash

模型名稱

版本

單價

最大輸入字元數

支援的語種

qwen3-tts-flash

當前能力等同 qwen3-tts-flash-2025-11-27

穩定版

$0.114682/萬字元

600

中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

qwen3-tts-flash-2025-11-27

快照版

qwen3-tts-flash-2025-09-18

快照版

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

通義千問-TTS

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每千Token)

qwen-tts

當前與 qwen-tts-2025-04-10 能力相同

穩定版

8,192

512

7,680

$0.230

$1.434

qwen-tts-latest

始終與最新快照版能力相同

最新版

qwen-tts-2025-05-22

快照版

qwen-tts-2025-04-10

音頻轉換為 Token 的規則:每1秒的音頻對應 50個 Token 。若音頻時間長度不足1秒,則按 50個 Token 計算。

通義千問即時語音合成

支援文本的流式輸入併流式輸出音頻,具有根據常值內容與標點符號自適應調節語音語速的能力。使用方法 | API參考

通義千問3-TTS-VD-Realtime支援使用聲音設計音色進行即時語音合成,但不支援使用預設音色。

通義千問3-TTS-VC-Realtime支援使用聲音複刻音色進行即時語音合成,但不支援使用預設音色。

通義千問3-TTS-Flash-Realtime和通義千問-TTS-Realtime僅可使用預設音色,但不支援使用聲音複刻/設計音色。

國際(新加坡)

通義千問3-TTS-VD-Realtime

模型名稱

版本

單價

支援的語種

免費額度(注)

qwen3-tts-vd-realtime-2025-12-16

快照版

$0.143353/萬字元

中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

1萬字元

有效期間:阿里雲百鍊開通後90天內

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

通義千問3-TTS-VC-Realtime

模型名稱

版本

單價

支援的語種

免費額度(注)

qwen3-tts-vc-realtime-2025-11-27

快照版

$0.13/萬字元

中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

1萬字元

有效期間:阿里雲百鍊開通後90天內

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

通義千問3-TTS-Flash-Realtime

模型名稱

版本

單價

支援的語種

免費額度(注)

qwen3-tts-flash-realtime

當前能力等同 qwen3-tts-flash-realtime-2025-11-27

穩定版

$0.13/萬字元

中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

2025年11月13日0點前開通阿里雲百鍊:2000字元

2025年11月13日0點後開通阿里雲百鍊:1萬字元

有效期間:阿里雲百鍊開通後90天內

qwen3-tts-flash-realtime-2025-11-27

快照版

1萬字元

有效期間:阿里雲百鍊開通後90天內

qwen3-tts-flash-realtime-2025-09-18

快照版

2025年11月13日0點前開通阿里雲百鍊:2000字元

2025年11月13日0點後開通阿里雲百鍊:1萬字元

有效期間:阿里雲百鍊開通後90天內

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

中國大陸(北京)

通義千問3-TTS-VD-Realtime

模型名稱

版本

單價

支援的語種

qwen3-tts-vd-realtime-2025-12-16

快照版

$0.143353/萬字元

中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

通義千問3-TTS-VC-Realtime

模型名稱

版本

單價

支援的語種

qwen3-tts-vc-realtime-2025-11-27

快照版

$0.143353/萬字元

中文、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

通義千問3-TTS-Flash-Realtime

模型名稱

版本

單價

支援的語種

qwen3-tts-flash-realtime

當前能力等同 qwen3-tts-flash-realtime-2025-11-27

穩定版

$0.143353/萬字元

中文(普通話、北京、上海、四川、南京、陝西、閩南、天津、粵語)、英文、西班牙語、俄語、意大利語、法語、韓語、日語、德語、葡萄牙語

qwen3-tts-flash-realtime-2025-11-27

快照版

qwen3-tts-flash-realtime-2025-09-18

快照版

按輸入的字元數計費,計算規則如下:

  • 一個漢字(包括簡/繁體漢字、日文漢字和韓文漢字) = 2個字元

  • 其他,如一個英文字母、一個標點符號、一個空格 = 1個字元

通義千問-TTS-Realtime

模型名稱

版本

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

支援的語種

(Token數)

(每千Token)

qwen-tts-realtime

當前能力等同 qwen-tts-realtime-2025-07-15

穩定版

8,192

512

7,680

$0.345

$1.721

中文、英文

qwen-tts-realtime-latest

當前能力等同 qwen-tts-realtime-2025-07-15

最新版

中文、英文

qwen-tts-realtime-2025-07-15

快照版

中文、英文

音頻轉換為 Token 的規則:每1秒的音頻對應 50個 Token 。若音頻時間長度不足1秒,則按 50個 Token 計算。

通義千問聲音複刻

聲音複刻依託大模型進行特徵提取,無需訓練即可複刻聲音。僅需提供 10~20 秒的音頻,即可產生高度相似且聽感自然的定製音色。使用方法 | API參考

國際(新加坡)

模型名稱

單價

免費額度(注)

qwen-voice-enrollment

$0.01/音色

1000個音色

有效期間:阿里雲百鍊開通後90天內

中國大陸(北京)

模型名稱

單價

qwen-voice-enrollment

$0.01/音色

通義千問聲音設計

聲音設計通過文本描述產生定製化音色,支援多語言和多維度音色特徵定義,適用於廣告配音、角色塑造、有聲內容創作等多種應用。使用方法 | API參考

國際(新加坡)

模型名稱

單價

免費額度(注)

qwen-voice-design

$0.2/音色

10個音色

有效期間:阿里雲百鍊開通後90天內

中國大陸(北京)

模型名稱

單價

qwen-voice-design

$0.2/音色

CosyVoice語音合成

CosyVoice是通義實驗室依託大規模預訓練語言模型,深度融合文本理解和語音產生的新一代產生式語音合成大模型,支援文本至語音的即時資料流式合成。使用方法 | API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

單價

cosyvoice-v3-plus

$0.286706/萬字元

cosyvoice-v3-flash

$0.14335/萬字元

cosyvoice-v2

$0.286706/萬字元

字元計算規則:漢字(包括簡/繁體漢字、日文漢字和韓文漢字)按2個字元計算,其他所有字元(如字母、數字、日韓文假名/諺文等)均按 1個字元計算。SSML標籤內容不計費。

語音辨識(語音轉文本)與翻譯(語音轉成指定語種的文本)

通義千問3-LiveTranslate-Flash

通義千問3-LiveTranslate-Flash-Realtime

qwen3-livetranslate-flash-realtime 是一款多語言音視頻即時翻譯模型,可識別 18 種語言,並即時翻譯為 10 種語言的音頻。

核心特性:

  • 多語言支援:支援 18 種語言及 6 種漢語方言。包括中文、英文、法語、德語、俄語、日語、韓語等。支援普通話、粵語、四川話等方言。

  • 視覺增強:利用視覺內容提升翻譯準確性。模型通過分析口型、動作和畫面中的文字,改善在嘈雜環境下或一詞多義情境中的翻譯效果。

  • 3秒延遲:實現低至 3 秒的同傳延遲。

  • 無損同傳:通過語義單元預測技術,解決跨語言語序問題。即時翻譯品質接近離線翻譯結果。

  • 音色自然:產生音色自然的擬人語音。模型能根據源語音內容,自適應調節語氣和情感。

使用方法 | API參考

國際(新加坡)

模型名稱

版本

上下文長度

最大輸入

最大輸出

免費額度

(注)

(Token數)

qwen3-livetranslate-flash-realtime

當前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22

穩定版

53,248

49,152

4,096

各100萬Token

有效期間:阿里雲百鍊開通後90天內

qwen3-livetranslate-flash-realtime-2025-09-22

快照版

免費額度用完後,輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:音頻

$10

輸入:圖片

$1.3

輸出計費項目

單價(每百萬 Token)

文本

$10

音頻

$38

Token計算規則:

  • 音頻:輸入或輸出每秒音頻均消耗 12.5 Token

  • 圖片:每輸入 28*28 像素消耗 0.5 Token

中國大陸(北京)

模型名稱

版本

上下文長度

最大輸入

最大輸出

(Token數)

qwen3-livetranslate-flash-realtime

當前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22

穩定版

53,248

49,152

4,096

qwen3-livetranslate-flash-realtime-2025-09-22

快照版

輸入與輸出的計費規則如下:

輸入計費項目

單價(每百萬 Token)

輸入:音頻

$9.175

輸入:圖片

$1.147

輸出計費項目

單價(每百萬 Token)

文本

$9.175

音頻

$34.405

Token計算規則:

  • 音頻:輸入或輸出每秒音頻均消耗 12.5 Token

  • 圖片:每輸入 28*28 像素消耗 0.5 Token

通義千問錄音檔案識別

基於通義千問多模態基座,支援多語言識別、歌唱識別、雜訊拒識等功能。使用方法 | API參考

國際(新加坡)

通義千問3-ASR-Flash-Filetrans

模型名稱

版本

支援的語言

支援的採樣率

單價

免費額度(注)

qwen3-asr-flash-filetrans

當前等同qwen3-asr-flash-filetrans-2025-11-17

穩定版

中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語

任意

$0.000035/秒

36,000秒(10小時)

有效期間:阿里雲百鍊開通後90天內

qwen3-asr-flash-filetrans-2025-11-17

快照版

通義千問3-ASR-Flash

模型名稱

版本

支援的語言

支援的採樣率

單價

免費額度(注)

qwen3-asr-flash

當前等同qwen3-asr-flash-2025-09-08

穩定版

中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語

16kHz

$0.000035/秒

36,000秒(10小時)

有效期間:阿里雲百鍊開通後90天內

qwen3-asr-flash-2025-09-08

快照版

中國大陸(北京)

通義千問3-ASR-Flash-Filetrans

模型名稱

版本

支援的語言

支援的採樣率

單價

qwen3-asr-flash-filetrans

當前等同qwen3-asr-flash-filetrans-2025-11-17

穩定版

中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語

任意

$0.000032/秒

qwen3-asr-flash-filetrans-2025-11-17

快照版

通義千問3-ASR-Flash

模型名稱

版本

支援的語言

支援的採樣率

單價

qwen3-asr-flash

當前等同qwen3-asr-flash-2025-09-08

穩定版

中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語

16kHz

$0.000032/秒

qwen3-asr-flash-2025-09-08

快照版

通義千問即時語音辨識

通義千問即時語音辨識大模型具備自動語種識別功能,可識別 11 種語音類型,並能在複雜音頻環境下較為準確地轉錄。使用方法 | API參考

國際(新加坡)

模型名稱

版本

支援的語言

支援的採樣率

單價

免費額度(注)

qwen3-asr-flash-realtime

當前等同qwen3-asr-flash-realtime-2025-10-27

穩定版

中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語

8kHz、16kHz

$0.00009/秒

36,000秒(10小時)

有效期間:阿里雲百鍊開通後90天內

qwen3-asr-flash-realtime-2025-10-27

快照版

中國大陸(北京)

模型名稱

版本

支援的語言

支援的採樣率

單價

qwen3-asr-flash-realtime

當前等同qwen3-asr-flash-realtime-2025-10-27

穩定版

中文(普通話、四川話、閩南語、吳語、粵語)、英語、日語、德語、韓語、俄語、法語、葡萄牙語、阿拉伯語、意大利語、西班牙語、印地語、印尼語、泰語、土耳其語、烏克蘭語、越南語、捷克語、丹麥語、菲律賓語、芬蘭語、冰島語、馬來語、挪威語、波蘭語、瑞典語

8kHz、16kHz

$0.000047/秒

qwen3-asr-flash-realtime-2025-10-27

快照版

Paraformer語音辨識

Paraformer是通義實驗室旗下的語音辨識模型,提供錄音檔案識別和即時語音辨識兩個版本。

錄音檔案識別

使用方法 | API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

支援的語言

支援的採樣率

適用情境

支援的音頻格式

單價

paraformer-v2

中文(普通話、粵語、吳語、閩南語、東北話、甘肅話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英文、日語、韓語、德語、法語、俄語

任意

ApsaraVideo for Live

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

$0.000012/秒

paraformer-8k-v2

中文普通話

8kHz

電話語音

即時語音辨識

使用方法 | API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

支援的語言

支援的採樣率

適用情境

支援的音頻格式

單價

paraformer-realtime-v2

中文(普通話、粵語、吳語、閩南語、東北話、甘肅話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陝西話、山東話、四川話、天津話、江西話、雲南話、上海話)、英文、日語、韓語、德語、法語、俄語

支援多個語種自由切換

任意

ApsaraVideo for Live、會議等

pcm、wav、mp3、opus、speex、aac、amr

$0.000035/秒

paraformer-realtime-8k-v2

中文普通話

8kHz

電話客服等

Fun-ASR語音辨識

Fun-ASR是通義百聆旗下語音辨識模型,提供錄音檔案識別和即時語音辨識兩個版本。

錄音檔案識別

使用方法 | API參考

國際(新加坡)

模型名稱

版本

支援的語言

支援的採樣率

適用情境

支援的音頻格式

單價

免費額度(注)

fun-asr

當前等同fun-asr-2025-11-07

穩定版

中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語

任意

ApsaraVideo for Live、電話語音、會議同傳等

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

$0.000035/秒

36,000秒(10小時)

有效期間90天

fun-asr-2025-11-07

相較fun-asr-2025-08-25做了遠場VAD最佳化,識別更准

快照版

fun-asr-2025-08-25

中文(普通話)、英文

fun-asr-mtl

當前等同fun-asr-mtl-2025-08-25

穩定版

中文(普通話、粵語)、英文、日語、韓語、越南語、印尼語、泰語、馬來語、菲律賓語、阿拉伯語、印地語、保加利亞語、克羅地亞語、捷克語、丹麥語、荷蘭語、愛沙尼亞語、芬蘭語、希臘語、匈牙利語、愛爾蘭語、拉脫維亞語、立陶宛語、馬爾他語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、瑞典語

fun-asr-mtl-2025-08-25

快照版

中國大陸(北京)

模型名稱

版本

支援的語言

支援的採樣率

適用情境

支援的音頻格式

單價

fun-asr

當前等同fun-asr-2025-11-07

穩定版

中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語

任意

ApsaraVideo for Live、電話語音、會議同傳等

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

$0.000032/秒

fun-asr-2025-11-07

相較fun-asr-2025-08-25做了遠場VAD最佳化,識別更准

快照版

fun-asr-2025-08-25

中文(普通話)、英文

fun-asr-mtl

當前等同fun-asr-mtl-2025-08-25

穩定版

中文(普通話、粵語)、英文、日語、韓語、越南語、印尼語、泰語、馬來語、菲律賓語、阿拉伯語、印地語、保加利亞語、克羅地亞語、捷克語、丹麥語、荷蘭語、愛沙尼亞語、芬蘭語、希臘語、匈牙利語、愛爾蘭語、拉脫維亞語、立陶宛語、馬爾他語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、瑞典語

fun-asr-mtl-2025-08-25

快照版

即時語音辨識

使用方法 | API參考

國際(新加坡)

模型名稱

版本

支援的語言

支援的採樣率

適用情境

支援的音頻格式

單價

免費額度(注)

fun-asr-realtime

當前等同fun-asr-realtime-2025-11-07

穩定版

中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語

16kHz

ApsaraVideo for Live、會議、電話客服等

pcm、wav、mp3、opus、speex、aac、amr

$0.00009/秒

36,000秒(10小時)

有效期間90天

fun-asr-realtime-2025-11-07

快照版

中國大陸(北京)

模型名稱

版本

支援的語言

支援的採樣率

適用情境

支援的音頻格式

單價

fun-asr-realtime

當前等同fun-asr-realtime-2025-11-07

穩定版

中文(普通話、粵語、吳語、閩南語、客家話、贛語、湘語、晉語;並支援中原、西南、冀魯、江淮、蘭銀、膠遼、東北、北京、港台等,包括河南、陝西、湖北、四川、重慶、雲南、貴州、廣東、廣西、河北、天津、山東、安徽、南京、江蘇、杭州、甘肅、寧夏等地區官話口音)、英文、日語

16kHz

ApsaraVideo for Live、會議、電話客服等

pcm、wav、mp3、opus、speex、aac、amr

$0.000047/秒

fun-asr-realtime-2025-11-07

相較fun-asr-realtime-2025-09-15做了遠場VAD最佳化,識別更准

快照版

fun-asr-realtime-2025-09-15

中文(普通話)、英文

文本向量

文本向量模型用於將文本轉換成一組可以代表文字的數字,適用於搜尋、聚類、推薦、分類任務。模型根據輸入Token數計費。API參考

國際(新加坡)

模型名稱

向量維度

批次大小

單批次最大處理Token數(

支援語種

單價

(每百萬輸入Token)

免費額度

(注)

text-embedding-v4

屬於Qwen3-Embedding系列

2,048、1,536、1,024(預設)、768、512、256、128、64

10

8,192

中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種及多種程式設計語言

$0.07

100萬Token

有效期間:百鍊開通後90天內

text-embedding-v3

1,024(預設)、768或512

10

8,192

中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等50+語種

50萬Token

有效期間:百鍊開通後90天內

中國大陸(北京)

模型名稱

向量維度

批次大小

單批次最大處理Token數(

支援語種

單價

(每百萬輸入Token)

免費額度

(注)

text-embedding-v4

屬於Qwen3-Embedding系列

2,048、1,536、1,024(預設)、768、512、256、128、64

10

8,192

中文、英語、西班牙語、法語、葡萄牙語、印尼語、日語、韓語、德語、俄羅斯語等100+主流語種及多種程式設計語言

$0.072

無免費額度

說明

批次大小指單次API調用中能處理的文本數量上限。例如,text-embedding-v4的批次大小為10,意味著一次請求最多可傳入10個文本進行向量化,且每個文本不得超過 8192 個Token。這個限制適用於:

  • 字串數組輸入:數組最多包含10個元素。

  • 檔案輸入:文字檔最多包含10行文本。

多模態向量

多模態向量模型將文本、映像或視頻轉換成一組由浮點數組成的向量,適用於視頻分類、映像分類、圖文檢索等。API參考

國際(新加坡)

模型名稱

資料類型

向量維度

單價(每百萬輸入Token)

免費額度(注)

tongyi-embedding-vision-plus

float(32)

1,152

$0.09

100萬Token

有效期間:百鍊開通後90天內

tongyi-embedding-vision-flash

float(32)

768

圖片/視頻:$0.03

文本:$0.09

中國大陸(北京)

模型名稱

資料類型

向量維度

單價(每千輸入Token)

免費額度(注)

multimodal-embedding-v1

float(32)

1,024

免費試用

無Token額度限制

文本排序

通常用於語義檢索,即給定查詢 (Query) 和一系列候選文本 (Documents),會根據與查詢的語義相關性從高到低對候選文本進行排序。API參考

說明

僅支援中國大陸(北京)地區。

模型名稱

最大Document數量

單行最大輸入Token

最大輸入Token

支援語言

單價(每百萬輸入Token)

gte-rerank-v2

500

4,000

30,000

中、英、日、韓、泰語、西、法、葡、德、印尼語、阿拉伯語等50+語種

$0.115

  • 單行最大輸入Token:每個Query或Document的最大Token數量為4,000。如果輸入內容超過此長度,將會被截斷。

  • 最大Document數量:每次請求中Document的最大數量為500。

  • 最大輸入Token:每次請求中所有Query和Document的Token總數不得超過30,000。

行業

意圖理解

通義意圖理解模型,能夠在百毫秒級時間內快速、準確地解析使用者意圖,並選擇合適工具來解決使用者問題。API參考使用方法

說明

僅支援中國大陸(北京)地區。

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

tongyi-intent-detect-v3

8,192

8,192

1,024

$0.058

$0.144

角色扮演

通義千問的角色扮演模型,適合擬人化的對話情境(如虛擬社交、遊戲NPC、IP複刻、硬體/玩具/車機等)。相比於其它通義千問模型,提升了人設還原、話題推進、傾聽共情等能力。使用方法

國際(新加坡)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-plus-character-ja

8,192

7,680

512

$0.5

$1.4

中國大陸(北京)

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

(Token數)

(每百萬Token)

qwen-plus-character

32,768

32,000

4,096

$0.115

$0.287

已下線模型

2025年8月20日下線

Qwen2

阿里雲的通義千問2-開源版。使用方法 | API參考 | 線上體驗

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

替代模型

(Token數)

(每百萬Token)

qwen2-72b-instruct

131,072

128,000

6,144

限時免費

Qwen3、DeepSeek、Kimi等

qwen2-57b-a14b-instruct

65,536

63,488

qwen2-7b-instruct

131,072

128,000

Qwen1.5

阿里雲的通義千問1.5-開源版。使用方法 | API參考 | 線上體驗

模型名稱

上下文長度

最大輸入

最大輸出

輸入成本

輸出成本

替代模型

(Token數)

(每百萬Token)

qwen1.5-110b-chat

8,000

6,000

2,000

限時免費

Qwen3、DeepSeek、Kimi等

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat