全部产品
Search
文档中心

大模型服务平台百炼:模型列表

更新时间:Dec 17, 2025

旗舰模型

国际(新加坡)

旗舰模型

通义new 通义千问Max

适合复杂任务,能力最强

通义new 通义千问Plus

效果、速度、成本均衡

通义new 通义千问Flash

适合简单任务,速度快、成本低

通义new 通义千问Coder

卓越的代码模型,擅长工具调用和环境交互

最大上下文长度

(Token数)

262,144

1,000,000

1,000,000

1,000,000

最低输入价格

(每百万Token)

$1.2

$0.4

$0.05

$0.3

最低输出价格

(每百万Token)

$6

$1.2

$0.4

$1.5

中国大陆(北京)

旗舰模型

通义new 通义千问Max

适合复杂任务,能力最强

通义new 通义千问Plus

效果、速度、成本均衡

通义new 通义千问Flash

适合简单任务,速度快、成本低

通义new 通义千问Coder

卓越的代码模型,擅长工具调用和环境交互

最大上下文长度

(Token数)

262,144

1,000,000

1,000,000

1,000,000

最低输入价格

(每百万Token)

$0.459

$0.115

$0.022

$0.144

最低输出价格

(每百万Token)

$1.836

$0.287

$0.216

$0.574

模型总览

国际(新加坡)

类别

子类别

说明

文本生成

通用大语言模型

通义千问大语言模型:商业版(通义千问Max通义千问Plus通义千问Flash)、开源版(Qwen3Qwen2.5

多模态模型

视觉理解模型通义千问VL、视觉推理模型QVQ、全模态模型通义千问 Omni、实时多模态模型通义千问Omni-Realtime

领域模型

代码模型翻译模型角色扮演模型

图像生成

文生图

图像编辑

  • 通义千问图像编辑:支持中英文提示词输入,可实现风格迁移、文字修改、物体编辑等复杂图文编辑操作。

  • 通义万相图像编辑:可生成图像或编辑图像,适用于生成证件照、电商主图、模特图、各种风格人像图(动漫、国风、二次元等),也可用于抠图、生成背景、更改图片元素等。

语音合成与识别

语音合成(文本转语音)

通义千问语音合成通义千问实时语音合成可实现文本转语音,适用于智能语音客服、有声读物、车载导航、教育辅导等场景。

语音识别与翻译

通义千问实时语音识别通义千问录音文件识别Qwen3-LiveTranslate-Flash-RealtimeFun-ASR语音识别可实现语音转文本,适用于实时会议记录、实时直播字幕、电话客服等场景。

视频生成

文生视频

一句话生成视频,视频风格丰富,画质细腻。

图生视频

  • 首帧生视频:将输入图片作为视频首帧,并根据提示词生成视频。

  • 首尾帧生视频:只需要提供首帧和尾帧图片,便能根据提示词生成一段丝滑流畅的动态视频。

  • 多图生视频:支持输入一张或多张图片,参考图片中的主体或背景,并结合提示词生成视频。

通用视频编辑

通用视频编辑:基于输入的文本、图片和视频,可执行多种视频编辑任务。例如,通过提取输入视频的运动特征,并结合提示词生成新的视频。

向量

文本向量

将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。

中国大陆(北京)

类别

模型

说明

文本生成

通用大语言模型

多模态模型

视觉理解模型通义千问VL、视觉推理模型QVQ、全模态模型通义千问Omni

领域模型

代码模型数学模型翻译模型数据挖掘模型深入研究模型意图理解模型角色扮演模型

图像生成

文生图

  • 通义千问文生图:在复杂文本渲染方面表现突出,特别是中英文文本渲染。

  • 通义万相文生图:适用于生成证件照、电商主图、模特图、各种风格人像图(动漫、国风、二次元等)。

图像编辑

通用模型:

  • 通义千问图像编辑:支持中英文提示词输入,可实现风格迁移、文字修改、物体编辑等复杂图文编辑操作。

  • 通义万相图像编辑:可生成图像或编辑图像,适用于生成证件照、电商主图、模特图、各种风格人像图(动漫、国风、二次元等),也可用于抠图、生成背景、更改图片元素等。

更多模型:通义千问图像翻译AI试衣

语音合成与识别

语音合成(文本转语音)

通义千问语音合成通义千问实时语音合成CosyVoice语音合成可实现文本转语音,适用于智能语音客服、有声读物、车载导航、教育辅导等场景。

语音识别与翻译

通义千问实时语音识别通义千问录音文件识别Fun-ASR语音识别Paraformer语音识别可实现语音转文本,适用于实时会议记录、实时直播字幕、电话客服等场景。

视频编辑与生成

文生视频

一句话生成视频,视频风格丰富,画质细腻。

图生视频

  • 首帧生视频:以输入图像作为视频首帧,结合提示词生成完整视频。

  • 首尾帧生视频:提供首帧与尾帧图像,结合提示词生成过渡自然的视频。

  • 多图生视频:支持输入一张或多张图片,参考图片中的主体或背景,并结合提示词生成视频。

  • 图+动作模板生成舞蹈视频:舞动人像AnimateAnyone基于人物图片和动作视频生成舞蹈视频。

  • 图+音频生成对口型视频

    • 通义万相-数字人基于人物图片和音频,动作幅度大且自然,支持全身、半身、肖像等多种画幅,适合唱歌、表演等场景。

    • 悦动人像EMO基于人物图片和音频,口型与表情表现力强,支持肖像、半身,适合人物特写场景。

    • 灵动人像LivePortrait基于人物图片和音频,适合语音播报场景。

  • 图+表情模板生成表情包视频:表情包Emoji基于人脸图片和预设的人脸动态模板,生成人脸表情包视频。

通用视频编辑

  • 通用视频编辑:基于输入的文本提示词、图片和视频,可执行多种视频编辑任务。例如,通过提取输入视频的运动特征,并结合提示词生成新的视频。

  • 视频口型替换:声动人像VideoRetalk基于人物视频和音频,适合短视频制作、视频翻译等场景。

  • 视频风格转换:视频风格重绘可将视频转换为日式漫画、美式漫画等风格。

向量

文本向量

将文本转换成一组可以代表文字的数字,用于搜索、聚类、推荐、分类等。

多模态向量

将文本、图像、语音转换成一组数字,用于音视频分类、图像分类、图文检索等。

文本生成-通义千问

以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。

商业版模型参数量暂不透出。
各模型会不定期更新升级。如需使用固定版本,请选择快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。
建议优先使用稳定版或最新版,限流条件更宽松。

通义千问Max

通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

国际(新加坡)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen3-max

当前与qwen3-max-2025-09-23能力相同
Batch调用半价

稳定版

仅非思考

262,144

258,048

-

65,536

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

qwen3-max-2025-09-23

快照版

仅非思考

qwen3-max-preview

预览版

思考

81,920

32,768

非思考

-

65,536

以上模型根据本次请求的输入 Token数,采取阶梯计费。

单次请求的输入Token数

输入价格(每百万Token)

qwen3-max、qwen3-max-preview 支持上下文缓存

输出价格(每百万Token)

0<Token≤32K

$1.2

$6

32K<Token≤128K

$2.4

$12

128K<Token≤252K

$3

$15

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-max

当前与qwen-max-2025-01-25能力相同

稳定版

32,768

30,720

8,192

$1.6

Batch调用半价

$6.4

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-max-latest

始终与最新快照版能力相同

最新版

$1.6

$6.4

qwen-max-2025-01-25

又称qwen-max-0125、Qwen2.5-Max

快照版

中国大陆(北京)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

输入成本

输出成本

(Token数)

(每千Token)

qwen3-max

当前与qwen3-max-2025-09-23能力相同
Batch调用半价

稳定版

仅非思考

262,144

258,048

-

65,536

阶梯计价,请参见表格下方说明。

qwen3-max-2025-09-23

快照版

仅非思考

qwen3-max-preview

预览版

思考

81,920

32,768

非思考

-

65,536

以上模型根据本次请求的输入 Token数,采取阶梯计费。

模型名称

单次请求的输入Token数

输入单价(每百万Token)

输出单价(每百万Token)

思维链+回答

qwen3-max

Batch调用半价
上下文缓存享有折扣

0<Token≤32K

$0.459

$1.836

32K<Token≤128K

$0.918

$3.672

128K<Token≤252K

$1.377

$5.508

qwen3-max-2025-09-23

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.434

$5.735

128K<Token≤252K

$2.151

$8.602

qwen3-max-preview

上下文缓存享有折扣

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.434

$5.735

128K<Token≤252K

$2.151

$8.602

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-max

当前与qwen-max-2024-09-19能力相同

稳定版

32,768

30,720

8,192

$0.345

$1.377

qwen-max-latest

始终与最新快照版能力相同

最新版

131,072

129,024

qwen-max-2025-01-25

又称qwen-max-0125、Qwen2.5-Max

快照版

qwen-max-2024-09-19

又称qwen-max-0919

32,768

30,720

$2.868

$8.602

qwen3-max-preview 模型的思考模式:在整体推理能力上显著提升,尤其在智能体编程、常识推理,以及数学、科学和通用任务方面表现更优。

通义千问Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Flash之间,适合中等复杂任务。使用方法 | API参考 | 在线体验深度思考

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-plus

当前与qwen-plus-2025-07-28能力相同
属于Qwen3系列

稳定版

1,000,000

思考模式

995,904

非思考模式

997,952

默认均为262,144,可通过max_input_tokens 参数调整

32,768

思维链最长81,920

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

qwen-plus-latest

当前与qwen-plus-2025-12-01能力相同
属于Qwen3系列

最新版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-12-01

属于Qwen3系列

快照版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-09-11

属于Qwen3系列

qwen-plus-2025-07-28

又称qwen-plus-0728
属于Qwen3系列

qwen-plus-2025-07-14

又称qwen-plus-0714
属于Qwen3系列

131,072

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

$0.4

思考模式

$4

非思考模式

$1.2

qwen-plus-2025-04-28

又称qwen-plus-0428
属于Qwen3系列

qwen-plus-2025-01-25

又称qwen-plus-0125

129,024

8,192

$1.2

qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根据本次请求输入的 Token数,采取阶梯计费。

单次请求的输入Token数

输入价格(每百万Token)

模式

输出价格(每百万Token)

0<Token≤256K

$0.4

非思考模式

$1.2

思考模式

$4

256K<Token≤1M

$1.2

非思考模式

$3.6

思考模式

$12

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-plus

当前与qwen-plus-2025-07-28能力相同
属于Qwen3系列

稳定版

1,000,000

思考模式

995,904

非思考模式

997,952

默认均为131,072,可通过max_input_tokens 参数调整

32,768

思维链最长81,920

阶梯计价,请参见表格下方说明。

qwen-plus-latest

当前与qwen-plus-2025-12-01能力相同
属于Qwen3系列

最新版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-12-01

属于Qwen3系列

快照版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-09-11

属于Qwen3系列

qwen-plus-2025-07-28

又称qwen-plus-0728
属于Qwen3系列

qwen-plus-2025-07-14

又称qwen-plus-0714
属于Qwen3系列

131,072

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

$0.115

思考模式

$1.147

非思考模式

$0.287

qwen-plus-2025-04-28

又称qwen-plus-0428
属于Qwen3系列

qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根据本次请求输入的 Token数,采取阶梯计费。

单次请求的输入Token数

输入价格(每百万Token)

模式

输出价格(每百万Token)

0<Token≤128K

$0.115

非思考模式

$0.287

思考模式

$1.147

128K<Token≤256K

$0.345

非思考模式

$2.868

思考模式

$3.441

256K<Token≤1M

$0.689

非思考模式

$6.881

思考模式

$9.175

上述模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

  1. 推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

  2. 人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

  3. Agent 能力:在思考、非思考两种模式下都达到业界领先水平,能精准调用外部工具。

  4. 多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

  5. 回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

对于上述模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-plus-2025-01-25

又称qwen-plus-0125

快照版

131,072

129,024

8,192

$0.115

$0.287

qwen-plus-2025-01-12

又称qwen-plus-0112

qwen-plus-2024-12-20

又称qwen-plus-1220

qwen-plus-2024-11-27

又称qwen-plus-1127

qwen-plus-2024-11-25

又称qwen-plus-1125

qwen-plus-2024-09-19

又称qwen-plus-0919

qwen-plus-2024-08-06

又称qwen-plus-0806

128,000

$0.574

$1.721

通义千问Flash

通义千问系列速度最快、成本极低的模型,适合简单任务。通义千问Flash采用灵活的阶梯定价,相比通义千问Turbo计费更合理。使用方法 | API参考 | 在线体验 | 思考模式

国际(新加坡)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

输入成本

输出成本

思维链+输出

免费额度

(注)

(Token数)

(每千Token)

qwen-flash

当前与 qwen-flash-2025-07-28能力相同
属于Qwen3系列
Batch调用半价

稳定版

思考

1,000,000

995,904

81,920

32,768

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

非思考

997,952

-

qwen-flash-2025-07-28

属于Qwen3系列

快照版

思考

995,904

81,920

非思考

997,952

-

以上模型根据本次请求输入的 Token数采取阶梯计费,其中qwen-flash支持缓存Batch调用

单次请求的输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0<Token≤256K

$0.05

$0.4

256K<Token≤1M

$0.25

$2

中国大陆(北京)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

输入成本

输出成本

思维链+输出

(Token数)

(每千Token)

qwen-flash

当前与 qwen-flash-2025-07-28能力相同
属于Qwen3系列

稳定版

思考

1,000,000

995,904

81,920

32,768

阶梯计价,请参见表格下方说明。

非思考

997,952

-

qwen-flash-2025-07-28

属于Qwen3系列

快照版

思考

995,904

81,920

非思考

997,952

-

以上模型根据本次请求输入的 Token数采取阶梯计费,其中qwen-flash支持上下文缓存

单次请求的输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0<Token≤128K

$0.022

$0.216

128K<Token≤256K

$0.087

$0.861

256K<Token≤1M

$0.173

$1.721

通义千问Turbo

通义千问Turbo 后续不再更新,建议替换为通义千问Flash。通义千问Flash采用灵活的阶梯定价,计费更合理。使用方法 | API参考 | 在线体验深度思考

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-turbo

当前与qwen-turbo-2025-04-28能力相同
属于Qwen3系列

稳定版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思维链最长38,912

$0.05

Batch调用半价

思考模式:$0.5

非思考模式:$0.2

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-turbo-latest

始终与最新快照版能力相同
属于Qwen3系列

最新版

$0.05

思考模式:$0.5

非思考模式:$0.2

qwen-turbo-2025-04-28

又称qwen-turbo-0428
属于Qwen3系列

快照版

qwen-turbo-2024-11-01

又称qwen-turbo-1101

1,000,000

1,000,000

8,192

$0.2

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-turbo

当前与 qwen-turbo-2025-04-28能力相同
属于Qwen3系列

稳定版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思维链最长38,912

$0.044

思考模式

$0.431

非思考模式

$0.087

qwen-turbo-latest

始终与最新快照版能力相同
属于Qwen3系列

最新版

qwen-turbo-2025-07-15

又称qwen-turbo-0715
属于Qwen3系列

快照版

qwen-turbo-2025-04-28

又称qwen-turbo-0428
属于Qwen3系列

QwQ

基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。使用方法

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwq-plus

稳定版

131,072

98,304

32,768

8,192

$0.8

$2.4

100万 Token

有效期:百炼开通后90天内

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwq-plus

当前与qwq-plus-2025-03-05能力相同

稳定版

131,072

98,304

32,768

8,192

$0.230

$0.574

qwq-plus-latest

始终与最新快照版能力相同

最新版

qwq-plus-2025-03-05

又称qwq-plus-0305

快照版

通义千问Long

通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。使用方法 | 在线体验

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-long-latest

始终与最新快照版能力相同

稳定版

10,000,000

10,000,000

32,768

$0.072

$0.287

qwen-long-2025-01-25

又称qwen-long-0125

快照版

通义千问Omni

Qwen-Omni 模型能够接收文本、图片、音频、视频等多种模态的组合输入,并生成文本或语音形式的回复, 提供多种高表现力拟人音色,支持多语言和方言的语音输出,可应用于视觉识别、情绪感知、教育培训等音视频聊天场景。使用方法API 参考

国际(新加坡)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

免费额度

(注)

(Token数)

qwen3-omni-flash

当前与qwen3-omni-flash-2025-09-15能力相同

稳定版

思考模式

65,536

16,384

32,768

16,384

各100万Token(不区分模态)

有效期:百炼开通后90天内

非思考模式

49,152

-

qwen3-omni-flash-2025-12-01

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

qwen3-omni-flash-2025-09-15

又称qwen3-omni-flash-0915

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

免费额度用完后,输入与输出的计费规则如下,思考模式和非思考模式的计费相同,且思考模式下不支持输出音频。

输入计费项

单价(每百万 Token)

输入:文本

$0.43

输入:音频

$3.81

输入:图片/视频

$0.78

输出计费项

单价(每百万 Token)

输出:文本

$1.66(输入仅包含文本时)

$3.06(输入包含图片/视频/音频时)

输出:文本+音频

思考模式下无此项计费。

$15.11(音频)

输出的文本不计费。

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo

当前与qwen-omni-turbo-2025-03-26能力相同

稳定版

32,768

30,720

2,048

各100万Token(不区分模态)

有效期:百炼开通后90天内

qwen-omni-turbo-latest

始终与最新快照版
能力相同

最新版

qwen-omni-turbo-2025-03-26

又称qwen-omni-turbo-0326

快照版

商业版模型的免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.07

输入:音频

$4.44

输入:图片/视频

$0.21

输出计费项

单价(每百万 Token)

输出:文本

$0.27(输入仅包含文本时)

$0.63(输入包含图片/视频/音频时)

输出:文本+音频

$8.89(音频)

输出的文本不计费。

中国大陆(北京)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

免费额度

(注)

(Token数)

qwen3-omni-flash

当前与qwen3-omni-flash-2025-09-15能力相同

稳定版

思考模式

65,536

16,384

32,768

16,384

无免费额度

非思考模式

49,152

-

qwen3-omni-flash-2025-12-01

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

qwen3-omni-flash-2025-09-15

又称qwen3-omni-flash-0915

快照版

思考模式

65,536

16,384

32,768

16,384

非思考模式

49,152

-

免费额度用完后,输入与输出的计费规则如下,思考模式和非思考模式的计费相同,且思考模式下不支持输出音频。

输入计费项

单价(每百万 Token)

输入:文本

$0.258

输入:音频

$2.265

输入:图片/视频

$0.473

输出计费项

单价(每百万 Token)

输出:文本

$0.989(输入仅包含文本时)

$1.821(输入包含图片/视频/音频时)

输出:文本+音频

思考模式下无此项计费。

$8.974(音频)

输出的文本不计费。

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo

当前与qwen-omni-turbo-2025-03-26能力相同

稳定版

32,768

30,720

2,048

无免费额度

qwen-omni-turbo-latest

始终与最新快照版
能力相同

最新版

qwen-omni-turbo-2025-03-26

又称qwen-omni-turbo-0326

快照版

qwen-omni-turbo-2025-01-19

又称qwen-omni-turbo-0119

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.058

输入:音频

$3.584

输入:图片/视频

$0.216

输出计费项

单价(每百万 Token)

输出:文本

$0.230(输入仅包含文本时)

$0.646(输入包含图片/音频/视频时)

输出:文本+音频

$7.168(音频)

输出的文本不计费。

计费示例:某次请求输入了1000 Token 的文本和1000 Token 的图片,输出了1000 Token 的文本和1000 Token 的音频,则该请求花费:$0.000058(文本输入)+ $0.000216(图片输入)+ $0.007168(音频输出)

建议优先使用Qwen3-Omni-Flash模型相较于Qwen-Omni-Turbo(后续不再更新),模型的能力得到大幅提升:

  • 属于混合思考模型支持思考模式和非思考模式,可通过 enable_thinking 参数实现两种模式的切换,默认不开启思考模式。

  • 思考模式下不支持输出音频;在非思考模式下,对于模型输出的音频:

    • qwen3-omni-flash-2025-12-01支持的音色增加至49种,qwen3-omni-flash-2025-09-15、qwen3-omni-flash支持的音色增加至 17 种,Qwen-Omni-Turbo 仅支持 4 种;

    • 支持语言增加至 10 种,Qwen-Omni-Turbo 仅支持 2 种。

通义千问Omni-Realtime

相比于通义千问Omni,支持音频的流式输入,且内置 VAD(Voice Activity Detection,语音活动检测)功能,可自动检测用户语音的开始和结束。使用方法客户端事件服务端事件

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen3-omni-flash-realtime

当前能力等同 qwen3-omni-flash-realtime-2025-09-15

稳定版

65,536

49,152

16,384

各100万Token(不区分模态)

有效期:百炼开通后90天内

qwen3-omni-flash-realtime-2025-12-01

快照版

qwen3-omni-flash-realtime-2025-09-15

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.52

输入:音频

$4.57

输入:图片

$0.94

输出计费项

单价(每百万 Token)

输出:文本

$1.99(输入仅包含文本时)

$3.67(输入包含图片/音频时)

输出:文本+音频

$18.13(音频)

输出的文本不计费。

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo-realtime

当前能力等同 qwen-omni-turbo-realtime-2025-05-08

稳定版

32,768

30,720

2,048

各100万Token(不区分模态)

有效期:百炼开通后90天内

qwen-omni-turbo-realtime-latest

能力始终等同最新快照版

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.270

输入:音频

$4.440

输入:图片

$0.840

输出计费项

单价(每百万Token)

输出:文本

$1.070(输入仅包含文本时)

$2.520(输入包含图片/音频时)

输出:文本+音频

$8.890(音频)

输出的文本不计费。

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen3-omni-flash-realtime

当前能力等同 qwen3-omni-flash-realtime-2025-09-15

稳定版

65,536

49,152

16,384

无免费额度

qwen3-omni-flash-realtime-2025-12-01

快照版

qwen3-omni-flash-realtime-2025-09-15

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.315

输入:音频

$2.709

输入:图片

$0.559

输出计费项

单价(每百万 Token)

输出:文本

$1.19(输入仅包含文本时)

$2.179(输入包含图片/音频时)

输出:文本+音频

$10.766(音频)

输出的文本不计费。

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo-realtime

当前与qwen-omni-turbo-2025-05-08能力相同

稳定版

32,768

30,720

2,048

无免费额度

qwen-omni-turbo-realtime-latest

始终与最新快照版能力相同

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.230

输入:音频

$3.584

输入:图片

$0.861

输出计费项

单价(每百万 Token)

输出:文本

$0.918(输入仅包含文本时)

$2.581(输入包含图片/音频时)

输出:文本+音频

$7.168(音频)

输出的文本不计费。

建议优先使用Qwen3-Omni-Flash-Realtime 模型相较于Qwen-Omni-Turbo-Realtime(后续不再更新),模型的能力得到大幅提升。对于模型输出的音频:

  • qwen3-omni-flash-realtime-2025-12-01支持的音色增加至49种,qwen3-omni-flash-realtime-2025-09-15、qwen3-omni-realtime-flash支持的音色增加至 17 种,Qwen-Omni-Turbo-Realtime 仅支持 4 种

  • 支持的语言增加至 10 种,Qwen-Omni-Turbo-Realtime 仅支持 2 种

QVQ

QVQ是视觉推理模型,支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。使用方法 | 在线体验

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qvq-max

当前与 qvq-max-2025-03-25能力相同

稳定版

131,072

106,496

单图最大16384

16,384

8,192

$1.2

$4.8

各100万 Token

有效期:百炼开通后90天内

qvq-max-latest

始终与最新快照版能力相同

最新版

qvq-max-2025-03-25

又称qvq-max-0325

快照版

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qvq-max

相比 qvq-plus 具有更强的视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。
当前与qvq-max-2025-03-25能力相同

稳定版

131,072

106,496

单图最大16384

16,384

8,192

$1.147

$4.588

qvq-max-latest

始终与最新快照版能力相同

最新版

qvq-max-2025-05-15

又称qvq-max-0515

快照版

qvq-max-2025-03-25

又称qvq-max-0325

qvq-plus

当前与qvq-plus-2025-05-15能力相同

稳定版

$0.287

$0.717

qvq-plus-latest

始终与最新快照版能力相同

最新版

qvq-plus-2025-05-15

又称qvq-plus-0515

快照版

通义千问VL

通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。如何使用 | API参考 | 在线体验

通义千问VL模型按输入和输出的总Token数进行计费。图像Token的计算规则视觉理解

国际(新加坡)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

输入成本

输出成本

思维链+输出

免费额度

(注)

(Token数)

(每百万Token)

qwen3-vl-plus

当前与qwen3-vl-plus-2025-09-23能力相同

稳定版

思考

262,144

258,048

单图最大16384

81,920

32,768

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

非思考

260,096

单图最大16384

-

qwen3-vl-plus-2025-09-23

快照版

思考

258,048

单图最大16384

81,920

非思考

260,096

单图最大16384

-

qwen3-vl-flash

当前与qwen3-vl-flash-2025-10-15能力相同

稳定版

思考

258,048

单图最大16384

81,920

非思考

260,096

单图最大16384

-

qwen3-vl-flash-2025-10-15

快照版

思考

258,048

单图最大16384

81,920

非思考

260,096

单图最大16384

-

以上模型根据本次请求输入的 Token数,采取阶梯计费。思考模式与非思考模式的输入输出价格相同。

qwen3-vl-plus系列

单次请求的输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0<Token≤32K

$0.2

$1.6

32K<Token≤128K

$0.3

$2.4

128K<Token≤256K

$0.6

$4.8

qwen3-vl-flash系列

单次请求的输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0<Token≤32K

$0.05

$0.4

32K<Token≤128K

$0.075

$0.6

128K<Token≤256K

$0.12

$0.96

更多模型

Qwen-VL-Max

Qwen-VL-Max效果优于Qwen-VL-Plus,以下模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-max

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。
当前与qwen-vl-max-2025-08-13能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.8

Batch调用半价

$3.2

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-vl-max-latest

始终与最新快照版能力相同

最新版

$0.8

$3.2

qwen-vl-max-2025-08-13

又称qwen-vl-max-0813
视觉理解指标全面提升,数学、推理、物体识别、多语言处理能力显著增强。

快照版

qwen-vl-max-2025-04-08

又称qwen-vl-max-0408
属于Qwen2.5-VL系列模型,扩展上下文至128k,显著增强数学和推理能力。
Qwen-VL-Plus

Qwen-VL-Plus模型在效果、成本上比较均衡。以下模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-plus

当前与qwen-vl-plus-2025-08-15能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.21

Batch调用半价

$0.63

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-vl-plus-latest

始终与最新快照版能力相同

最新版

$0.21

$0.63

qwen-vl-plus-2025-08-15

又称qwen-vl-plus-0815
在物体识别与定位、多语言处理的能力上有显著提升

快照版

qwen-vl-plus-2025-05-07

又称qwen-vl-plus-0507
显著提升数学、推理、监控视频内容的理解能力

qwen-vl-plus-2025-01-25

又称qwen-vl-plus-0125
属于Qwen2.5-VL系列模型,扩展上下文至128k,显著增强图像和视频的理解能力。

中国大陆(北京)

模型名称

版本

模式

上下文长度

最大输入

最长思维链

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-vl-plus

当前与qwen3-vl-plus-2025-09-23能力相同

稳定版

思考

262,144

258,048

单图最大16384

81,920

32,768

阶梯计价,请参见表格下方说明。

无免费额度

非思考

260,096

单图最大16384

-

qwen3-vl-plus-2025-09-23

快照版

思考

258,048

单图最大16384

81,920

非思考

260,096

单图最大16384

-

qwen3-vl-flash

当前与qwen3-vl-flash-2025-10-15能力相同

稳定版

思考

258,048

单图最大16384

81,920

非思考

260,096

单图最大16384

-

qwen3-vl-flash-2025-10-15

快照版

思考

258,048

单图最大16384

81,920

非思考

260,096

单图最大16384

-

以上模型根据本次请求输入的 Token数,采取阶梯计费。思考模式与非思考模式的输入输出价格相同。

qwen3-vl-plus系列

单次请求的输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0<Token≤32K

$0.143353

$1.433525

32K<Token≤128K

$0.215029

$2.150288

128K<Token≤256K

$0.430058

$4.300576

qwen3-vl-flash系列

单次请求的输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0<Token≤32K

$0.022

$0.215

32K<Token≤128K

$0.043

$0.43

128K<Token≤256K

$0.086

$0.859

更多模型

通义千问VL-Max系列
qwen-vl-max-2025-01-25及以后更新的模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-vl-max

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能
当前与qwen-vl-max-2025-08-13能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.23

$0.574

qwen-vl-max-latest

始终与最新快照版能力相同

最新版

qwen-vl-max-2025-08-13

又称qwen-vl-max-0813
视觉理解指标全面提升,数学、推理、物体识别、多语言处理能力显著增强。

快照版

qwen-vl-max-2025-04-08

又称qwen-vl-max-0408
增强数学和推理能力

$0.431

$1.291

qwen-vl-max-2025-04-02

又称qwen-vl-max-0402
显著提高解决复杂数学问题的准确性

qwen-vl-max-2025-01-25

又称qwen-vl-max-0125
升级至Qwen2.5-VL系列,扩展上下文至128k,显著增强图像和视频的理解能力

qwen-vl-max-2024-12-30

又称qwen-vl-max-1230

32,768

30,720

单图最大16384

2,048

$0.431

$1.291

qwen-vl-max-2024-11-19

又称qwen-vl-max-1119

qwen-vl-max-2024-10-30

又称qwen-vl-max-1030

$2.868

qwen-vl-max-2024-08-09

又称qwen-vl-max-0809
通义千问VL-Plus系列
qwen-vl-plus-2025-01-25及以后更新的模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-vl-plus

当前与qwen-vl-plus-2025-08-15能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.115

$0.287

qwen-vl-plus-latest

始终与最新快照版能力相同

最新版

qwen-vl-plus-2025-08-15

又称qwen-vl-plus-0815
在物体识别与定位、多语言处理的能力上有显著提升

快照版

qwen-vl-plus-2025-07-10

又称qwen-vl-plus-0710
进一步提升监控视频内容的理解能力

32,768

30,720

单图最大16384

$0.022

$0.216

qwen-vl-plus-2025-05-07

又称qwen-vl-plus-0507
显著提升数学、推理、监控视频内容的理解能力

131,072

129,024

单图最大16384

$0.216

$0.646

qwen-vl-plus-2025-01-25

又称qwen-vl-plus-0125
升级至Qwen2.5-VL系列,扩展上下文至128k,显著增强图像和视频理解能力

qwen-vl-plus-2025-01-02

又称qwen-vl-plus-0102

32,768

30,720

单图最大16384

2,048

qwen-vl-plus-2024-08-09

又称qwen-vl-plus-0809

通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考在线体验

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大输出

输入单价

输出单价

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-ocr

稳定版

34,096

30,000

单图最大30000

4096

$0.72

$0.72

各100万Token

有效期:百炼开通后90天内

qwen-vl-ocr-2025-11-20

又称qwen-vl-ocr-1120
基于Qwen3-VL架构,大幅提升文档解析、文字定位能力。

快照版

38,192

8,192

$0.07

$0.16

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

输入单价

输出单价

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-ocr

当前与qwen-vl-ocr-2025-08-28能力相同

稳定版

34,096

30,000

单图最大30000

4,096

$0.717

$0.717

无免费额度

qwen-vl-ocr-latest

始终与最新版能力相同

最新版

38,192

8,192

$0.043

$0.072

qwen-vl-ocr-2025-11-20

又称qwen-vl-ocr-1120
基于Qwen3-VL架构,大幅提升文档解析、文字定位能力。

快照版

qwen-vl-ocr-2025-08-28

又称qwen-vl-ocr-0828

34,096

4,096

$0.717

$0.717

qwen-vl-ocr-2025-04-13

又称qwen-vl-ocr-0413

qwen-vl-ocr-2024-10-28

又称qwen-vl-ocr-1028

通义千问数学模型

通义千问数学模型是专门用于数学解题的语言模型。使用方法 | API参考 | 在线体验

说明

仅支持中国大陆(北京)地域。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-math-plus

当前与qwen-math-plus-2024-09-19能力相同

稳定版

4,096

3,072

3,072

$0.574

$1.721

qwen-math-plus-latest

始终与最新快照版能力相同

最新版

qwen-math-plus-2024-09-19

又称qwen-math-plus-0919

快照版

qwen-math-plus-2024-08-16

又称qwen-math-plus-0816

qwen-math-turbo

当前与qwen-math-turbo-2024-09-19能力相同

稳定版

$0.287

$0.861

qwen-math-turbo-latest

始终与最新快照版能力相同

最新版

qwen-math-turbo-2024-09-19

又称qwen-math-turbo-0919

快照版

通义千问Coder

通义千问代码模型。最新的 Qwen3-Coder-Plus 系列模型是基于 Qwen3 的代码生成模型,具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程,代码能力卓越的同时兼具通用能力。使用方法 | API参考 | 在线体验

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-coder-plus

当前与qwen3-coder-plus-2025-07-22能力相同

稳定版

1,000,000

997,952

65,536

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

qwen3-coder-plus-2025-09-23

快照版

qwen3-coder-plus-2025-07-22

快照版

qwen3-coder-flash

当前与qwen3-coder-flash-2025-07-28能力相同

稳定版

qwen3-coder-flash-2025-07-28

快照版

上述模型根据本次请求输入的Token数,采取阶梯计费。

qwen3-coder-plus系列

qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 价格如下,其中 qwen3-coder-plus 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0<Token≤32K

$1

$5

32K<Token≤128K

$1.8

$9

128K<Token≤256K

$3

$15

256K<Token≤1M

$6

$60

qwen3-coder-flash系列

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下,其中 qwen3-coder-flash 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0<Token≤32K

$0.3

$1.5

32K<Token≤128K

$0.5

$2.5

128K<Token≤256K

$0.8

$4

256K<Token≤1M

$1.6

$9.6

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-coder-plus

当前与qwen3-coder-plus-2025-07-22能力相同

稳定版

1,000,000

997,952

65,536

阶梯计价,请参见表格下方说明。

qwen3-coder-plus-2025-09-23

快照版

qwen3-coder-plus-2025-07-22

快照版

qwen3-coder-flash

当前与qwen3-coder-flash-2025-07-28能力相同

稳定版

qwen3-coder-flash-2025-07-28

快照版

上述模型根据本次请求输入的Token数,采取阶梯计费。

qwen3-coder-plus系列

qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 价格如下,其中 qwen3-coder-plus 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0<Token≤32K

$0.574

$2.294

32K<Token≤128K

$0.861

$3.441

128K<Token≤256K

$1.434

$5.735

256K<Token≤1M

$2.868

$28.671

qwen3-coder-flash系列

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下,其中 qwen3-coder-flash 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0<Token≤32K

$0.144

$0.574

32K<Token≤128K

$0.216

$0.861

128K<Token≤256K

$0.359

$1.434

256K<Token≤1M

$0.717

$3.584

更多模型

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-coder-plus

当前与qwen-coder-plus-2024-11-06能力相同

稳定版

131,072

129,024

8,192

$0.502

$1.004

qwen-coder-plus-latest

与qwen-coder-plus的最新快照版能力相同

最新版

qwen-coder-plus-2024-11-06

又称qwen-coder-plus-1106

快照版

qwen-coder-turbo

当前与qwen-coder-turbo-2024-09-19能力相同

稳定版

131,072

129,024

8,192

$0.287

$0.861

qwen-coder-turbo-latest

与qwen-coder-turbo的最新快照版能力相同

最新版

qwen-coder-turbo-2024-09-19

又称qwen-coder-turbo-0919

快照版

通义千问翻译模型

基于 Qwen 3全面升级的旗舰级翻译大模型,支持92个语种(包括中、英、日、韩、法、西、德、泰、印尼、越、阿等)互译,模型性能和翻译效果全面升级,提供更稳定的术语定制、格式还原度、领域提示能力,让译文更精准、自然。使用方法

国际(新加坡)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

规则说明

(Token数)

(每百万Token)

qwen-mt-plus

属于Qwen3-MT

16,384

8,192

8,192

$2.46

$7.37

各100万Token

有效期:百炼开通后90天内

qwen-mt-flash

属于Qwen3-MT

$0.16

$0.49

qwen-mt-lite

属于Qwen3-MT

$0.12

$0.36

qwen-mt-turbo

属于Qwen3-MT

$0.16

$0.49

中国大陆(北京)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-mt-plus

属于Qwen3-MT

16,384

8,192

8,192

$0.259

$0.775

qwen-mt-flash

属于Qwen3-MT

$0.101

$0.280

qwen-mt-lite

属于Qwen3-MT

$0.086

$0.229

qwen-mt-turbo

属于Qwen3-MT

$0.101

$0.280

通义千问数据挖掘模型

通义千问数据挖掘模型可以提取文档中的结构化信息并用于数据标注和内容审核等领域。使用方法 | API参考

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每百万Token)

qwen-doc-turbo

262,144

253,952

32,768

$0.087

$0.144

无免费额度

通义千问深入研究模型

通义千问深入研究模型可以拆解复杂问题,结合互联网搜索进行推理分析并生成研究报告。使用方法 | API参考

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每千Token)

qwen-deep-research

1,000,000

997,952

32,768

$0.007742

$0.023367

文本生成-通义千问-开源版

  • 模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。

  • 百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen3和Qwen2.5模型。

Qwen3

2025 年 9月发布的 qwen3-next-80b-a3b-thinking 仅支持思考模式,相较于qwen3-235b-a22b-thinking-2507提升了指令遵循能力,总结回复更加精简。

2025 年 9月发布的 qwen3-next-80b-a3b-instruct 仅支持非思考模式,相较于qwen3-235b-a22b-instruct-2507增强了中文理解、逻辑推理及文本生成能力。

2025 年 7月发布的 qwen3-235b-a22b-thinking-2507、qwen3-30b-a3b-thinking-2507 模型仅支持思考模式,是qwen3-235b-a22b(思考模式)与qwen3-30b-a3b (思考模式)的升级版。

2025 年 7月发布的 qwen3-235b-a22b-instruct-2507、qwen3-30b-a3b-instruct-2507 模型仅支持非思考模式,是qwen3-235b-a22b(非思考模式)与qwen3-30b-a3b (非思考模式)的升级版。

2025 年 4月发布的 Qwen3 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,Qwen3 模型的能力得到了大幅提升:

  1. 推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

  2. 人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

  3. Agent 能力:在推理、非推理两种模式下都达到业界领先水平,能够实现精准的外部工具调用。

  4. 多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

    支持的语言

    英语(English)

    简体中文(Simplified Chinese)

    繁体中文(Traditional Chinese)

    法语(French)

    西班牙语(Spanish)

    阿拉伯语(Arabic),使用阿拉伯字母。是众多阿拉伯国家的官方语言。

    俄语(Russian),使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

    葡萄牙语(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

    德语(German),使用拉丁字母。在德国和奥地利等地是官方语言。

    意大利语(Italian),使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

    荷兰语(Dutch),使用拉丁字母。在荷兰、比利时部分地区(弗拉芒地区)和苏里南是官方语言。

    丹麦语(Danish),使用拉丁字母。在丹麦是官方语言。

    爱尔兰语(Irish),使用拉丁字母。在爱尔兰是官方语言之一。

    威尔士语(Welsh),使用拉丁字母。在威尔士使用,是官方语言之一。

    芬兰语(Finnish),使用拉丁字母。在芬兰是官方语言。

    冰岛语(Icelandic),使用拉丁字母。在冰岛是官方语言。

    瑞典语(Swedish),使用拉丁字母。是瑞典的官方语言。

    新挪威语(Norwegian Nynorsk),使用拉丁字母。在挪威与书面挪威语共同使用,属主流语言的一部分。

    书面挪威语(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流语言的一部分。

    日语(Japanese),使用日文字母。在日本是官方语言。

    朝鲜语/韩语(Korean),使用韩字(Hangul)。在韩国和朝鲜是官方语言。

    越南语(Vietnamese),使用拉丁字母。在越南是官方语言。

    泰语(Thai),使用泰文字母。在泰国是官方语言。

    印度尼西亚语(Indonesian),使用拉丁字母。是印度尼西亚的官方语言。

    马来语(Malay),使用拉丁字母。是马来西亚等地的主要语言。

    缅甸语(Burmese),使用缅甸字母。在缅甸是官方语言。

    他加禄语(Tagalog),使用拉丁字母。菲律宾的主要语言之一。

    高棉语(Khmer),使用高棉字母。在柬埔寨是官方语言。

    老挝语(Lao),使用老挝字母。在老挝是官方语言。

    印地语(Hindi),使用天城文(Devanagari)。是印度的官方语言之一。

    孟加拉语(Bengali),使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

    乌尔都语(Urdu),使用阿拉伯字母。在巴基斯坦是官方语言之一,也在印度使用。

    尼泊尔语(Nepali),使用天城字母。在尼泊尔是官方语言。

    希伯来语(Hebrew),使用希伯来字母。在以色列是官方语言。

    土耳其语(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

    波斯语(Persian),使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

    波兰语(Polish),使用拉丁字母。在波兰是官方语言。

    乌克兰语(Ukrainian),使用西里尔字母。在乌克兰是官方语言。

    捷克语(Czech),使用拉丁字母。在捷克是官方语言。

    罗马尼亚语(Romanian),使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

    保加利亚语(Bulgarian),使用西里尔字母。在保加利亚是官方语言。

    斯洛伐克语(Slovak),使用拉丁字母。在斯洛伐克是官方语言。

    匈牙利语(Hungarian),使用拉丁字母。在匈牙利是官方语言。

    斯洛文尼亚语(Slovenian),使用拉丁字母。在斯洛文尼亚是官方语言。

    拉脱维亚语(Latvian),使用拉丁字母。在拉脱维亚是官方语言。

    爱沙尼亚语(Estonian),使用拉丁字母。在爱沙尼亚是官方语言。

    立陶宛语(Lithuanian),使用拉丁字母。在立陶宛是官方语言。

    白俄罗斯语(Belarusian),使用西里尔字母。在白俄罗斯是官方语言之一。

    希腊语(Greek),使用希腊字母。在希腊和塞浦路斯是官方语言。

    克罗地亚语(Croatian),使用拉丁字母。在克罗地亚是官方语言。

    马其顿语(Macedonian),使用西里尔字母。是北马其顿的官方语言。

    马耳他语(Maltese),使用拉丁字母。在马耳他是官方语言。

    塞尔维亚语(Serbian),使用西里尔字母。在塞尔维亚是官方语言。

    波斯尼亚语(Bosnian),使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

    格鲁吉亚语(Georgian),使用格鲁吉亚字母(Georgian script)。在格鲁吉亚是官方语言。

    亚美尼亚语(Armenian),使用亚美尼亚字母。在亚美尼亚是官方语言。

    北阿塞拜疆语(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方语言。

    哈萨克语(Kazakh),使用西里尔字母。在哈萨克斯坦是官方语言。

    北乌兹别克语(Northern Uzbek),使用拉丁字母。在乌兹别克斯坦是官方语言。

    塔吉克语(Tajik),使用西里尔字母。在塔吉克斯坦是官方语言。

    斯瓦西里语(Swahili),使用拉丁字母。在东非许多国家是通用语或官方语言。

    南非语(Afrikaans),使用拉丁字母。主要在南非和纳米比亚使用。

    粤语(Cantonese),使用繁体字。主要在中国广东省、香港和澳门使用,是这些地区的主要语言之一。

    卢森堡语(Luxembourgish),使用拉丁字母。在卢森堡和德国部分地区使用,是官方语言之一。

    林堡语(Limburgish),使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

    加泰罗尼亚语(Catalan),使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

    加利西亚语(Galician),使用拉丁字母。主要在西班牙加利西亚地区使用。

    阿斯图里亚斯语(Asturian),使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

    巴斯克语(Basque),使用拉丁字母。主要在西班牙和法国的巴斯克地区使用,是西班牙巴斯克自治区的官方语言之一。

    奥克语(Occitan),使用拉丁字母。主要在法国南部地区使用。

    威尼斯语(Venetian),使用拉丁字母。主要在意大利威尼斯地区使用。

    撒丁语(Sardinian),使用拉丁字母。主要在意大利撒丁岛使用。

    西西里语(Sicilian),使用拉丁字母。主要在意大利西西里岛使用。

    弗留利语(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

    隆巴底语(Lombard),使用拉丁字母。主要在意大利伦巴第地区使用。

    利古里亚语(Ligurian),使用拉丁字母。主要在意大利利古里亚地区使用。

    法罗语(Faroese),使用拉丁字母。主要在法罗群岛使用,是法罗群岛的官方语言之一。

    托斯克阿尔巴尼亚语(Tosk Albanian),使用拉丁字母。主要是阿尔巴尼亚南部方言。

    西里西亚语(Silesian),使用拉丁字母。主要在波兰使用。

    巴什基尔语(Bashkir),使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

    鞑靼语(Tatar),使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

    美索不达米亚阿拉伯语(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

    内志阿拉伯语(Najdi Arabic),使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

    埃及阿拉伯语(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

    黎凡特阿拉伯语(Levantine Arabic),使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

    闪米特阿拉伯语(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

    达里语(Dari),使用阿拉伯字母。在阿富汗是官方语言之一。

    突尼斯阿拉伯语(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

    摩洛哥阿拉伯语(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

    克里奥尔语(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

    托克皮辛语(Tok Pisin),使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

    意第绪(Eastern Yiddish),使用希伯来字母。主要在犹太社区中使用。

    信德阿拉伯语(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

    僧伽罗语(Sinhala),使用僧伽罗字母。在斯里兰卡是官方语言之一。

    泰卢固语(Telugu),使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

    旁遮普语(Punjabi),使用古尔穆奇字母。在印度旁遮普邦使用,是印度的官方语言之一。

    泰米尔语(Tamil),使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

    古吉拉特语(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

    马拉雅拉姆语(Malayalam),使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

    马拉地语(Marathi),使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

    卡纳达语(Kannada),使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

    马加拉语(Magahi),使用天城文本。主要在印度比哈尔邦使用。

    奥里亚语(Oriya),使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

    阿瓦德语(Awadhi),使用天城字母。主要在印度北方邦使用。

    迈蒂利语(Maithili),使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用,是印度的官方语言之一。

    阿萨姆语(Assamese),使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

    切蒂斯格尔语(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格尔邦使用。

    比哈尔语(Bhojpuri),使用天城字母。在印度和尼泊尔部分地区使用。

    米南加保语(Minangkabau),使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

    巴厘语(Balinese),使用拉丁字母。主要在印度尼西亚巴厘岛使用。

    爪哇语(Javanese),使用拉丁字母(也惯用爪哇文字)。在印度尼西亚爪哇岛广泛使用。

    班章语(Banjar),使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

    巽他语(Sundanese),使用拉丁字母(虽然传统上使用巽他文字)。主要在印度尼西亚爪哇岛的西部使用。

    宿务语(Cebuano),使用拉丁字母。主要在菲律宾宿务地区使用。

    邦阿西楠语(Pangasinan),使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

    伊洛卡诺语(Iloko),使用拉丁字母。主要在菲律宾使用。

    瓦莱语(Waray (Philippines)),使用拉丁字母。主要在菲律宾使用。

    海地语(Haitian),使用拉丁字母。在海地是官方语言之一。

    帕皮阿门托语(Papiamento),使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

  5. 回复格式问题修复:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

2025 年 4月发布的Qwen3 开源模型在思考模式下不支持非流式输出方式。
Qwen3 开源模型开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

思考模式 | 非思考模式 | 使用方法

国际(新加坡)

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-next-80b-a3b-thinking

仅支持思考模式

131,072

126,976

81,920

32,768

$0.15

$1.2

各100万 Token

有效期:百炼开通后90天内

qwen3-next-80b-a3b-instruct

不支持思考模式

129,024

-

qwen3-235b-a22b-thinking-2507

仅支持思考模式

126,976

81,920

$0.23

$2.3

qwen3-235b-a22b-instruct-2507

不支持思考模式

129,024

-

$0.92

qwen3-30b-a3b-thinking-2507

仅支持思考模式

126,976

81,920

$0.2

$2.4

qwen3-30b-a3b-instruct-2507

不支持思考模式

129,024

-

$0.8

qwen3-235b-a22b

本模型与以下模型均于2025 年 4月发布

非思考

129,024

-

16,384

$0.7

$2.8

思考

98,304

38,912

$8.4

qwen3-32b

非思考

129,024

-

$0.16

$0.64

思考

98,304

38,912

qwen3-30b-a3b

非思考

129,024

-

$0.2

$0.8

思考

98,304

38,912

$2.4

qwen3-14b

非思考

129,024

-

8,192

$0.35

$1.4

思考

98,304

38,912

$4.2

qwen3-8b

非思考

129,024

-

$0.18

$0.7

思考

98,304

38,912

$2.1

qwen3-4b

非思考

129,024

-

$0.11

$0.42

思考

98,304

38,912

$1.26

qwen3-1.7b

非思考

32,768

30,720

-

$0.42

思考

28,672

与输入相加不超过30,720

$1.26

qwen3-0.6b

非思考

30,720

-

$0.42

思考

28,672

与输入相加不超过30,720

$1.26

中国大陆(北京)

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-next-80b-a3b-thinking

仅思考模式

131,072

126,976

81,920

32,768

$0.144

$1.434

qwen3-next-80b-a3b-instruct

仅非思考模式

129,024

-

$0.574

qwen3-235b-a22b-thinking-2507

仅思考模式

126,976

81,920

$0.287

$2.868

qwen3-235b-a22b-instruct-2507

仅非思考模式

129,024

-

$1.147

qwen3-30b-a3b-thinking-2507

仅思考模式

126,976

81,920

$0.108

$1.076

qwen3-30b-a3b-instruct-2507

仅非思考模式

129,024

-

$0.431

qwen3-235b-a22b

非思考

129,024

-

16,384

$0.287

$1.147

思考

98,304

38,912

$2.868

qwen3-32b

非思考

129,024

-

$0.287

$1.147

思考

98,304

38,912

$2.868

qwen3-30b-a3b

非思考

129,024

-

$0.108

$0.431

思考

98,304

38,912

$1.076

qwen3-14b

非思考

129,024

-

8,192

$0.144

$0.574

思考

98,304

38,912

$1.434

qwen3-8b

非思考

129,024

-

$0.072

$0.287

思考

98,304

38,912

$0.717

qwen3-4b

非思考

129,024

-

$0.044

$0.173

思考

98,304

38,912

$0.431

qwen3-1.7b

非思考

32,768

30,720

-

$0.173

思考

28,672

与输入相加不超过30,720

$0.431

qwen3-0.6b

非思考

30,720

-

$0.173

思考

28,672

与输入相加不超过30,720

$0.431

QwQ-开源版

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法API 参考

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwq-32b

131,072

98,304

32,768

8,192

$0.287

$0.861

QwQ-Preview

qwq-32b-preview 模型是由 Qwen 团队于2024年开发的实验性研究模型,专注于增强 AI 推理能力,尤其是数学和编程领域。qwq-32b-preview 模型的局限性请参见QwQ官方博客使用方法 | API参考在线体验

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwq-32b-preview

32,768

30,720

16,384

$0.287

$0.861

Qwen2.5

Qwen2.5是Qwen大型语言模型系列。针对Qwen2.5,我们发布了一系列基础语言模型和指令调优语言模型,参数规模从70亿到720亿不等。Qwen2.5在Qwen2基础上进行了以下改进:

  • 在我们最新的大规模数据集上进行预训练,包含多达18万亿个Token。

  • 由于我们在这些领域的专业专家模型,模型的知识显著增多,编码和数学能力也大幅提高。

  • 在遵循指令、生成长文本(超过8K个标记)、理解结构化数据(例如表格)和生成结构化输出(尤其是JSON)方面有显著改进。对系统提示的多样性更具弹性,增强了聊天机器人的角色扮演实现和条件设置。

  • 支持超过29种语言,包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

使用方法API参考在线体验

国际(新加坡)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每百万Token)

qwen2.5-14b-instruct-1m

1,008,192

1,000,000

8,192

$0.805

$3.22

各100万 Token

有效期:百炼开通后90天内

qwen2.5-7b-instruct-1m

$0.368

$1.47

qwen2.5-72b-instruct

131,072

129,024

$1.4

$5.6

qwen2.5-32b-instruct

$0.7

$2.8

qwen2.5-14b-instruct

$0.35

$1.4

qwen2.5-7b-instruct

$0.175

$0.7

中国大陆(北京)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen2.5-14b-instruct-1m

1,000,000

1,000,000

8,192

$0.144

$0.431

qwen2.5-7b-instruct-1m

$0.072

$0.144

qwen2.5-72b-instruct

131,072

129,024

$0.574

$1.721

qwen2.5-32b-instruct

$0.287

$0.861

qwen2.5-14b-instruct

$0.144

$0.431

qwen2.5-7b-instruct

$0.072

$0.144

qwen2.5-3b-instruct

32,768

30,720

$0.044

$0.130

qwen2.5-1.5b-instruct

限时免费

qwen2.5-0.5b-instruct

QVQ

qvq-72b-preview模型是由 Qwen 团队开发的实验性研究模型,专注于提升视觉推理能力,尤其在数学推理领域。qvq-72b-preview模型的局限性请参见QVQ官方博客使用方法 | API参考

如果希望模型先输出思考过程再输出回答内容,请使用商业版模型QVQ。
说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qvq-72b-preview

32,768

16,384

单图最大16384

16,384

$1.721

$5.161

Qwen-Omni

基于Qwen2.5训练的全新多模态理解生成大模型,支持文本、图像、语音、视频输入理解,具备文本和语音同时流式生成的能力,多模态内容理解速度显著提升。使用方法API 参考

国际(新加坡)

模型名称

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen2.5-omni-7b

32,768

30,720

2,048

100万Token(不区分模态)

有效期:百炼开通后90天内

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.10

输入:音频

$6.76

输入:图片/视频

$0.28

输出计费项

单价(每百万 Token)

输出:文本

$0.40(输入仅包含文本时)

$0.84(输入包含图片/音频/视频时)

输出:文本+音频

$13.51(音频)

输出的文本不计费。

中国大陆(北京)

模型名称

上下文长度

最大输入

最大输出

(Token数)

qwen2.5-omni-7b

32,768

30,720

2,048

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.087

输入:音频

$5.448

输入:图片/视频

$0.287

输出计费项

单价(每百万 Token)

输出:文本

$0.345(输入仅包含文本时)

$0.861(输入包含图片/音频/视频时)

输出:文本+音频

$10.895(音频)

输出的文本不计费。

Qwen3-Omni-Captioner

Qwen3-Omni-Captioner以通义千问3-Omni为基座的开源模型,无需任何提示,自动为复杂语音、环境声、音乐、影视声效等生成精准、全面的描述,能识别说话人情绪、音乐元素(如风格、乐器)、敏感信息等,适用于音频内容分析、安全审核、意图识别、音频剪辑等多个领域。使用方法API 参考

国际(新加坡)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-omni-30b-a3b-captioner

65,536

32,768

32,768

$3.81

$3.06

100万Token

有效期:阿里云百炼开通后90天内

中国大陆(北京)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-omni-30b-a3b-captioner

65,536

32,768

32,768

$2.265

$1.821

无免费额度

Qwen-VL

阿里云的通义千问VL开源版。使用方法 | API参考

相较于Qwen2.5-VL,Qwen3-VL模型能力有极大提升:

  • 智能体交互:可操作电脑或手机界面,识别 GUI 元素、理解功能、调用工具执行任务,在 OS World 等评测中达到顶尖水平。

  • 视觉编码:可通过图像或视频生成代码,用于将设计图、网站截图等生成HTML、CSS、JS 代码。

  • 空间感知:支持二维和三维定位,精准判断物体方位、视角变化、遮挡关系。

  • 长视频理解:支持长达20分钟的视频内容理解,并能精确定位到秒级时刻。

  • 深度思考:具有深度思考能力, 擅长捕捉细节、分析因果,在 MathVista、MMMU 等评测中达到顶尖水平。

  • 文字识别:支持语言扩展至 33种,在复杂光线、模糊、倾斜等场景下表现更稳定;显著提升生僻字、古籍字、专业术语的识别准确率。

    支持的语言

    支持的语言共33种,分别为中文、日语、韩语、印尼语、越南语、泰语、英语、法语、德语、俄语、葡萄牙语、西班牙语、意大利语、瑞典语、丹麦语、捷克语、挪威语、荷兰语、芬兰语、土耳其语、波兰语、斯瓦希里语、罗马尼亚语、塞尔维亚语、希腊语、哈萨克语、乌兹别克语、宿务语、阿拉伯语、乌尔都语、波斯语、印地语 / 天城语、希伯来语。

国际(新加坡)

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

思维链+输出

免费额度

(注)

(Token数)

(每百万Token)

qwen3-vl-235b-a22b-thinking

仅思考模式

126,976

81,920

$0.4

$4

各100万 Token

有效期:百炼开通后90天内

qwen3-vl-235b-a22b-instruct

仅非思考模式

129,024

-

$1.6

qwen3-vl-32b-thinking

仅思考模式

131,072

126,976

81,920

32,768

$0.16

$0.64

qwen3-vl-32b-instruct

仅非思考模式

129,024

-

qwen3-vl-30b-a3b-thinking

仅思考模式

126,976

81,920

$0.2

$2.4

qwen3-vl-30b-a3b-instruct

仅非思考模式

129,024

-

$0.8

qwen3-vl-8b-thinking

仅思考模式

126,976

81,920

$0.18

$2.1

qwen3-vl-8b-instruct

仅非思考模式

129,024

-

$0.7

更多模型

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

单图最大16384

8,192

$2.8

$8.4

各100万 Token

有效期:百炼开通后90天内

qwen2.5-vl-32b-instruct

$1.4

$4.2

qwen2.5-vl-7b-instruct

$0.35

$1.05

qwen2.5-vl-3b-instruct

$0.21

$0.63

中国大陆(北京)

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

思维链+输出

免费额度

(注)

(Token数)

(每百万Token)

qwen3-vl-235b-a22b-thinking

仅思考模式

131,072

126,976

81,920

$0.286705

$2.867051

无免费额度

qwen3-vl-235b-a22b-instruct

仅非思考模式

129,024

-

$1.146820

qwen3-vl-32b-thinking

仅思考模式

131,072

126,976

81,920

32,768

$0.287

$2.868

qwen3-vl-32b-instruct

仅非思考模式

129,024

-

$1.147

qwen3-vl-30b-a3b-thinking

仅思考模式

126,976

81,920

$0.108

$1.076

qwen3-vl-30b-a3b-instruct

仅非思考模式

129,024

-

$0.431

qwen3-vl-8b-thinking

仅思考模式

126,976

81,920

$0.072

$0.717

qwen3-vl-8b-instruct

仅非思考模式

129,024

-

$0.287

更多模型

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

单图最大16384

8,192

$2.294

$6.881

无免费额度

qwen2.5-vl-32b-instruct

$1.147

$3.441

qwen2.5-vl-7b-instruct

$0.287

$0.717

qwen2.5-vl-3b-instruct

$0.173

$0.517

qwen2-vl-72b-instruct

32,768

30,720

单图最大16384

2,048

$2.294

$6.881

Qwen-Math

基于Qwen模型构建的专门用于数学解题的语言模型。Qwen2.5-Math支持中文英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API参考 | 在线体验

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen2.5-math-72b-instruct

4,096

3,072

3,072

$0.574

$1.721

qwen2.5-math-7b-instruct

$0.144

$0.287

qwen2.5-math-1.5b-instruct

限时免费

Qwen-Coder

通义千问代码模型开源版。最新的 Qwen3-Coder系列具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程、代码能力卓越的同时兼具通用能力。使用方法 | API参考

国际(新加坡)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

qwen3-coder-480b-a35b-instruct

262,144

204,800

65,536

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

qwen3-coder-30b-a3b-instruct

qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数,采取阶梯计费。

模型名称

单次请求的输入 Token 数

输入成本(每百万Token)

输出成本(每百万Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$1.5

$7.5

32K<Token≤128K

$2.7

$13.5

128K<Token≤200K

$4.5

$22.5

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.45

$2.25

32K<Token≤128K

$0.75

$3.75

128K<Token≤200K

$1.2

$6

中国大陆(北京)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-coder-480b-a35b-instruct

262,144

204,800

65,536

阶梯计价,请参见表格下方说明。

qwen3-coder-30b-a3b-instruct

qwen2.5-coder-32b-instruct

131,072

129,024

8,192

$0.287

$0.861

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

$0.144

$0.287

qwen2.5-coder-3b-instruct

32,768

30,720

限时免费体验

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数,采取阶梯计费。

模型名称

单次请求的输入 Token 数

输入成本(每百万Token)

输出成本(每百万Token)

qwen3-coder-480b-a35b-instruct

0<Token≤32K

$0.861

$3.441

32K<Token≤128K

$1.291

$5.161

128K<Token≤200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0<Token≤32K

$0.216

$0.861

32K<Token≤128K

$0.323

$1.291

128K<Token≤200K

$0.538

$2.151

文本生成-第三方模型

DeepSeek

DeepSeek 是由深度求索公司推出的大语言模型。API参考在线体验

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

deepseek-v3.2

685B 满血版

131,072

98,304

32,768

65,536

$0.287

$0.431

deepseek-v3.2-exp

685B 满血版

deepseek-v3.1

685B 满血版

$0.574

$1.721

deepseek-r1

685B 满血版

16,384

$2.294

deepseek-r1-0528

685B 满血版

deepseek-v3

671B 满血版

131,072

不涉及

$0.287

$1.147

deepseek-r1-distill-qwen-1.5b

基于 Qwen2.5-Math-1.5B

32,768

32,768

16,384

16,384

限时免费体验

deepseek-r1-distill-qwen-7b

基于 Qwen2.5-Math-7B

$0.072

$0.144

deepseek-r1-distill-qwen-14b

基于 Qwen2.5-14B

$0.144

$0.431

deepseek-r1-distill-qwen-32b

基于 Qwen2.5-32B

$0.287

$0.861

deepseek-r1-distill-llama-8b

基于 Llama-3.1-8B

限时免费体验

deepseek-r1-distill-llama-70b

基于 Llama-3.3-70B

Kimi

Kimi-K2 是由月之暗面公司推出的大语言模型,具有卓越的编码和工具调用能力。使用方法在线体验

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

kimi-k2-thinking

262,144

229,376

32,768

16,384

$0.574

$2.294

Moonshot-Kimi-K2-Instruct

131,072

131,072

-

8,192

$0.574

$2.294

图像生成

通义千问文生图

通义千问文生图模型在复杂文本渲染方面表现突出,特别是中英文文本渲染。当前qwen-image-plus与qwen-image能力相同,但qwen-image-plus价格更优惠。API参考

国际(新加坡)

模型名称

单价

免费额度

qwen-image-plus

$0.03/张

免费额度:各100张

有效期:阿里云百炼开通后90天内

qwen-image

$0.035/张

中国大陆(北京)

模型名称

单价

免费额度

qwen-image-plus

$0.028671/张

无免费额度

qwen-image

$0.035/张

输入提示词

输出图像

Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere.

image

通义千问图像编辑

通义千问图像编辑模型支持精准的中英双语文字编辑、调色、细节增强、风格迁移、增删物体、改变位置和动作等操作,可实现复杂的图文编辑。API参考

国际(新加坡)

模型名称

计费单价

免费额度

qwen-image-edit-plus

当前与qwen-image-edit-plus-2025-10-30能力相同

$0.03/张

免费额度:各100张

有效期:阿里云百炼开通后90天内

qwen-image-edit-plus-2025-10-30

$0.03/张

qwen-image-edit

$0.045/张

中国大陆(北京)

模型名称

计费单价

免费额度

qwen-image-edit-plus

当前与qwen-image-edit-plus-2025-10-30能力相同

$0.028671/张

无免费额度

qwen-image-edit-plus-2025-10-30

$0.028671/张

qwen-image-edit

$0.043/张

dog_and_girl (1)

原图

狗修改图

将图中的人物改为站立姿势,弯腰握住狗的前爪

image

原图

image

将字母块上的单词'HEALTH INSURANCE’ 替换为'明天会更好'

5

原图

5out

用浅蓝色衬衫替换圆点衬衫

6

原图

6out

将图中背景改为南极

7

原图

7out

生成人物的卡通头像

image

原图

image

删除餐盘上的头发

通义千问图像翻译

通义千问图像翻译模型支持将11种语言图片的文字翻译成中文或英文,能精准保留原始排版与内容信息,并提供术语定义、敏感词过滤、图像主体检测等自定义功能。API参考

说明

仅支持中国大陆(北京)地域。

模型名称

单价

免费额度

qwen-mt-image

$0.000431/张

无免费额度

en

原图

ja

日语

es

葡语

ar

阿拉伯语

通义万相文生图

通义万相-文生图模型通过文本即可生成精美的图片。API参考在线体验

国际(新加坡)

模型名称

说明

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2i 推荐

万相2.6。支持新增的同步接口,同时支持在总像素面积与宽高比约束内,自由选尺寸。

$0.03/张

50张

wan2.5-t2i-preview 推荐

万相2.5 preview。取消单边限制,在总像素面积与宽高比约束内,自由选尺寸。

$0.03/张

50张

wan2.2-t2i-plus

万相2.2专业版。在创意性、稳定性、写实质感上全面升级。

$0.05/张

100张

wan2.2-t2i-flash

万相2.2极速版。在创意性、稳定性、写实质感上全面升级。

$0.025/张

100张

wan2.1-t2i-plus

万相2.1专业版。支持多种风格,生成图像细节丰富。

$0.05/张

200张

wan2.1-t2i-turbo

万相2.1极速版。支持多种风格,生成速度快。

$0.025/张

200张

中国大陆(北京)

模型名称

说明

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-t2i 推荐

万相2.6。支持新增的同步接口,同时支持在总像素面积与宽高比约束内,自由选尺寸。

$0.028671/张

无免费额度

wan2.5-t2i-preview 推荐

万相2.5 preview。取消单边限制,在总像素面积与宽高比约束内,自由选尺寸。

$0.028671/张

无免费额度

wan2.2-t2i-plus

万相2.2专业版。在创意性、稳定性、写实质感上全面升级。

$0.02007/张

无免费额度

wan2.2-t2i-flash

万相2.2极速版。在创意性、稳定性、写实质感上全面升级。

$0.028671/张

无免费额度

wanx2.1-t2i-plus

万相2.1专业版。支持多种风格,生成图像细节丰富。

$0.028671/张

无免费额度

wanx2.1-t2i-turbo

万相2.1极速版。支持多种风格,生成速度快。

$0.020070/张

无免费额度

wanx2.0-t2i-turbo

万相2.0极速版。擅长质感人像与创意设计,性价比高。

$0.005735/张

无免费额度

输入提示词

输出图像

一个用针毡制作的圣诞老人手持礼物旁边站着一只白色的猫咪,背景中有许多五颜六色的礼物。整个场景应该是可爱、温暖和舒适的,并且背景中还有一些绿色植物。

image

通义万相图像生成与编辑2.6

通义万相图像生成模型支持图像编辑、图文混合输出,满足多样化生成与集成需求。API参考

国际(新加坡)

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-image

$0.03/张

50张

中国大陆(北京)

模型名称

单价

免费额度

wan2.6-image

$0.028671/张

无免费额度

通义万相通用图像编辑2.5

通义万相-通用图像编辑2.5模型支持输入文本、单图或多图实现基于主体一致性的图像编辑、多图融合创作等能力。API参考

国际(新加坡)

模型名称

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.5-i2i-preview

$0.03/张

50张

中国大陆(北京)

模型名称

单价

免费额度

wan2.5-i2i-preview

$0.028671/张

无免费额度

模型功能

输入示例

输出图像

单图编辑

damotest2023_Portrait_photography_outdoors_fashionable_beauty_409ae3c1-19e8-4515-8e50-b3c9072e1282_2-转换自-png

a26b226d-f044-4e95-a41c-d1c0d301c30b-转换自-png

将花卉连衣裙换成一件复古风格的蕾丝长裙,领口和袖口有精致的刺绣细节。

多图融合

image

p1028883

将图1中的闹钟放置到图2的餐桌的花瓶旁边位置

通义万相通用图像编辑2.1

通义万相-通用图像编辑模型通过简单的指令即可实现多样化的图像编辑,适用于扩图、去水印、风格迁移、图像修复、图像美化等场景。使用方法API参考

说明

仅支持中国大陆(北京)地域。

模型名称

计费单价

免费额度

wanx2.1-imageedit

$0.020070/张

无免费额度

目前通用图像编辑支持以下功能:

模型功能

输入图像

输入提示词

输出图像

全局风格化

image

转换成法国绘本风格

image

局部风格化

image

把房子变成木板风格。

image

指令编辑

image

把女孩的头发修改为红色。

image

局部重绘

输入图像

image

涂抹区域图像(白色为涂抹区域)

image

一只陶瓷兔子抱着一朵陶瓷花。

输出图像

image

去文字水印

image

去除图像中的文字。

image

扩图

20250319105917

一位绿色仙子。

image

图像超分

模糊图像

image

图像超分。

清晰图像

image

图像上色

image

蓝色背景,黄色的叶子。

image

线稿生图

image

北欧极简风格的客厅。

image

垫图

image

卡通形象小心翼翼地探出头,窥视着房间内一颗璀璨的蓝色宝石。

image

AI试衣

  • AI试衣-Plus版相较于基础版模型,在图片清晰度、服饰纹理细节和logo还原效果等方面均有提升,但生成耗时较长,适用于对时效性要求不高的场景。API参考 | 在线体验

  • AI试衣-图片分割支持对模特图、服饰图进行分割,可用于AI试衣图片的前后处理。API参考

说明

仅支持中国大陆(北京)地域。

模型名称

说明

示例输入

示例输出

aitryon-plus

AI试衣-Plus版

output26

output29

aitryon-parsing-v1

AI试衣-图片分割

AI试衣计费单价

模型服务

模型名称

计量单价

折扣

阶梯层级

AI试衣-Plus版

aitryon-plus

$0.071677/张

AI试衣-图片分割

aitryon-parsing-v1

$0.000574/张

视频生成-通义万相

文生视频

通义万相-文生视频模型通过一句话即可生成视频,视频呈现丰富的艺术风格及影视级画质。API参考在线体验

国际(新加坡)

模型名称

说明

单价

免费额度(领取)

有效期:阿里云百炼开通后90天内

wan2.6-t2v推荐

万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.5-t2v-preview推荐

万相2.5 preview。支持自动配音和传入自定义音频文件。

480P:$0.05/秒

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.2-t2v-plus

万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。

480P:$0.02/秒

1080P:$0.10/秒

50秒

wan2.1-t2v-turbo

万相2.1极速版。生成速度快,表现均衡。

$0.036/秒

200秒

wan2.1-t2v-plus

万相2.1专业版。生成细节丰富,画面更具质感。

$0.10/秒

200秒

中国大陆(北京)

模型名称

说明

单价

免费额度

wan2.6-t2v推荐

万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。

720P:$0.086012/秒

1080P:0.143353/秒

无免费额度

wan2.5-t2v-preview推荐

万相2.5 preview。支持自动配音和传入自定义音频文件。

480P:$0.043006/秒

720P:$0.086012/秒

1080P:$0.143353/秒

无免费额度

wan2.2-t2v-plus

万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。

480P:$0.02007/秒

1080P:$0.100347/秒

无免费额度

wanx2.1-t2v-turbo

生成速度更快,表现均衡。

$0.034405/秒

无免费额度

wanx2.1-t2v-plus

生成细节更丰富,画面更具质感。

$0.100347/秒

无免费额度

输入示例

输出视频(wan2.5)

输入提示词:Shot from a low angle, in a medium close-up, with warm tones, mixed lighting (the practical light from the desk lamp blends with the overcast light from the window), side lighting, and a central composition. In a classic detective office, wooden bookshelves are filled with old case files and ashtrays. A green desk lamp illuminates a case file spread out in the center of the desk. A fox, wearing a dark brown trench coat and a light gray fedora, sits in a leather chair, its fur crimson, its tail resting lightly on the edge, its fingers slowly turning yellowed pages. Outside, a steady drizzle falls beneath a blue sky, streaking the glass with meandering streaks. It slowly raises its head, its ears twitching slightly, its amber eyes gazing directly at the camera, its mouth clearly moving as it speaks in a smooth, cynical voice: 'The case was cold, colder than a fish in winter. But every chicken has its secrets, and I, for one, intended to find them '.

输入音频

图生视频-基于首帧

通义万相-图生视频模型将输入图片作为视频首帧,再根据提示词生成视频。视频呈现丰富的艺术风格及影视级画质。API参考在线体验

国际(新加坡)

模型名称

说明

单价

免费额度(注)

有效期:阿里云百炼开通后90天内

wan2.6-i2v推荐

万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.5-i2v-preview推荐

万相2.5 preview。支持自动配音和传入自定义音频文件。

480P:$0.05/秒

720P:$0.10/秒

1080P:$0.15/秒

50秒

wan2.2-i2v-flash

万相2.2极速版。极致生成速度,在画面细节表现、运动稳定性方面均有显著提升。

480P:$0.015/秒

720P:$0.036/秒

50秒

wan2.2-i2v-plus

万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。

480P:$0.02/秒

1080P:$0.10/秒

50秒

wan2.1-i2v-turbo

万相2.1极速版。生成速度快,表现均衡。

$0.036/秒

200秒

wan2.1-i2v-plus

万相2.1专业版。生成细节丰富,画面更具质感。

$0.10/秒

200秒

中国大陆(北京)

模型名称

说明

单价

免费额度

wan2.6-i2v推荐

万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。

720P:$0.086012/秒

1080P:$0.143353/秒

无免费额度

wan2.5-i2v-preview推荐

万相2.5 preview。支持自动配音和传入自定义音频文件。

480P:$0.043006/秒

720P:$0.086012/秒

1080P:$0.143353/秒

无免费额度

wan2.2-i2v-plus 推荐

万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。

480P:$0.02007/秒

1080P:$0.100347/秒

无免费额度

wanx2.1-i2v-turbo

万相2.1极速版。生成速度快,表现均衡。

$0.034405/秒

无免费额度

wanx2.1-i2v-plus

万相2.1专业版。生成细节丰富,画面更具质感。

$0.100347/秒

无免费额度

输入首帧图像和音频

输出视频(wan2.6)

rap-转换自-png

输入音频

输入提示词:一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。

图生视频-基于首尾帧

通义万相-首尾帧生视频模型,只需要提供首帧和尾帧图片,便能根据提示词生成一段丝滑流畅的动态视频。视频呈现丰富的艺术风格及影视级画质。API参考在线体验

国际(新加坡)

模型名称

单价

免费额度(注)

wan2.1-kf2v-plus

$0.10/秒

200秒

有效期:百炼开通后90天内

中国大陆(北京)

模型名称

单价

免费额度(注)

wanx2.1-kf2v-plus

$0.100347/秒

无免费额度

输入示例

输出视频

首帧图片

尾帧图片

提示词

first_frame

last_frame

写实风格,一只黑色小猫好奇地看向天空,镜头从平视逐渐上升,最后俯拍小猫好奇的眼神。

参考生视频

通义万相-参考生视频模型支持参考输入视频中的角色形象和音色,搭配提示词生成保持角色一致性的视频。API参考

计费规则:输入视频和输出视频均计费,按视频秒数计费,失败不计费也不占用免费额度。

  • 输入视频的计费时长不超过 5 秒,具体规则参见计费与限流

  • 输出视频的计费时长为成功生成的视频秒数

国际(新加坡)

模型名称

输入单价

输出单价

免费额度(注)

wan2.6-r2v

720P:$0.10/秒

1080P:$0.15/秒

720P:$0.10/秒

1080P:$0.15/秒

50秒

有效期:百炼开通后90天内

中国大陆(北京)

模型名称

输入单价

输出单价

免费额度(注)

wan2.6-r2v

720P:$0.086012/秒

1080P:$0.143353/秒

720P:$0.086012/秒

1080P:$0.143353/秒

无免费额度

通用视频编辑

通义万相-视频编辑统一模型支持多模态输入,包括文本、图像和视频,能够执行视频生成与通用编辑任务。API参考在线体验

国际(新加坡)

模型名称

单价

免费额度(注)

wan2.1-vace-plus

$0.1/秒

50秒

有效期:百炼开通后90天内

中国大陆(北京)

模型名称

单价

免费额度(注)

wanx2.1-vace-plus

$0.100347/秒

无免费额度

视频编辑统一模型支持以下功能:

模型功能

输入参考图

输入提示词

输出视频

多图参考

参考图1(参考主体)

image

参考图2(参考背景)

image

视频中,一位女孩自晨雾缭绕的古老森林深处款款走出,她步伐轻盈,镜头捕捉她每一个灵动瞬间。当她站定,环顾四周葱郁林木时,她脸上绽放出惊喜与喜悦交织的笑容。这一幕,定格在了光影交错的瞬间,记录下她与大自然的美妙邂逅。

输出视频

视频重绘

视频展示了一辆黑色的蒸汽朋克风格汽车,绅士驾驶着,车辆装饰着齿轮和铜管。背景是蒸汽驱动的糖果工厂和复古元素,画面复古与趣味

局部编辑

输入视频

输入掩码图像(白色区域表示编辑区域)

mask

视频展示了一家巴黎风情的法式咖啡馆,一只穿着西装的狮子优雅地品着咖啡。它一手端着咖啡杯,轻轻啜饮,神情惬意。咖啡馆装饰雅致,柔和的色调与温暖灯光映照着狮子所在的区域。

根据提示词修改编辑区域的内容

视频延展

输入首片段视频(1秒)

一只戴着墨镜的狗在街道上滑滑板,3D卡通。

输出延长后的视频(5秒)

视频画面扩展

一位优雅的女士正在激情演奏小提琴,她身后是一支完整的交响乐团

通义万相-数字人

基于单张人物图片和音频,生成动作自然的说话、唱歌或表演视频。使用时需依次调用下述模型。wan2.2-s2v 图像检测 | wan2.2-s2v 视频生成

说明

仅支持中国大陆(北京)地域。

模型名称

模型简介

单价

wan2.2-s2v-detect

检查输入图像是否满足要求(如清晰度、单人、正面)。

$0.000574/张

wan2.2-s2v

根据检测通过的图片和一段音频,生成人物动态视频。

480P:$0.071677/秒

720P:$0.129018/秒

输入示例

输出视频

p1001125-转换自-jpeg

输入音频:

通义万相-图生动作

提供标准和专业两种服务模式,基于人物图片和参考视频,将视频角色的动作、表情迁移到图片角色中,生成人物动作视频,赋予图片角色动态表现力。API参考

国际(新加坡)

模型名称

模型服务

服务简介

计费单价

免费额度(查看)

wan2.2-animate-move

标准模式wan-std

生成速度快,满足基础动画演示等轻需求,性价比高。

$0.12/秒

两种模式共50秒

专业模式wan-pro

动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。

$0.18/秒

中国大陆(北京)

模型名称

模型服务

服务简介

计费单价

免费额度(查看)

wan2.2-animate-move

标准模式wan-std

生成速度快,满足基础动画演示等轻需求,性价比高。

$0.06/秒

无免费额度

专业模式wan-pro

动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。

$0.09/秒

人物图片

参考视频

输出视频(标准模式)

输出视频(专业模式)

move_input_image

通义万相-视频换人

提供标准和专业两种服务模式,基于人物图片和参考视频,将视频中的主角替换为图片中的角色,同时保留原视频的场景、光照和色调。API 参考

国际(新加坡)

模型名称

模型服务

服务简介

计费单价

免费额度(查看)

wan2.2-animate-mix

标准模式wan-std

生成速度快,满足基础动画演示等轻需求,性价比高。

$0.18/秒

两种服务共50秒

专业模式wan-pro

动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。

$0.26/秒

中国大陆(北京)

模型名称

模型服务

服务简介

计费单价

免费额度(查看)

wan2.2-animate-mix

标准模式wan-std

生成速度快,满足基础动画演示等轻需求,性价比高。

$0.09/秒

无免费额度

专业模式wan-pro

动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。

$0.13/秒

人物图片

参考视频

输出视频(标准模式)

输出视频(专业模式)

mix_input_image

舞动人像AnimateAnyone

基于人物图片和人物动作模板,生成人物动作视频。直接使用时需依次调用下述三个模型。AnimateAnyone图像检测 API详情 | AnimateAnyone 动作模板生成AnimateAnyone视频生成API详情

说明

仅支持中国大陆(北京)地域。

模型名称

说明

单价

animate-anyone-detect-gen2

检测输入的图片是否符合要求

$0.000574/张

animate-anyone-template-gen2

从人物运动视频中提取人物动作并生成动作模板

$0.011469/秒

animate-anyone-gen2

基于人物图片和动作模板生成人物动作视频

输入:人物图片

输入:动作视频

输出(按图片背景生成)

输出(按视频背景生成)

04-9_16

说明
  • 以上示例,由集成了“舞动人像AnimateAnyone”的通义APP生成。

  • 舞动人像AnimateAnyone模型的生成内容为视频画面,不包含音频

悦动人像EMO

基于人物肖像图片和人声音频文件,生成人物肖像动态视频。使用时需依次调用下述模型。EMO 图像检测 | EMO 视频生成

说明

仅支持中国大陆(北京)地域。

模型名称

说明

单价

emo-detect-v1

检测输入的图片是否符合要求,不需要部署,可直接调用

$0.000574/张

emo-v1

生成人物肖像动态视频,不需要部署,可直接调用

  • 生成1:1画幅视频:$0.011469/秒

  • 生成3:4画幅视频:$0.022937/秒

输入物:人物肖像图片+人声音频文件

输出物:人物肖像动态视频

人物肖像:

上春山

人声音频:参见右侧视频

人物视频:

使用动作风格强度:活泼("style_level": "active")

灵动人像LivePortrait

基于人物肖像图片和人声音频文件,快速、轻量地生成人物肖像动态视频。与悦动人像EMO模型相比,生成速度快、价格低,但是生成效果不如悦动人像EMO模型。使用时需依次调用下述两个模型。LivePortrait 图像检测 | LivePortrait 视频生成

说明

仅支持中国大陆(北京)地域。

模型名称

说明

单价

liveportrait-detect

检测输入的图片是否符合要求

$0.000574/张

liveportrait

生成人物肖像动态视频

$0.002868/秒

输入物:人物肖像图片+人声音频文件

输出物:人物肖像动态视频

人物肖像:

Emoji男孩

人声音频:参见右侧视频

人物视频:

表情包Emoji

基于人脸图片和预设的人脸动态模板,生成人脸动态视频。该能力可用于表情包制作、视频素材生成等场景。使用时需依次调用下述模型。Emoji 图像检测Emoji 视频生成

说明

仅支持中国大陆(北京)地域。

模型名称

说明

单价

emoji-detect-v1

检测输入图片是否符合要求

$0.000574/张

emoji-v1

基于人物肖像图片和指定的表情包模板生成人物同款表情

$0.011469/秒

输入:人物肖像图片

输出:人物肖像动态视频

image.png

“开心”表情的模板序列:("input.driven_id": "mengwa_kaixin")

声动人像VideoRetalk

基于人物视频和人声音频,生成人物讲话口型与输入音频相匹配的视频。使用时需调用下述模型。API参考

说明

仅支持中国大陆(北京)地域。

模型名称

说明

单价

videoretalk

生成人物讲话口型与输入音频相匹配的新视频

$0.011469/秒

视频风格重绘

支持根据用户输入的文字内容,生成符合语义描述的不同风格的视频,或者根据用户输入的视频,进行视频风格重绘。API参考

说明

仅支持中国大陆(北京)地域。

模型名称

说明

单价

video-style-transform

将输入视频转换为日式漫画、美式漫画等风格

720P

$0.071677/秒

540P

$0.028671/秒

输入视频

输出视频(日式漫画)

语音合成(文本转语音)

通义千问语音合成

支持输入多语种混合文本,并流式输出音频。使用方法API 参考

国际(新加坡)

模型名称

版本

单价

最大输入字符数

支持的语种

免费额度(注)

qwen3-tts-flash

当前能力等同 qwen3-tts-flash-2025-09-18

稳定版

$0.1/万字符

600

中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-11-27

快照版

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-2025-09-18

快照版

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

中国大陆(北京)

通义千问3-TTS-Flash

模型名称

版本

单价

最大输入字符数

支持的语种

qwen3-tts-flash

当前能力等同 qwen3-tts-flash-2025-09-18

稳定版

$0.114682/万字符

600

中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

qwen3-tts-flash-2025-11-27

快照版

qwen3-tts-flash-2025-09-18

快照版

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问-TTS

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每千Token)

qwen-tts

当前与 qwen-tts-2025-04-10 能力相同

稳定版

8,192

512

7,680

$0.230

$1.434

qwen-tts-latest

始终与最新快照版能力相同

最新版

qwen-tts-2025-05-22

快照版

qwen-tts-2025-04-10

音频转换为 Token 的规则:每1秒的音频对应 50个 Token 。若音频时长不足1秒,则按 50个 Token 计算。

通义千问实时语音合成

支持文本的流式输入并流式输出音频,具有根据文本内容与标点符号自适应调节语音语速的能力。使用方法 | API参考

通义千问3-TTS-VD-Realtime支持使用声音设计音色进行实时语音合成,但不支持使用默认音色。

通义千问3-TTS-VC-Realtime支持使用声音复刻音色进行实时语音合成,但不支持使用默认音色。

通义千问3-TTS-Flash-Realtime和通义千问-TTS-Realtime仅可使用默认音色,但不支持使用声音复刻/设计音色。

国际(新加坡)

通义千问3-TTS-VD-Realtime

模型名称

版本

单价

支持的语种

免费额度(注)

qwen3-tts-vd-realtime-2025-12-16

快照版

$0.143353/万字符

中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

1万字符

有效期:阿里云百炼开通后90天内

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-VC-Realtime

模型名称

版本

单价

支持的语种

免费额度(注)

qwen3-tts-vc-realtime-2025-11-27

快照版

$0.13/万字符

中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

1万字符

有效期:阿里云百炼开通后90天内

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-Flash-Realtime

模型名称

版本

单价

支持的语种

免费额度(注)

qwen3-tts-flash-realtime

当前能力等同 qwen3-tts-flash-realtime-2025-09-18

稳定版

$0.13/万字符

中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-11-27

快照版

1万字符

有效期:阿里云百炼开通后90天内

qwen3-tts-flash-realtime-2025-09-18

快照版

2025年11月13日0点前开通阿里云百炼:2000字符

2025年11月13日0点后开通阿里云百炼:1万字符

有效期:阿里云百炼开通后90天内

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

中国大陆(北京)

通义千问3-TTS-VD-Realtime

模型名称

版本

单价

支持的语种

qwen3-tts-vd-realtime-2025-12-16

快照版

$0.143353/万字符

中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-VC-Realtime

模型名称

版本

单价

支持的语种

qwen3-tts-vc-realtime-2025-11-27

快照版

$0.143353/万字符

中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-Flash-Realtime

模型名称

版本

单价

支持的语种

qwen3-tts-flash-realtime

当前能力等同 qwen3-tts-flash-realtime-2025-09-18

稳定版

$0.143353/万字符

中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

qwen3-tts-flash-realtime-2025-11-27

快照版

qwen3-tts-flash-realtime-2025-09-18

快照版

按输入的字符数计费,计算规则如下:

  • 一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符

  • 其他,如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问-TTS-Realtime

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

支持的语种

(Token数)

(每千Token)

qwen-tts-realtime

当前能力等同 qwen-tts-realtime-2025-07-15

稳定版

8,192

512

7,680

$0.345

$1.721

中文、英文

qwen-tts-realtime-latest

当前能力等同 qwen-tts-realtime-2025-07-15

最新版

中文、英文

qwen-tts-realtime-2025-07-15

快照版

中文、英文

音频转换为 Token 的规则:每1秒的音频对应 50个 Token 。若音频时长不足1秒,则按 50个 Token 计算。

通义千问声音复刻

声音复刻依托大模型进行特征提取,无需训练即可复刻声音。仅需提供 10~20 秒的音频,即可生成高度相似且听感自然的定制音色。使用方法 | API参考

国际(新加坡)

模型名称

单价

免费额度(注)

qwen-voice-enrollment

$0.01/音色

1000个音色

有效期:阿里云百炼开通后90天内

中国大陆(北京)

模型名称

单价

qwen-voice-enrollment

$0.01/音色

通义千问声音设计

声音设计通过文本描述生成定制化音色,支持多语言和多维度音色特征定义,适用于广告配音、角色塑造、有声内容创作等多种应用。使用方法 | API参考

国际(新加坡)

模型名称

单价

免费额度(注)

qwen-voice-design

$0.2/音色

1000个音色

有效期:阿里云百炼开通后90天内

中国大陆(北京)

模型名称

单价

qwen-voice-design

$0.2/音色

CosyVoice语音合成

CosyVoice是通义实验室依托大规模预训练语言模型,深度融合文本理解和语音生成的新一代生成式语音合成大模型,支持文本至语音的实时流式合成。使用方法 | API参考

说明

仅支持中国大陆(北京)地域。

模型名称

单价

cosyvoice-v3-plus

$0.286706/万字符

cosyvoice-v3-flash

$0.14335/万字符

cosyvoice-v2

$0.286706/万字符

字符计算规则:汉字(包括简/繁体汉字、日文汉字和韩文汉字)按2个字符计算,其他所有字符(如字母、数字、日韩文假名/谚文等)均按 1个字符计算。SSML标签内容不计费。

语音识别(语音转文本)与翻译(语音转成指定语种的文本)

通义千问3-LiveTranslate-Flash

通义千问3-LiveTranslate-Flash-Realtime

qwen3-livetranslate-flash-realtime 是一款多语言音视频实时翻译模型,可识别 18 种语言,并实时翻译为 10 种语言的音频。

核心特性:

  • 多语言支持:支持 18 种语言及 6 种汉语方言。包括中文、英文、法语、德语、俄语、日语、韩语等。支持普通话、粤语、四川话等方言。

  • 视觉增强:利用视觉内容提升翻译准确性。模型通过分析口型、动作和画面中的文字,改善在嘈杂环境下或一词多义场景中的翻译效果。

  • 3秒延迟:实现低至 3 秒的同传延迟。

  • 无损同传:通过语义单元预测技术,解决跨语言语序问题。实时翻译质量接近离线翻译结果。

  • 音色自然:生成音色自然的拟人语音。模型能根据源语音内容,自适应调节语气和情感。

使用方法 | API参考

国际(新加坡)

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen3-livetranslate-flash-realtime

当前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22

稳定版

53,248

49,152

4,096

各100万Token

有效期:阿里云百炼开通后90天内

qwen3-livetranslate-flash-realtime-2025-09-22

快照版

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:音频

$10

输入:图片

$1.3

输出计费项

单价(每百万 Token)

文本

$10

音频

$38

Token计算规则:

  • 音频:输入或输出每秒音频均消耗 12.5 Token

  • 图片:每输入 28*28 像素消耗 0.5 Token

中国大陆(北京)

模型名称

版本

上下文长度

最大输入

最大输出

(Token数)

qwen3-livetranslate-flash-realtime

当前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22

稳定版

53,248

49,152

4,096

qwen3-livetranslate-flash-realtime-2025-09-22

快照版

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:音频

$9.175

输入:图片

$1.147

输出计费项

单价(每百万 Token)

文本

$9.175

音频

$34.405

Token计算规则:

  • 音频:输入或输出每秒音频均消耗 12.5 Token

  • 图片:每输入 28*28 像素消耗 0.5 Token

通义千问录音文件识别

基于通义千问多模态基座,支持多语言识别、歌唱识别、噪声拒识等功能。使用方法 | API参考

国际(新加坡)

通义千问3-ASR-Flash-Filetrans

模型名称

版本

支持的语言

支持的采样率

单价

免费额度(注)

qwen3-asr-flash-filetrans

当前等同qwen3-asr-flash-filetrans-2025-11-17

稳定版

中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语

任意

$0.000035/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-filetrans-2025-11-17

快照版

通义千问3-ASR-Flash

模型名称

版本

支持的语言

支持的采样率

单价

免费额度(注)

qwen3-asr-flash

当前等同qwen3-asr-flash-2025-09-08

稳定版

中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语

16kHz

$0.000035/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-2025-09-08

快照版

中国大陆(北京)

通义千问3-ASR-Flash-Filetrans

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash-filetrans

当前等同qwen3-asr-flash-filetrans-2025-11-17

稳定版

中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语

任意

$0.000032/秒

qwen3-asr-flash-filetrans-2025-11-17

快照版

通义千问3-ASR-Flash

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash

当前等同qwen3-asr-flash-2025-09-08

稳定版

中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语

16kHz

$0.000032/秒

qwen3-asr-flash-2025-09-08

快照版

通义千问实时语音识别

通义千问实时语音识别大模型具备自动语种识别功能,可识别 11 种语音类型,并能在复杂音频环境下较为准确地转录。使用方法 | API参考

国际(新加坡)

模型名称

版本

支持的语言

支持的采样率

单价

免费额度(注)

qwen3-asr-flash-realtime

当前等同qwen3-asr-flash-realtime-2025-10-27

稳定版

中文(普通话、四川话、闽南语、吴语)、粤语、英语、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语、捷克语、丹麦语、菲律宾语、芬兰语、冰岛语、马来语、挪威语、波兰语、瑞典语

8kHz、16kHz

$0.000090/秒

36,000秒(10小时)

有效期:阿里云百炼开通后90天内

qwen3-asr-flash-realtime-2025-10-27

快照版

中国大陆(北京)

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash-realtime

当前等同qwen3-asr-flash-realtime-2025-10-27

稳定版

中文(普通话、四川话、闽南语、吴语)、粤语、英语、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语、捷克语、丹麦语、菲律宾语、芬兰语、冰岛语、马来语、挪威语、波兰语、瑞典语

8kHz、16kHz

$0.000047/秒

qwen3-asr-flash-realtime-2025-10-27

快照版

Paraformer语音识别

Paraformer是通义实验室旗下的语音识别模型,提供录音文件识别和实时语音识别两个版本。

录音文件识别

使用方法 | API参考

说明

仅支持中国大陆(北京)地域。

模型名称

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

paraformer-v2

中文(普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话)、英文、日语、韩语、德语、法语、俄语

任意

视频直播

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

$0.000012/秒

paraformer-8k-v2

中文普通话

8kHz

电话语音

实时语音识别

使用方法 | API参考

说明

仅支持中国大陆(北京)地域。

模型名称

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

paraformer-realtime-v2

中文(普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话)、英文、日语、韩语、德语、法语、俄语

支持多个语种自由切换

任意

视频直播、会议等

pcm、wav、mp3、opus、speex、aac、amr

$0.000035/秒

paraformer-realtime-8k-v2

8kHz

电话客服等

Fun-ASR语音识别

Fun-ASR是通义百聆旗下语音识别模型,提供录音文件识别和实时语音识别两个版本。

录音文件识别

使用方法 | API参考

国际(新加坡)

模型名称

版本

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

免费额度(注)

fun-asr

当前等同fun-asr-2025-11-07

稳定版

中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语

任意

视频直播、电话语音、会议同传等

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

$0.000035/秒

36,000秒(10小时)

有效期90天

fun-asr-2025-11-07

相较fun-asr-2025-08-25做了远场VAD优化,识别更准

快照版

fun-asr-2025-08-25

中文(普通话)、英文

fun-asr-mtl

当前等同fun-asr-mtl-2025-08-25

稳定版

中文(普通话、粤语)、英文、日语、韩语、越南语、印尼语、泰语、马来语、菲律宾语、阿拉伯语、印地语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、爱尔兰语、拉脱维亚语、立陶宛语、马耳他语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语

fun-asr-mtl-2025-08-25

快照版

中国大陆(北京)

模型名称

版本

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

fun-asr

当前等同fun-asr-2025-11-07

稳定版

中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语

任意

视频直播、电话语音、会议同传等

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

$0.000032/秒

fun-asr-2025-11-07

相较fun-asr-2025-08-25做了远场VAD优化,识别更准

快照版

fun-asr-2025-08-25

中文(普通话)、英文

fun-asr-mtl

当前等同fun-asr-mtl-2025-08-25

稳定版

中文(普通话、粤语)、英文、日语、韩语、越南语、印尼语、泰语、马来语、菲律宾语、阿拉伯语、印地语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、爱尔兰语、拉脱维亚语、立陶宛语、马耳他语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语

fun-asr-mtl-2025-08-25

快照版

实时语音识别

使用方法 | API参考

国际(新加坡)

模型名称

版本

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

免费额度(注)

fun-asr-realtime

当前等同fun-asr-realtime-2025-11-07

稳定版

中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语

16kHz

视频直播、会议、电话客服等

pcm、wav、mp3、opus、speex、aac、amr

$0.00009/秒

36,000秒(10小时)

有效期90天

fun-asr-realtime-2025-11-07

快照版

中国大陆(北京)

模型名称

版本

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

fun-asr-realtime

当前等同fun-asr-realtime-2025-11-07

稳定版

中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语

16kHz

视频直播、会议、电话客服等

pcm、wav、mp3、opus、speex、aac、amr

$0.000047/秒

fun-asr-realtime-2025-11-07

相较fun-asr-realtime-2025-09-15做了远场VAD优化,识别更准

快照版

fun-asr-realtime-2025-09-15

中文(普通话)、英文

文本向量

文本向量模型用于将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。模型根据输入Token数计费。API参考

国际(新加坡)

模型名称

向量维度

批次大小

单批次最大处理Token数(

支持语种

单价

(每百万输入Token)

免费额度

(注)

text-embedding-v4

属于Qwen3-Embedding系列

2,048、1,536、1,024(默认)、768、512、256、128、64

10

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言

$0.07

100万Token

有效期:百炼开通后90天内

text-embedding-v3

1,024(默认)、768或512

10

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+语种

50万Token

有效期:百炼开通后90天内

中国大陆(北京)

模型名称

向量维度

批次大小

单批次最大处理Token数(

支持语种

单价

(每百万输入Token)

免费额度

(注)

text-embedding-v4

属于Qwen3-Embedding系列

2,048、1,536、1,024(默认)、768、512、256、128、64

10

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言

$0.072

无免费额度

说明

批次大小指单次API调用中能处理的文本数量上限。例如,text-embedding-v4的批次大小为10,意味着一次请求最多可传入10个文本进行向量化,且每个文本不得超过 8192 个Token。这个限制适用于:

  • 字符串数组输入:数组最多包含10个元素。

  • 文件输入:文本文件最多包含10行文本。

多模态向量

多模态向量模型将文本、图像或视频转换成一组由浮点数组成的向量,适用于视频分类、图像分类、图文检索等。API参考

国际(新加坡)

模型名称

数据类型

向量维度

单价(每百万输入Token)

免费额度(注)

tongyi-embedding-vision-plus

float(32)

1,152

$0.09

100万Token

有效期:百炼开通后90天内

tongyi-embedding-vision-flash

float(32)

768

图片/视频:$0.03

文本:$0.09

中国大陆(北京)

模型名称

数据类型

向量维度

单价(每千输入Token)

免费额度(注)

multimodal-embedding-v1

float(32)

1,024

免费试用

无Token额度限制

文本排序

通常用于语义检索,即给定查询 (Query) 和一系列候选文本 (Documents),会根据与查询的语义相关性从高到低对候选文本进行排序。API参考

说明

仅支持中国大陆(北京)地域。

模型名称

最大Document数量

单行最大输入Token

最大输入Token

支持语言

单价(每百万输入Token)

gte-rerank-v2

500

4,000

30,000

中、英、日、韩、泰语、西、法、葡、德、印尼语、阿拉伯语等50+语种

$0.115

  • 单行最大输入Token:每个Query或Document的最大Token数量为4,000。如果输入内容超过此长度,将会被截断。

  • 最大Document数量:每次请求中Document的最大数量为500。

  • 最大输入Token:每次请求中所有Query和Document的Token总数不得超过30,000。

行业

意图理解

通义意图理解模型,能够在百毫秒级时间内快速、准确地解析用户意图,并选择合适工具来解决用户问题。API参考使用方法

说明

仅支持中国大陆(北京)地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

tongyi-intent-detect-v3

8,192

8,192

1,024

$0.058

$0.144

角色扮演

通义千问的角色扮演模型,适合拟人化的对话场景(如虚拟社交、游戏NPC、IP复刻、硬件/玩具/车机等)。相比于其它通义千问模型,提升了人设还原、话题推进、倾听共情等能力。使用方法

国际(新加坡)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-plus-character-ja

8,192

7,680

512

$0.5

$1.4

中国大陆(北京)

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-plus-character

32,768

32,000

4,096

$0.115

$0.287

已下线模型

2025年8月20日下线

Qwen2

阿里云的通义千问2-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

替代模型

(Token数)

(每百万Token)

qwen2-72b-instruct

131,072

128,000

6,144

限时免费

Qwen3、DeepSeek、Kimi等

qwen2-57b-a14b-instruct

65,536

63,488

qwen2-7b-instruct

131,072

128,000

Qwen1.5

阿里云的通义千问1.5-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

替代模型

(Token数)

(每百万Token)

qwen1.5-110b-chat

8,000

6,000

2,000

限时免费

Qwen3、DeepSeek、Kimi等

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat