阿里云百炼模型价格 - 大模型服务平台百炼

文本生成-千问

千问Max

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费；若模型支持上下文缓存，仅输入Token享有折扣。两者不能同时生效。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答	免费额度（注）
qwen3-max Batch调用半价上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$1.2	$6	各100万Token 有效期：阿里云百炼开通后90天内
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15
qwen3-max-2025-09-23	仅非思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15
qwen3-max-preview 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-max 上下文缓存享有折扣	仅非思考模式	0<Token≤32K	$0.359	$1.434
		32K<Token≤128K	$0.574	$2.294
		128K<Token≤252K	$1.004	$4.014
qwen3-max-2025-09-23	仅非思考模式	0<Token≤32K	$0.861	$3.441
		32K<Token≤128K	$1.434	$5.735
		128K<Token≤252K	$2.151	$8.602
qwen3-max-preview 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.861	$3.441
		32K<Token≤128K	$1.434	$5.735
		128K<Token≤252K	$2.151	$8.602

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-max Batch调用半价上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.359	$1.434
		32K<Token≤128K	$0.574	$2.294
		128K<Token≤252K	$1.004	$4.014
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	$0.359	$1.434
		32K<Token≤128K	$0.574	$2.294
		128K<Token≤252K	$1.004	$4.014
qwen3-max-2025-09-23	仅非思考模式	0<Token≤32K	$0.861	$3.441
		32K<Token≤128K	$1.434	$5.735
		128K<Token≤252K	$2.151	$8.602
qwen3-max-preview 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.861	$3.441
		32K<Token≤128K	$1.434	$5.735
		128K<Token≤252K	$2.151	$8.602

中国香港

在中国香港部署模式下，接入点与数据存储均位于中国香港，模型推理计算资源仅限于中国香港。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-max 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15

欧盟

在欧盟部署模式下，接入点与数据存储均位于德国（法兰克福），模型推理计算资源仅限于欧盟境内。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-max Batch调用半价上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15
qwen3-max-2026-01-23	非思考和思考模式	0<Token≤32K	$1.2	$6
		32K<Token≤128K	$2.4	$12
		128K<Token≤252K	$3	$15

千问Plus

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）		免费额度（注）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）	免费额度（注）
qwen3.5-plus	0<Token≤256K	$0.4	$2.4	$2.4	各 100 万 Token 有效期：阿里云百炼开通后90天内
qwen3.5-plus	256K<Token≤1M	$0.5	$3	$3
qwen3.5-plus-2026-02-15	0<Token≤256K	$0.4	$2.4	$2.4
qwen3.5-plus-2026-02-15	256K<Token≤1M	$0.5	$3	$3
qwen-plus	0<Token≤256K	$0.4	$1.2	$4
qwen-plus	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-latest	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-latest	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-12-01	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-2025-12-01	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-09-11	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-2025-09-11	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-07-28	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-2025-07-28	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-07-14	无阶梯计价	$0.4	$1.2	$4
qwen-plus-2025-04-28	无阶梯计价	$0.4	$1.2	$4
qwen-plus-2025-01-25	无阶梯计价	$0.4	$1.2	-

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3.5-plus	0<Token≤128K	$0.115	$0.688	$0.688
	128K<Token≤256K	$0.287	$1.72	$1.72
	256K<Token≤1M	$0.573	$3.44	$3.44
qwen3.5-plus-2026-02-15	0<Token≤128K	$0.115	$0.688	$0.688
	128K<Token≤256K	$0.287	$1.72	$1.72
	256K<Token≤1M	$0.573	$3.44	$3.44
qwen-plus	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-12-01	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-09-11	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-07-28	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175

美国

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen-plus-us	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-us	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-12-01-us	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-2025-12-01-us	256K<Token≤1M	$1.2	$3.6	$12

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3.5-plus	0<Token≤128K	$0.115	$0.688	$0.688
	128K<Token≤256K	$0.287	$1.72	$1.72
	256K<Token≤1M	$0.573	$3.44	$3.44
qwen3.5-plus-2026-02-15	0<Token≤128K	$0.115	$0.688	$0.688
	128K<Token≤256K	$0.287	$1.72	$1.72
	256K<Token≤1M	$0.573	$3.44	$3.44
qwen-plus	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-latest	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-12-01	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-09-11	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-07-28	0<Token≤128K	$0.115	$0.287	$1.147
	128K<Token≤256K	$0.345	$2.868	$3.441
	256K<Token≤1M	$0.689	$6.881	$9.175
qwen-plus-2025-07-14	无阶梯计价	$0.115	$0.287	$1.147
qwen-plus-2025-04-28	无阶梯计价	$0.115	$0.287	$1.147

中国香港

在中国香港部署模式下，接入点与数据存储均位于中国香港，模型推理计算资源仅限于中国香港。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen-plus	0<Token≤256K	$0.4	$1.2	$4
qwen-plus	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-12-01	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-2025-12-01	256K<Token≤1M	$1.2	$3.6	$12

欧盟

在欧盟部署模式下，接入点与数据存储均位于德国（法兰克福），模型推理计算资源仅限于欧盟境内。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen-plus	0<Token≤256K	$0.4	$1.2	$4
qwen-plus	256K<Token≤1M	$1.2	$3.6	$12
qwen-plus-2025-12-01	0<Token≤256K	$0.4	$1.2	$4
qwen-plus-2025-12-01	256K<Token≤1M	$1.2	$3.6	$12

千问Flash

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen3.5-flash Batch调用半价上下文缓存享有折扣	0<Token≤1M	$0.1	$0.4	各 100 万 Token 有效期：阿里云百炼开通后90天内
qwen3.5-flash-2026-02-23	0<Token≤1M	$0.1	$0.4
qwen-flash Batch调用半价上下文缓存享有折扣	0<Token≤256K	$0.05	$0.4
qwen-flash Batch调用半价上下文缓存享有折扣	256K<Token≤1M	$0.25	$2
qwen-flash-2025-07-28	0<Token≤256K	$0.05	$0.4
qwen-flash-2025-07-28	256K<Token≤1M	$0.25	$2

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3.5-flash	0<Token≤128K	$0.029	$0.287
	128K<Token≤256K	$0.115	$1.147
	256K<Token≤1M	$0.172	$1.72
qwen3.5-flash-2026-02-23	0<Token≤128K	$0.029	$0.287
	128K<Token≤256K	$0.115	$1.147
	256K<Token≤1M	$0.172	$1.72
qwen-flash 上下文缓存享有折扣	0<Token≤128K	$0.022	$0.216
	128K<Token≤256K	$0.087	$0.861
	256K<Token≤1M	$0.173	$1.721
qwen-flash-2025-07-28	0<Token≤128K	$0.022	$0.216
	128K<Token≤256K	$0.087	$0.861
	256K<Token≤1M	$0.173	$1.721

美国

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
qwen-flash-us	0<Token≤256K	$0.05	$0.4
qwen-flash-us	256K<Token≤1M	$0.25	$2
qwen-flash-2025-07-28-us	0<Token≤256K	$0.05	$0.4
qwen-flash-2025-07-28-us	256K<Token≤1M	$0.25	$2

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3.5-flash	0<Token≤128K	$0.029	$0.287
	128K<Token≤256K	$0.115	$1.147
	256K<Token≤1M	$0.172	$1.72
qwen3.5-flash-2026-02-23	0<Token≤128K	$0.029	$0.287
	128K<Token≤256K	$0.115	$1.147
	256K<Token≤1M	$0.172	$1.72
qwen-flash 上下文缓存享有折扣	0<Token≤128K	$0.022	$0.216
	128K<Token≤256K	$0.087	$0.861
	256K<Token≤1M	$0.173	$1.721
qwen-flash-2025-07-28	0<Token≤128K	$0.022	$0.216
	128K<Token≤256K	$0.087	$0.861
	256K<Token≤1M	$0.173	$1.721

中国香港

在中国香港部署模式下，接入点与数据存储均位于中国香港，模型推理计算资源仅限于中国香港。

模型名称

单次请求的输入Token范围

输入单价（每百万Token）

输出单价（每百万Token）

qwen3.5-flash

上下文缓存享有折扣

0<Token≤1M

$0.1

$0.4

qwen3.5-flash-2026-02-23

0<Token≤1M

$0.1

$0.4

欧盟

在欧盟部署模式下，接入点与数据存储均位于德国（法兰克福），模型推理计算资源仅限于欧盟境内。

模型名称

单次请求的输入Token范围

输入单价（每百万Token）

输出单价（每百万Token）

qwen3.5-flash

上下文缓存享有折扣

0<Token≤1M

$0.1

$0.4

qwen3.5-flash-2026-02-23

0<Token≤1M

$0.1

$0.4

千问Turbo

说明

千问Turbo 后续不再更新，建议替换为千问Flash。

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持Batch调用，其输入和输出Token单价均按实时推理价格的50%计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）		免费额度（注）
模型名称	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）	免费额度（注）
qwen-turbo Batch调用半价	$0.05	$0.2	$0.5	各100万Token 有效期：阿里云百炼开通后90天内
qwen-turbo-latest	$0.05	$0.2	$0.5
qwen-turbo-2025-04-28	$0.05	$0.2	$0.5

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen-turbo	$0.044	$0.087	$0.431
qwen-turbo-latest	$0.044	$0.087	$0.431
qwen-turbo-2025-07-15	$0.044	$0.087	$0.431
qwen-turbo-2025-04-28	$0.044	$0.087	$0.431

QwQ

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwq-plus	$0.8	$2.4	100万Token 有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwq-plus	$0.230	$0.574
qwq-plus-latest	$0.230	$0.574
qwq-plus-2025-03-05	$0.230	$0.574

千问Long

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-long-latest	$0.072	$0.287	无免费额度
qwen-long-2025-01-25	$0.072	$0.287	无免费额度

千问Omni

计费规则：按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

Qwen3.5-Omni

模型名称	输入单价（每百万Token）		输出单价（每百万Token）		免费额度（注）
	文本/图片/视频	音频	文本多模态输入	文本+音频仅音频计费
qwen3.5-omni-plus	邀测中，模型调用限时免费（不含工具调用费用）。				各100万Token 有效期：阿里云百炼开通后90天内
qwen3.5-omni-plus-2026-03-15
qwen3.5-omni-flash
qwen3.5-omni-flash-2026-03-15

Qwen3-Omni-Flash

模型名称	模式	输入单价（每百万Token）			输出单价（每百万Token）			免费额度（注）
模型名称	模式	文本	音频	图片/视频	文本仅纯文本输入	文本多模态输入	文本+音频仅音频计费	免费额度（注）
qwen3-omni-flash	非思考和思考模式	$0.43	$3.81	$0.78	$1.66	$3.06	$15.11	各100万Token（不区分模态）有效期：阿里云百炼开通后90天内
qwen3-omni-flash-2025-12-01	非思考和思考模式	$0.43	$3.81	$0.78	$1.66	$3.06	$15.11
qwen3-omni-flash-2025-09-15	非思考和思考模式	$0.43	$3.81	$0.78	$1.66	$3.06	$15.11

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

Qwen3.5-Omni

模型名称	输入单价（每百万Token）		输出单价（每百万Token）
	文本/图片/视频	音频	文本多模态输入	文本+音频仅音频计费
qwen3.5-omni-plus	邀测中，模型调用限时免费（不含工具调用费用）。

qwen3.5-omni-plus-2026-03-15

qwen3.5-omni-flash

qwen3.5-omni-flash-2026-03-15

Qwen3-Omni-Flash

模型名称	模式	输入单价（每百万Token）			输出单价（每百万Token）
模型名称	模式	文本	音频	图片/视频	文本仅纯文本输入	文本多模态输入	文本+音频仅音频计费
qwen3-omni-flash	非思考和思考模式	$0.258	$2.265	$0.473	$0.989	$1.821	$8.974
qwen3-omni-flash-2025-12-01	非思考和思考模式	$0.258	$2.265	$0.473	$0.989	$1.821	$8.974
qwen3-omni-flash-2025-09-15	非思考和思考模式	$0.258	$2.265	$0.473	$0.989	$1.821	$8.974

千问Omni-Realtime

计费规则：按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

Qwen3.5-Omni-Realtime

模型名称	输入单价（每百万Token）		输出单价（每百万Token）		免费额度（注）
	文本/图片	音频	文本多模态输入	文本+音频仅音频计费
qwen3.5-omni-plus-realtime	邀测中，模型调用限时免费（不含工具调用费用）。				各100万Token 有效期：阿里云百炼开通后90天内
qwen3.5-omni-plus-realtime-2026-03-15
qwen3.5-omni-flash-realtime
qwen3.5-omni-flash-realtime-2026-03-15

Qwen3-Omni-Flash-Realtime

模型名称	输入单价（每百万Token）			输出单价（每百万Token）			免费额度（注）
模型名称	文本	音频	图片	文本仅纯文本输入	文本多模态输入	文本+音频仅音频计费	免费额度（注）
qwen3-omni-flash-realtime	$0.52	$4.57	$0.94	$1.99	$3.67	$18.13	各100万Token（不区分模态）有效期：阿里云百炼开通后90天内
qwen3-omni-flash-realtime-2025-12-01	$0.52	$4.57	$0.94	$1.99	$3.67	$18.13
qwen3-omni-flash-2025-09-15-realtime	$0.52	$4.57	$0.94	$1.99	$3.67	$18.13
qwen-omni-turbo-realtime	$0.270	$4.440	$0.840	$1.070	$2.520	$8.890
qwen-omni-turbo-realtime-latest	$0.270	$4.440	$0.840	$1.070	$2.520	$8.890
qwen-omni-turbo-realtime-2025-05-08	$0.270	$4.440	$0.840	$1.070	$2.520	$8.890

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

Qwen3.5-Omni

模型名称	输入单价（每百万Token）		输出单价（每百万Token）
	文本/图片	音频	文本多模态输入	文本+音频仅音频计费
qwen3.5-omni-plus-realtime	邀测中，模型调用限时免费（不含工具调用费用）。

qwen3.5-omni-plus-realtime-2026-03-15

qwen3.5-omni-flash-realtime

qwen3.5-omni-flash-realtime-2026-03-15

Qwen3-Omni-Flash-Realtime

模型名称	输入单价（每百万Token）			输出单价（每百万Token）
模型名称	文本	音频	图片	文本仅纯文本输入	文本多模态输入	文本+音频仅音频计费
qwen3-omni-flash-realtime	$0.315	$2.709	$0.559	$1.19	$2.179	$10.766
qwen3-omni-flash-realtime-2025-12-01	$0.315	$2.709	$0.559	$1.19	$2.179	$10.766
qwen3-omni-flash-realtime-2025-09-15	$0.315	$2.709	$0.559	$1.19	$2.179	$10.766
qwen-omni-turbo-realtime	$0.230	$3.584	$0.861	$0.918	$2.581	$7.168
qwen-omni-turbo-realtime-latest	$0.230	$3.584	$0.861	$0.918	$2.581	$7.168
qwen-omni-turbo-realtime-2025-05-08	$0.230	$3.584	$0.861	$0.918	$2.581	$7.168

QVQ

计费规则：按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qvq-max	$1.2	$4.8	各100万Token 有效期：阿里云百炼开通后90天内
qvq-max-latest	$1.2	$4.8
qvq-max-2025-03-25	$1.2	$4.8

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qvq-max	$1.147	$4.588
qvq-max-latest	$1.147	$4.588
qvq-max-2025-05-15	$1.147	$4.588
qvq-max-2025-03-25	$1.147	$4.588
qvq-plus	$0.287	$0.717
qvq-plus-latest	$0.287	$0.717
qvq-plus-2025-05-15	$0.287	$0.717

千问VL

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答	免费额度（注）
qwen3-vl-plus 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.2	$1.6	各100万Token 有效期：阿里云百炼开通后90天内
		32K<Token≤128K	$0.3	$2.4
		128K<Token≤256K	$0.6	$4.8
qwen3-vl-plus-2025-12-19	非思考和思考模式	0<Token≤32K	$0.2	$1.6
		32K<Token≤128K	$0.3	$2.4
		128K<Token≤256K	$0.6	$4.8
qwen3-vl-plus-2025-09-23	非思考和思考模式	0<Token≤32K	$0.2	$1.6
		32K<Token≤128K	$0.3	$2.4
		128K<Token≤256K	$0.6	$4.8
qwen3-vl-flash 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96
qwen3-vl-flash-2026-01-22	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-plus 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.143	$1.434
		32K<Token≤128K	$0.215	$2.15
		128K<Token≤256K	$0.43	$4.301
qwen3-vl-plus-2025-09-23	非思考和思考模式	0<Token≤32K	$0.143	$1.434
		32K<Token≤128K	$0.215	$2.15
		128K<Token≤256K	$0.43	$4.301
qwen3-vl-flash 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.022	$0.215
		32K<Token≤128K	$0.043	$0.43
		128K<Token≤256K	$0.086	$0.859
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	$0.022	$0.215
		32K<Token≤128K	$0.043	$0.43
		128K<Token≤256K	$0.086	$0.859

美国

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-flash-us 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96
qwen3-vl-flash-2026-01-22-us	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96
qwen3-vl-flash-2025-10-15-us	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-plus 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.143	$1.434
		32K<Token≤128K	$0.215	$2.15
		128K<Token≤256K	$0.43	$4.301
qwen3-vl-plus-2025-12-19	非思考和思考模式	0<Token≤32K	$0.143	$1.434
		32K<Token≤128K	$0.215	$2.15
		128K<Token≤256K	$0.43	$4.301
qwen3-vl-plus-2025-09-23	非思考和思考模式	0<Token≤32K	$0.143	$1.434
		32K<Token≤128K	$0.215	$2.15
		128K<Token≤256K	$0.43	$4.301
qwen3-vl-flash 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.022	$0.215
		32K<Token≤128K	$0.043	$0.43
		128K<Token≤256K	$0.086	$0.859
qwen3-vl-flash-2026-01-22	非思考和思考模式	0<Token≤32K	$0.022	$0.215
		32K<Token≤128K	$0.043	$0.43
		128K<Token≤256K	$0.086	$0.859
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	$0.022	$0.215
		32K<Token≤128K	$0.043	$0.43
		128K<Token≤256K	$0.086	$0.859

中国香港

在中国香港部署模式下，接入点与数据存储均位于中国香港，模型推理计算资源仅限于中国香港。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-plus 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.2	$1.6
		32K<Token≤128K	$0.3	$2.4
		128K<Token≤256K	$0.6	$4.8
qwen3-vl-plus-2025-12-19	非思考和思考模式	0<Token≤32K	$0.2	$1.6
		32K<Token≤128K	$0.3	$2.4
		128K<Token≤256K	$0.6	$4.8

欧盟

在欧盟部署模式下，接入点与数据存储均位于德国（法兰克福），模型推理计算资源仅限于欧盟境内。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-plus 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.2	$1.6
		32K<Token≤128K	$0.3	$2.4
		128K<Token≤256K	$0.6	$4.8
qwen3-vl-flash 上下文缓存享有折扣	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96
qwen3-vl-flash-2025-10-15	非思考和思考模式	0<Token≤32K	$0.05	$0.4
		32K<Token≤128K	$0.075	$0.6
		128K<Token≤256K	$0.12	$0.96

千问OCR

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-vl-ocr	$0.07	$0.16	各100万Token 有效期：阿里云百炼开通后90天内
qwen-vl-ocr-2025-11-20

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-ocr	$0.043	$0.072
qwen-vl-ocr-2025-11-20	$0.043	$0.072

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-vl-ocr	$0.043	$0.072
qwen-vl-ocr-latest	$0.043	$0.072
qwen-vl-ocr-2025-11-20	$0.043	$0.072
qwen-vl-ocr-2025-08-28	$0.717	$0.717
qwen-vl-ocr-2025-04-13	$0.717	$0.717
qwen-vl-ocr-2024-10-28	$0.717	$0.717

千问数学模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-math-plus	$0.574	$1.721	无免费额度
qwen-math-plus-latest	$0.574	$1.721
qwen-math-plus-2024-09-19	$0.574	$1.721
qwen-math-plus-2024-08-16	$0.574	$1.721
qwen-math-turbo	$0.287	$0.861
qwen-math-turbo-latest	$0.287	$0.861
qwen-math-turbo-2024-09-19	$0.287	$0.861

千问Coder

计费规则：按输入Token和输出Token计费。

影响计费的因素：若模型支持上下文缓存，仅输入Token享有折扣。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen3-coder-plus 上下文缓存享有折扣	0<Token≤32K	$1	$5	各100万Token 有效期：阿里云百炼开通后90天内
	32K<Token≤128K	$1.8	$9
	128K<Token≤256K	$3	$15
	256K<Token≤1M	$6	$60
qwen3-coder-plus-2025-09-23	0<Token≤32K	$1	$5
	32K<Token≤128K	$1.8	$9
	128K<Token≤256K	$3	$15
	256K<Token≤1M	$6	$60
qwen3-coder-plus-2025-07-22	0<Token≤32K	$1	$5
	32K<Token≤128K	$1.8	$9
	128K<Token≤256K	$3	$15
	256K<Token≤1M	$6	$60
qwen3-coder-flash	0<Token≤32K	$0.3	$1.5
	32K<Token≤128K	$0.5	$2.5
	128K<Token≤256K	$0.8	$4
	256K<Token≤1M	$1.6	$9.6
qwen3-coder-flash-2025-07-28	0<Token≤32K	$0.3	$1.5
	32K<Token≤128K	$0.5	$2.5
	128K<Token≤256K	$0.8	$4
	256K<Token≤1M	$1.6	$9.6

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-plus 上下文缓存享有折扣	0<Token≤32K	$0.574	$2.294
	32K<Token≤128K	$0.861	$3.441
	128K<Token≤256K	$1.434	$5.735
	256K<Token≤1M	$2.868	$28.671
qwen3-coder-plus-2025-09-23	0<Token≤32K	$0.574	$2.294
	32K<Token≤128K	$0.861	$3.441
	128K<Token≤256K	$1.434	$5.735
	256K<Token≤1M	$2.868	$28.671
qwen3-coder-plus-2025-07-22	0<Token≤32K	$0.574	$2.294
	32K<Token≤128K	$0.861	$3.441
	128K<Token≤256K	$1.434	$5.735
	256K<Token≤1M	$2.868	$28.671
qwen3-coder-flash 上下文缓存享有折扣	0<Token≤32K	$0.144	$0.574
	32K<Token≤128K	$0.216	$0.861
	128K<Token≤256K	$0.359	$1.434
	256K<Token≤1M	$0.717	$3.584
qwen3-coder-flash-2025-07-28	0<Token≤32K	$0.144	$0.574
	32K<Token≤128K	$0.216	$0.861
	128K<Token≤256K	$0.359	$1.434
	256K<Token≤1M	$0.717	$3.584

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

qwen3-coder系列模型

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-plus 上下文缓存享有折扣	0<Token≤32K	$0.574	$2.294
	32K<Token≤128K	$0.861	$3.441
	128K<Token≤256K	$1.434	$5.735
	256K<Token≤1M	$2.868	$28.671
qwen3-coder-plus-2025-09-23	0<Token≤32K	$0.574	$2.294
	32K<Token≤128K	$0.861	$3.441
	128K<Token≤256K	$1.434	$5.735
	256K<Token≤1M	$2.868	$28.671
qwen3-coder-plus-2025-07-22	0<Token≤32K	$0.574	$2.294
	32K<Token≤128K	$0.861	$3.441
	128K<Token≤256K	$1.434	$5.735
	256K<Token≤1M	$2.868	$28.671
qwen3-coder-flash	0<Token≤32K	$0.144	$0.574
	32K<Token≤128K	$0.216	$0.861
	128K<Token≤256K	$0.359	$1.434
	256K<Token≤1M	$0.717	$3.584
qwen3-coder-flash-2025-07-28	0<Token≤32K	$0.144	$0.574
	32K<Token≤128K	$0.216	$0.861
	128K<Token≤256K	$0.359	$1.434
	256K<Token≤1M	$0.717	$3.584

早期qwen-coder系列模型

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen-coder-plus	无阶梯计价	$0.502	$1.004
qwen-coder-plus-latest	无阶梯计价	$0.502	$1.004
qwen-coder-plus-2024-11-06	无阶梯计价	$0.502	$1.004
qwen-coder-turbo	无阶梯计价	$0.287	$0.861
qwen-coder-turbo-latest	无阶梯计价	$0.287	$0.861
qwen-coder-turbo-2024-09-19	无阶梯计价	$0.287	$0.861

千问翻译模型

计费规则：按输入Token和输出Token计费。

国际

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-mt-plus	$2.46	$7.37	各100万Token 有效期：阿里云百炼开通后90天内
qwen-mt-flash	$0.16	$0.49
qwen-mt-lite	$0.12	$0.36
qwen-mt-turbo	$0.16	$0.49

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-mt-plus	$0.259	$0.775
qwen-mt-flash	$0.101	$0.280
qwen-mt-lite	$0.086	$0.229

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-mt-plus	$0.259	$0.775
qwen-mt-flash	$0.101	$0.280
qwen-mt-lite	$0.086	$0.229
qwen-mt-turbo	$0.101	$0.280

千问数据挖掘模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-doc-turbo	$0.087	$0.144	无免费额度

千问深入研究模型

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-deep-research	$7.742	$23.367	无

文本生成-千问-开源版

Qwen3.5

计费规则：按输入Token和输出Token计费。

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3.5-397b-a17b	0<Token≤128K	$0.172	$1.032	$1.032
qwen3.5-397b-a17b	128K<Token≤256K	$0.43	$2.58	$2.58
qwen3.5-122b-a10b	0<Token≤128K	$0.115	$0.917	$0.917
qwen3.5-122b-a10b	128K<Token≤256K	$0.287	$2.294	$2.294
qwen3.5-27b	0<Token≤128K	$0.086	$0.688	$0.688
qwen3.5-27b	128K<Token≤256K	$0.258	$2.064	$2.064
qwen3.5-35b-a3b	0<Token≤128K	$0.057	$0.459	$0.459
qwen3.5-35b-a3b	128K<Token≤256K	$0.229	$1.835	$1.835

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）		免费额度（注）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3.5-397b-a17b	0<Token≤256K	$0.6	$3.6	$3.6	各100万Token 有效期：阿里云百炼开通后90天内
qwen3.5-122b-a10b	0<Token≤256K	$0.4	$3.2	$3.2
qwen3.5-27b	0<Token≤256K	$0.3	$2.4	$2.4
qwen3.5-35b-a3b	0<Token≤256K	$0.25	$2	$2

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

模型名称	单次请求的输入Token范围	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	单次请求的输入Token范围	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3.5-397b-a17b	0<Token≤128K	$0.172	$1.032	$1.032
qwen3.5-397b-a17b	128K<Token≤256K	$0.43	$2.58	$2.58
qwen3.5-122b-a10b	0<Token≤128K	$0.115	$0.917	$0.917
qwen3.5-122b-a10b	128K<Token≤256K	$0.287	$2.294	$2.294
qwen3.5-27b	0<Token≤128K	$0.086	$0.688	$0.688
qwen3.5-27b	128K<Token≤256K	$0.258	$2.064	$2.064
qwen3.5-35b-a3b	0<Token≤128K	$0.057	$0.459	$0.459
qwen3.5-35b-a3b	128K<Token≤256K	$0.229	$1.835	$1.835

Qwen3

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）		免费额度（注）
模型名称	模式	输入单价（每百万Token）	非思考模式	思考模式	免费额度（注）
qwen3-next-80b-a3b-thinking	仅思考模式	$0.15	-	$1.2	各100万Token 有效期：阿里云百炼开通后90天内
qwen3-next-80b-a3b-instruct	仅非思考模式	$0.15	$1.2	-
qwen3-235b-a22b-thinking-2507	仅思考模式	$0.23	-	$2.3
qwen3-235b-a22b-instruct-2507	仅非思考模式	$0.23	$0.92	-
qwen3-30b-a3b-thinking-2507	仅思考模式	$0.2	-	$2.4
qwen3-30b-a3b-instruct-2507	仅非思考模式	$0.2	$0.8	-
qwen3-235b-a22b	非思考和思考模式	$0.7	$2.8	$8.4
qwen3-32b	非思考和思考模式	$0.16	$0.64	$0.64
qwen3-30b-a3b	非思考和思考模式	$0.2	$0.8	$2.4
qwen3-14b	非思考和思考模式	$0.35	$1.4	$4.2
qwen3-8b	非思考和思考模式	$0.18	$0.7	$2.1
qwen3-4b	非思考和思考模式	$0.11	$0.42	$1.26
qwen3-1.7b	非思考和思考模式	$0.11	$0.42	$1.26
qwen3-0.6b	非思考和思考模式	$0.11	$0.42	$1.26

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	模式	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3-next-80b-a3b-thinking	仅思考模式	$0.144	-	$1.434
qwen3-next-80b-a3b-instruct	仅非思考模式	$0.144	$0.574	-
qwen3-235b-a22b-thinking-2507	仅思考模式	$0.23	-	$2.3
qwen3-235b-a22b-instruct-2507	仅非思考模式	$0.23	$0.92	-
qwen3-30b-a3b-thinking-2507	仅思考模式	$0.108	-	$1.076
qwen3-30b-a3b-instruct-2507	仅非思考模式	$0.108	$0.431	-
qwen3-235b-a22b	非思考和思考模式	$0.287	$1.147	$2.868
qwen3-32b	非思考和思考模式	$0.16	$0.64	$0.64
qwen3-30b-a3b	非思考和思考模式	$0.108	$0.431	$1.076
qwen3-14b	非思考和思考模式	$0.144	$0.574	$1.434
qwen3-8b	非思考和思考模式	$0.072	$0.287	$0.717

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）
模型名称	模式	输入单价（每百万Token）	非思考模式	思考模式（思维链+回答）
qwen3-next-80b-a3b-thinking	仅思考模式	$0.144	-	$1.434
qwen3-next-80b-a3b-instruct	仅非思考模式	$0.144	$0.574	-
qwen3-235b-a22b-thinking-2507	仅思考模式	$0.287	-	$2.868
qwen3-235b-a22b-instruct-2507	仅非思考模式	$0.287	$1.147	-
qwen3-30b-a3b-thinking-2507	仅思考模式	$0.108	-	$1.076
qwen3-30b-a3b-instruct-2507	仅非思考模式	$0.108	$0.431	-
qwen3-235b-a22b	非思考和思考模式	$0.287	$1.147	$2.868
qwen3-32b	非思考和思考模式	$0.287	$1.147	$2.868
qwen3-30b-a3b	非思考和思考模式	$0.108	$0.431	$1.076
qwen3-14b	非思考和思考模式	$0.144	$0.574	$1.434
qwen3-8b	非思考和思考模式	$0.072	$0.287	$0.717
qwen3-4b	非思考和思考模式	$0.044	$0.173	$0.431
qwen3-1.7b	非思考和思考模式	$0.044	$0.173	$0.431
qwen3-0.6b	非思考和思考模式	$0.044	$0.173	$0.431

QwQ-开源版

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwq-32b	$0.287	$0.861	无免费额度

QwQ-Preview

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwq-32b-preview	$0.287	$0.861	无免费额度

Qwen2.5

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen2.5-14b-instruct-1m	$0.805	$3.22	各 100 万 Token 有效期：阿里云百炼开通后90天内
qwen2.5-7b-instruct-1m	$0.368	$1.47
qwen2.5-72b-instruct	$1.4	$5.6
qwen2.5-32b-instruct	$0.7	$2.8
qwen2.5-14b-instruct	$0.35	$1.4
qwen2.5-7b-instruct	$0.175	$0.7

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen2.5-14b-instruct-1m	$0.144	$0.431
qwen2.5-7b-instruct-1m	$0.072	$0.144
qwen2.5-72b-instruct	$0.574	$1.721
qwen2.5-32b-instruct	$0.287	$0.861
qwen2.5-14b-instruct	$0.144	$0.431
qwen2.5-7b-instruct	$0.072	$0.144
qwen2.5-3b-instruct	$0.044	$0.130
qwen2.5-1.5b-instruct	限时免费
qwen2.5-0.5b-instruct	限时免费

QVQ

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qvq-72b-preview	$1.721	$5.161	无免费额度

Qwen-Omni

计费规则：按输入Token和输出Token计费。不同模态的Token计算规则请参见计费与限流。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输入单价（每百万Token）

输出单价（每百万Token）

免费额度（注）

文本

音频

图片/视频

文本

仅纯文本输入

文本

多模态输入

文本+音频

仅音频计费

qwen2.5-omni-7b

$0.10

$6.76

$0.28

$0.40

$0.84

$13.51

100万Token（不区分模态）

有效期：阿里云百炼开通后90天

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输入单价（每百万Token）

输出单价（每百万Token）

输入：文本

输入：音频

输入：图片/视频

输出：文本

仅纯文本输入

输出：文本

多模态输入

输出：文本+音频

仅音频计费

qwen2.5-omni-7b

$0.087

$5.448

$0.287

$0.345

$0.861

$10.895

Qwen3-Omni-Captioner

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen3-omni-30b-a3b-captioner	$3.81	$3.06	100万Token 有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-omni-30b-a3b-captioner	$2.265	$1.821

Qwen-VL

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答	免费额度（注）
qwen3-vl-235b-a22b-thinking	仅思考模式	$0.4	$4	各100万Token 有效期：阿里云百炼开通后90天内
qwen3-vl-235b-a22b-instruct	仅非思考模式	$0.4	$1.6
qwen3-vl-32b-thinking	仅思考模式	$0.16	$0.64
qwen3-vl-32b-instruct	仅非思考模式	$0.16	$0.64
qwen3-vl-30b-a3b-thinking	仅思考模式	$0.2	$2.4
qwen3-vl-30b-a3b-instruct	仅非思考模式	$0.2	$0.8
qwen3-vl-8b-thinking	仅思考模式	$0.18	$2.1
qwen3-vl-8b-instruct	仅非思考模式	$0.18	$0.7

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-235b-a22b-thinking	仅思考模式	$0.287	$2.867
qwen3-vl-235b-a22b-instruct	仅非思考模式	$0.287	$1.147
qwen3-vl-32b-thinking	仅思考模式	$0.16	$0.64
qwen3-vl-32b-instruct	仅非思考模式	$0.16	$0.64
qwen3-vl-30b-a3b-thinking	仅思考模式	$0.108	$1.076
qwen3-vl-30b-a3b-instruct	仅非思考模式	$0.108	$0.431
qwen3-vl-8b-thinking	仅思考模式	$0.072	$0.717
qwen3-vl-8b-instruct	仅非思考模式	$0.072	$0.287

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	模式	输入单价（每百万Token）	输出单价（每百万Token）思维链+回答
qwen3-vl-235b-a22b-thinking	仅思考模式	$0.287	$2.867
qwen3-vl-235b-a22b-instruct	仅非思考模式	$0.287	$1.147
qwen3-vl-32b-thinking	仅思考模式	$0.287	$2.868
qwen3-vl-32b-instruct	仅非思考模式	$0.287	$1.147
qwen3-vl-30b-a3b-thinking	仅思考模式	$0.108	$1.076
qwen3-vl-30b-a3b-instruct	仅非思考模式	$0.108	$0.431
qwen3-vl-8b-thinking	仅思考模式	$0.072	$0.717
qwen3-vl-8b-instruct	仅非思考模式	$0.072	$0.287

Qwen-Math

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen2.5-math-72b-instruct	$0.574	$1.721	无免费额度
qwen2.5-math-7b-instruct	$0.144	$0.287	无免费额度
qwen2.5-math-1.5b-instruct	限时免费

Qwen-Coder

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen3-coder-next	0<Token≤32K	$0.3	$1.5	各100万Token 有效期：阿里云百炼开通后90天内
	32K<Token≤128K	$0.5	$2.5
	128K<Token≤256K	$0.8	$4
qwen3-coder-480b-a35b-instruct	0<Token≤32K	$1.5	$7.5
	32K<Token≤128K	$2.7	$13.5
	128K<Token≤200K	$4.5	$22.5
qwen3-coder-30b-a3b-instruct	0<Token≤32K	$0.45	$2.25
	32K<Token≤128K	$0.75	$3.75
	128K<Token≤200K	$1.2	$6

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-480b-a35b-instruct	0<Token≤32K	$0.861	$3.441
	32K<Token≤128K	$1.291	$5.161
	128K<Token≤200K	$2.151	$8.602
qwen3-coder-30b-a3b-instruct	0<Token≤32K	$0.216	$0.861
	32K<Token≤128K	$0.323	$1.291
	128K<Token≤200K	$0.538	$2.151

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-next	0<Token≤32K	$0.144	$0.574
	32K<Token≤128K	$0.216	$0.861
	128K<Token≤256K	$0.359	$1.434
qwen3-coder-480b-a35b-instruct	0<Token≤32K	$0.861	$3.441
	32K<Token≤128K	$1.291	$5.161
	128K<Token≤200K	$2.151	$8.602
qwen3-coder-30b-a3b-instruct	0<Token≤32K	$0.216	$0.861
	32K<Token≤128K	$0.323	$1.291
	128K<Token≤200K	$0.538	$2.151
qwen2.5-coder-32b-instruct	无阶梯计价	$0.287	$0.861
qwen2.5-coder-14b-instruct	无阶梯计价	$0.287	$0.861
qwen2.5-coder-7b-instruct	无阶梯计价	$0.144	$0.287
qwen2.5-coder-3b-instruct	无阶梯计价	限时免费
qwen2.5-coder-1.5b-instruct	无阶梯计价
qwen2.5-coder-0.5b-instruct	无阶梯计价

欧盟

在欧盟部署模式下，接入点与数据存储均位于德国（法兰克福），模型推理计算资源仅限于欧盟境内。

模型名称	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）
qwen3-coder-next	0<Token≤32K	$0.3	$1.5
	32K<Token≤128K	$0.5	$2.5
	128K<Token≤256K	$0.8	$4

文本生成-第三方模型

DeepSeek

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输入单价（每百万Token）

输出单价（每百万Token）

免费额度

deepseek-v3.2

上下文缓存享有折扣

$0.57

$1.71

100万Token

有效期：开通百炼后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
deepseek-v3.2 上下文缓存享有折扣	$0.287	$0.431	无免费额度
deepseek-v3.2-exp	$0.287	$0.431
deepseek-v3.1	$0.574	$1.721
deepseek-r1	$0.574	$2.294
deepseek-r1-0528	$0.574	$2.294
deepseek-v3	$0.287	$1.147
deepseek-r1-distill-qwen-1.5b	限时免费
deepseek-r1-distill-qwen-7b	$0.072	$0.144	无免费额度
deepseek-r1-distill-qwen-14b	$0.144	$0.431
deepseek-r1-distill-qwen-32b	$0.287	$0.861
deepseek-r1-distill-llama-8b	限时免费
deepseek-r1-distill-llama-70b	限时免费

Kimi

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
kimi-k2.5	$0.574	$3.011	无免费额度
kimi-k2-thinking	$0.574	$2.294
Moonshot-Kimi-K2-Instruct	$0.574	$2.294

MiniMax

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称

模式

输入单价（每百万Token）

输出单价（每百万Token）

思维链和回答

MiniMax-M2.5

仅思考模式

$0.304

$1.213

GLM

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入Token和输出Token计费。

模型名称	模式	单次请求的输入Token数	输入单价（每百万Token）	输出单价（每百万Token）思维链和回答
glm-5	非思考和思考模式	0<Token≤32K	$0.573	$2.58
glm-5	非思考和思考模式	32K<Token≤166K	$0.86	$3.154
glm-4.7	非思考和思考模式	0<Token≤32K	$0.431	$2.007
glm-4.7	非思考和思考模式	32K<Token≤166K	$0.574	$2.294
glm-4.6	非思考和思考模式	0<Token≤32K	$0.431	$2.007
glm-4.6	非思考和思考模式	32K<Token≤166K	$0.574	$2.294

图像生成

计费规则：输入不计费，输出计费。输出按成功生成的 图像张数 计费。

计费公式：费用 = 图像单价 × 输出的图像张数。

计费说明：

费用与输出图像的分辨率、宽高比无关。
请求失败不产生任何费用，也不消耗免费额度。

计费示例：部分图像生成失败

假设图像单价为 $0.10/张。若您调用接口请求生成 4 张图像，但实际仅成功返回 3 张图像的 URL，另 1 张生成失败，系统将仅对成功生成的图像进行计费。

计费数量：3 张。
费用计算：0.1 × 3 = $0.3。

千问文生图

仅输出计费，计费规则请参见图像生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出单价	免费额度（注）
qwen-image-2.0-pro	$0.075/张	各100张有效期：阿里云百炼开通后90天内
qwen-image-2.0-pro-2026-03-03	$0.075/张
qwen-image-2.0	$0.035/张
qwen-image-2.0-2026-03-03	$0.035/张
qwen-image-max	$0.075/张
qwen-image-max-2025-12-30	$0.075/张
qwen-image-plus	$0.03/张
qwen-image-plus-2026-01-09	$0.03/张
qwen-image	$0.035/张

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出单价
qwen-image-2.0-pro	$0.071676/张
qwen-image-2.0-pro-2026-03-03	$0.071676/张
qwen-image-2.0	$0.028671/张
qwen-image-2.0-2026-03-03	$0.028671/张
qwen-image-max	$0.071677/张
qwen-image-max-2025-12-30	$0.071677/张
qwen-image-plus	$0.028671/张
qwen-image-plus-2026-01-09	$0.028671/张
qwen-image	$0.035/张

千问图像编辑

仅输出计费，计费规则请参见图像生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出单价	免费额度（注）
qwen-image-2.0-pro	$0.075/张	各100张有效期：阿里云百炼开通后90天内
qwen-image-2.0-pro-2026-03-03	$0.075/张
qwen-image-2.0	$0.035/张
qwen-image-2.0-2026-03-03	$0.035/张
qwen-image-edit-max	$0.075/张
qwen-image-edit-max-2026-01-16	$0.075/张
qwen-image-edit-plus	$0.03/张
qwen-image-edit-plus-2025-12-15	$0.03/张
qwen-image-edit-plus-2025-10-30	$0.03/张
qwen-image-edit	$0.045/张

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出单价
qwen-image-2.0-pro	$0.071676/张
qwen-image-2.0-pro-2026-03-03	$0.071676/张
qwen-image-2.0	$0.028671/张
qwen-image-2.0-2026-03-03	$0.028671/张
qwen-image-edit-max	$0.071677/张
qwen-image-edit-max-2026-01-16	$0.071677/张
qwen-image-edit-plus	$0.028671/张
qwen-image-edit-plus-2025-12-15	$0.028671/张
qwen-image-edit-plus-2025-10-30	$0.028671/张
qwen-image-edit	$0.043/张

千问图像翻译

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

仅输出计费，计费规则请参见图像生成。

模型名称	输出单价	免费额度（注）
qwen-mt-image	$0.000431/张	无免费额度

千问-文生图-Z-Image

仅输出计费，计费规则请参见图像生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输出单价

免费额度（注）

z-image-turbo

关闭提示词改写（prompt_extend=false）：$0.015/张

开启提示词改写（prompt_extend=true）：$0.03/张

100张

有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称

输出单价

z-image-turbo

关闭提示词改写（prompt_extend=false）：$0.01434/张

开启提示词改写（prompt_extend=true）：$0.02868/张

万相文生图

仅输出计费，计费规则请参见图像生成。

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	输出单价
wan2.6-t2i	$0.028671/张

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出单价	免费额度（注）
wan2.6-t2i	$0.03/张	50张
wan2.5-t2i-preview	$0.03/张	50张
wan2.2-t2i-plus	$0.05/张	100张
wan2.2-t2i-flash	$0.025/张	100张
wan2.1-t2i-plus	$0.05/张	200张
wan2.1-t2i-turbo	$0.025/张	200张

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出单价
wan2.6-t2i	$0.028671/张
wan2.5-t2i-preview	$0.028671/张
wan2.2-t2i-plus	$0.020070/张
wan2.2-t2i-flash	$0.028671/张
wanx2.1-t2i-plus	$0.028671/张
wanx2.1-t2i-turbo	$0.020070/张
wanx2.0-t2i-turbo	$0.005735/张

万相图像生成与编辑

仅输出计费，计费规则请参见图像生成。

全球（弗吉尼亚）

说明

全球（弗吉尼亚）模型无免费额度。

模型名称	输出单价
wan2.6-image	$0.028671/张

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出单价	免费额度（注）
wan2.6-image	$0.03/张	50张有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出单价
wan2.6-image	$0.028671/张

万相通用图像编辑

仅输出计费，计费规则请参见图像生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型服务	模型名称	输出单价	免费额度（注）
通用图像编辑2.5	wan2.5-i2i-preview	$0.03/张	50张有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型服务	模型名称	输出单价
通用图像编辑2.5	wan2.5-i2i-preview	$0.028671/张
通用图像编辑2.1	wanx2.1-imageedit	$0.020070/张

AI试衣-OutfitAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

aitryon-plus：输入不计费，输出计费。计费规则请参见图像生成。
aitryon-parsing-v1：输入计费，输出不计费。按输入的图像张数计费，请求失败不计费。

模型服务	模型名称	单价	免费额度（注）
AI试衣-Plus版	aitryon-plus	$0.071677/张	无免费额度
AI试衣-图片分割	aitryon-parsing-v1	$0.000574/张	无免费额度

视频生成

计费规则：输入不计费，输出计费。输出按成功生成的 视频秒数 计费。

计费公式：费用 = 视频单价 × 输出的视频时长（单位：秒）。

计费说明：

部分模型按输出视频分辨率定价。不同分辨率（480P/720P/1080P）的计费价格有差异。
部分模型按输出视频模式定价。不同视频模式（标准版/专业版）的计费价格有差异。
部分模型按输出视频画幅定价。不同视频画幅（1:1/3:4）的计费价格有差异。
部分模型采用统一定价，与分辨率、模式或画幅无关。
请求失败不产生任何费用，也不会消耗免费额度。

万相-文生视频

仅输出计费，计费规则请参见视频生成。

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	输出视频分辨率	输出单价
wan2.6-t2v	720P	$0.086012/秒
wan2.6-t2v	1080P	$0.143353/秒

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出视频分辨率	输出单价	免费额度（注） ^{有效期：阿里云百炼开通后90天内}
wan2.6-t2v	720P	$0.10/秒	50秒
wan2.6-t2v	1080P	$0.15/秒	50秒
wan2.5-t2v-preview	480P	$0.05/秒	50秒
	720P	$0.10/秒
	1080P	$0.15/秒
wan2.2-t2v-plus	480P	$0.02/秒	50秒
wan2.2-t2v-plus	1080P	$0.10/秒	50秒
wan2.1-t2v-turbo	480P	$0.036/秒	200秒
wan2.1-t2v-turbo	720P	$0.036/秒	200秒
wan2.1-t2v-plus	720P	$0.10/秒	200秒

美国

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称	输出视频分辨率	输出单价
wan2.6-t2v-us	720P	$0.1/秒
wan2.6-t2v-us	1080P	$0.15/秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频分辨率	输出单价
wan2.6-t2v	720P	$0.086012/秒
wan2.6-t2v	1080P	$0.143353/秒
wan2.5-t2v-preview	480P	$0.043006/秒
	720P	$0.086012/秒
	1080P	$0.143353/秒
wan2.2-t2v-plus	480P	$0.02007/秒
wan2.2-t2v-plus	1080P	$0.100347/秒
wanx2.1-t2v-turbo	480P	$0.034405/秒
wanx2.1-t2v-turbo	720P	$0.034405/秒
wanx2.1-t2v-plus	720P	$0.100347/秒

万相-图生视频-基于首帧

仅输出计费，计费规则请参见视频生成。

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	输出视频类型	输出视频分辨率	输出单价
wan2.6-i2v	有声视频	720P	$0.086012/秒
wan2.6-i2v	有声视频	1080P	$0.143353/秒

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出视频类型	输出视频分辨率	输出单价	免费额度（注） ^{有效期：阿里云百炼开通后90天内}
wan2.6-i2v-flash	有声视频 `audio=true`	720P	$0.05/秒	50秒
		1080P	$0.075/秒
	无声视频 `audio=false`	720P	$0.025/秒
		1080P	$0.0375/秒
wan2.6-i2v	有声视频	720P	$0.10/秒	50秒
		1080P	$0.15/秒
wan2.5-i2v-preview	有声视频	480P	$0.05/秒	50秒
		720P	$0.10/秒
		1080P	$0.15/秒
wan2.2-i2v-flash	无声视频	480P	$0.015/秒	50秒
		720P	$0.036/秒
wan2.2-i2v-plus	无声视频	480P	$0.02/秒	50秒
		1080P	$0.10/秒
wan2.1-t2v-turbo	无声视频	480P	$0.036/秒	200秒
		720P	$0.036/秒
wan2.1-t2v-plus	无声视频	720P	$0.10/秒	200秒

美国

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称	输出视频类型	输出视频分辨率	输出单价
wan2.6-i2v-us	有声视频	720P	$0.1/秒
wan2.6-i2v-us	有声视频	1080P	$0.15/秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频类型	输出视频分辨率	输出单价
wan2.6-i2v-flash	有声视频 `audio=true`	720P	$0.043006/秒
	有声视频 `audio=true`	1080P	$0.071676/秒
	无声视频 `audio=false`	720P	$0.021503/秒
	无声视频 `audio=false`	1080P	$0.035838/秒
wan2.6-i2v	有声视频	720P	$0.086012/秒
wan2.6-i2v	有声视频	1080P	$0.143353/秒
wan2.5-i2v-preview	有声视频	480P	$0.043006/秒
		720P	$0.086012/秒
		1080P	$0.143353/秒
wan2.2-i2v-plus	无声视频	480P	$0.02007/秒
wan2.2-i2v-plus	无声视频	1080P	$0.100347/秒
wanx2.1-t2v-turbo	无声视频	480P	$0.034405/秒
wanx2.1-t2v-turbo	无声视频	720P	$0.034405/秒
wanx2.1-t2v-plus	无声视频	720P	$0.100347/秒

万相-图生视频-基于首尾帧

仅输出计费，计费规则请参见视频生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出视频分辨率	输出单价	免费额度（注） ^{有效期：阿里云百炼开通后90天内}
wan2.2-kf2v-flash	480P	$0.015/秒	50秒
	720P	$0.036/秒
	1080P	$0.07/秒
wan2.1-kf2v-plus	720P	$0.10/秒	200秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频分辨率	输出单价
wan2.2-kf2v-flash	480P	$0.014335/秒
	720P	$0.028671/秒
	1080P	$0.068809/秒
wanx2.1-kf2v-plus	720P	$0.100347/秒

万相-参考生视频

计费规则：输入视频和输出视频均计费，按视频秒数计费，失败不计费也不占用免费额度。

计费公式：计费时长 = 输入视频时长（上限 5 秒）+ 输出视频时长。
- 输入视频的计费时长不超过 5 秒，计算规则参见万相-参考生视频。
- 输出视频的计费时长为成功生成的视频秒数。
定价说明：计费单价由分辨率档位和 audio（是否输出有声视频）决定，与输入视频的实际分辨率或音频状态无关。

全球

在全球部署模式下，接入点与数据存储均位于美国（弗吉尼亚）或德国（法兰克福）地域，模型推理计算资源在全球范围内动态调度。

说明

全球部署模式的模型无免费额度。

模型名称	输出视频类型	输出视频分辨率	输入和输出单价
wan2.6-r2v	有声视频	720P	$0.086012/秒
wan2.6-r2v	有声视频	1080P	$0.143353/秒

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输出视频类型	输出视频分辨率	输入和输出单价	免费额度（注） ^{有效期：阿里云百炼开通后90天内}
wan2.6-r2v-flash	有声视频 `audio=true`	720P	$0.05/秒	50秒
	有声视频 `audio=true`	1080P	$0.075/秒
	无声视频 `audio=false`	720P	$0.025/秒
	无声视频 `audio=false`	1080P	$0.0375/秒
wan2.6-r2v	有声视频	720P	$0.10/秒	50秒
wan2.6-r2v	有声视频	1080P	$0.15/秒	50秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频类型	输出视频分辨率	输入和输出单价
wan2.6-r2v-flash	有声视频 `audio=true`	720P	$0.043006/秒
	有声视频 `audio=true`	1080P	$0.071676/秒
	无声视频 `audio=false`	720P	$0.021503/秒
	无声视频 `audio=false`	1080P	$0.035838/秒
wan2.6-r2v	有声视频	720P	$0.086012/秒
wan2.6-r2v	有声视频	1080P	$0.143353/秒

万相-通用视频编辑

仅输出计费，计费规则请参见视频生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输出视频分辨率

输出单价

免费额度（注）

wan2.1-vace-plus

720P

$0.10/秒

50秒

有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频分辨率	输出单价
wanx2.1-vace-plus	720P	$0.100347/秒

万相-数字人

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

wan2.2-s2v-detect：输入计费，输出不计费。输入按检测的图像张数计费，只要请求成功（无论检测结果通过与否），每张输入图像均计费一次。
wan2.2-s2v：输入不计费，输出计费。输出按成功生成的视频秒数计费，计费规则请参见视频生成。

模型服务

模型名称

单价

免费额度（注）

图像检测

wan2.2-s2v-detect

输入图像：$0.000574/张

无免费额度

视频生成

wan2.2-s2v

输出视频：

480P：$0.071677/秒
720P：$0.129018/秒

万相-图生动作

仅输出计费，计费规则请参见视频生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输出视频模式

输出单价

免费额度（注）

wan2.2-animate-move

标准模式wan-std

$0.12/秒

50秒

有效期：阿里云百炼开通后90天内

专业模式wan-pro

$0.18/秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频模式	输出单价
wan2.2-animate-move	标准模式`wan-std`	$0.06/秒
wan2.2-animate-move	专业模式`wan-pro`	$0.09/秒

万相-视频换人

仅输出计费，计费规则请参见视频生成。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输出视频模式

输出单价

免费额度（注）

wan2.2-animate-mix

标准模式wan-std

$0.18/秒

50秒

有效期：阿里云百炼开通后90天内

专业模式wan-pro

$0.26/秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输出视频模式	输出单价
wan2.2-animate-mix	标准模式`wan-std`	$0.09/秒
wan2.2-animate-mix	专业模式`wan-pro`	$0.13/秒

舞动人像AnimateAnyone

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

animate-anyone-detect-gen2：输入计费，输出不计费。输入按检测的图像张数计费，只要请求成功（无论检测结果通过与否），每张输入图像均计费一次。
animate-anyone-template-gen2：输入不计费，输出计费。输出按成功生成的视频秒数计费，计费规则请参见视频生成。
animate-anyone-gen2：输入不计费，输出计费。输出按成功生成的视频秒数计费，计费规则请参见视频生成。

模型服务	模型名称	单价	免费额度（注）
图像检测	animate-anyone-detect-gen2	输入图像：$0.000574/张	无免费额度
动作模板生成	animate-anyone-template-gen2	输出视频：$0.011469/秒
视频生成	animate-anyone-gen2	输出视频：$0.011469/秒

悦动人像EMO

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

emo-detect-v1：输入计费，输出不计费。输入按检测的图像张数计费，只要请求成功（无论检测结果通过与否），每张输入图像均计费一次。
emo-v1：输入不计费，输出计费。输出按成功生成的视频秒数计费，计费规则请参见视频生成。

模型服务

模型名称

单价

免费额度（注）

图像检测

emo-detect-v1

输入图像：$0.000574/张

无免费额度

视频生成

emo-v1

输出视频：

1:1画幅视频：$0.011469/秒
3:4画幅视频：$0.022937/秒

灵动人像LivePortrait

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

liveportrait-detect：输入计费，输出不计费。输入按检测的图像张数计费，只要请求成功（无论检测结果通过与否），每张输入图像均计费一次。
liveportrait：输入不计费，输出计费。输出按成功生成的视频秒数计费，计费规则请参见视频生成。

模型服务	模型名称	单价	免费额度（注）
图像检测	liveportrait-detect	输入图像：$0.000574/张	无免费额度
视频生成	liveportrait	输出视频：$0.002868/秒	无免费额度

表情包Emoji

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

emoji-detect-v1：输入计费，输出不计费。输入按检测的图像张数计费，只要请求成功（无论检测结果通过与否），每张输入图像均计费一次。
emoji-v1：输入不计费，输出计费。输出按成功生成的视频秒数计费，计费规则请参见视频生成。

模型服务	模型名称	单价	免费额度（注）
图像检测	emoji-detect-v1	输入图像：$0.000574/张	无免费额度
视频生成	emoji-v1	输出视频：$0.011469/秒	无免费额度

声动人像VideoRetalk

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

仅输出计费，计费规则请参见视频生成。

模型名称	输出单价	免费额度（注）
videoretalk	$0.011469/秒	无免费额度

视频风格重绘

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

仅输出计费，计费规则请参见视频生成。

模型名称	输出视频分辨率	输出单价	免费额度（注）
video-style-transform	540P	$0.028671/秒	无免费额度
video-style-transform	720P	$0.071677/秒	无免费额度

语音合成（文本转语音）

Qwen-TTS

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

千问3-TTS-Instruct-Flash

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

qwen3-tts-instruct-flash

$0.115

1万字符

有效期：阿里云百炼开通后90天内

qwen3-tts-instruct-flash-2026-01-26

$0.115

千问3-TTS-VD

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

qwen3-tts-vd-2026-01-26

$0.115

1万字符

有效期：阿里云百炼开通后90天内

千问3-TTS-VC

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

qwen3-tts-vc-2026-01-22

$0.115

1万字符

有效期：阿里云百炼开通后90天内

千问3-TTS-Flash

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	免费额度（注）
qwen3-tts-flash	$0.1	1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-2025-11-27	$0.1	1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-2025-09-18	$0.1	2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

千问3-TTS-Instruct-Flash

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价（每万字符）
qwen3-tts-instruct-flash	$0.115	不计费
qwen3-tts-instruct-flash-2026-01-26	$0.115	不计费

千问3-TTS-VD

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价（每万字符）
qwen3-tts-vd-2026-01-26	$0.115	不计费

千问3-TTS-VC

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价（每万字符）
qwen3-tts-vc-2026-01-22	$0.115	不计费

千问3-TTS-Flash

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价（每万字符）
qwen3-tts-flash	$0.114682	不计费
qwen3-tts-flash-2025-11-27	$0.114682	不计费
qwen3-tts-flash-2025-09-18	$0.114682	不计费

千问-TTS

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）
qwen-tts-flash	$0.23	$1.434
qwen-tts-latest	$0.23	$1.434
qwen-tts-2025-05-22	$0.23	$1.434
qwen-tts-2025-04-10	$0.23	$1.434

Qwen-TTS-Realtime

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

千问3-TTS-Instruct-Flash-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

qwen3-tts-instruct-flash-realtime

$0.143

1万字符

有效期：阿里云百炼开通后90天内

qwen3-tts-instruct-flash-realtime-2026-01-22

$0.143

1万字符

有效期：阿里云百炼开通后90天内

千问3-TTS-VD-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

qwen3-tts-vd-realtime-2026-01-15

$0.143353

1万字符

有效期：阿里云百炼开通后90天内

qwen3-tts-vd-realtime-2025-12-16

$0.143353

1万字符

有效期：阿里云百炼开通后90天内

千问3-TTS-VC-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

qwen3-tts-vc-realtime-2026-01-15

$0.13

1万字符

有效期：阿里云百炼开通后90天内

qwen3-tts-vc-realtime-2025-11-27

千问3-TTS-Flash-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	免费额度（注）
qwen3-tts-flash-realtime	$0.13	2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-realtime-2025-11-27	$0.13	1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-realtime-2025-09-18	$0.13	2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

千问3-TTS-Instruct-Flash-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价
qwen3-tts-instruct-flash-realtime	$0.143	不计费
qwen3-tts-instruct-flash-realtime-2026-01-22	$0.143	不计费

千问3-TTS-VD-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价
qwen3-tts-vd-realtime-2026-01-15	$0.143353	不计费
qwen3-tts-vd-realtime-2025-12-16	$0.143353	不计费

千问3-TTS-VC-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价
qwen3-tts-vc-realtime-2026-01-15	$0.143353	不计费
qwen3-tts-vc-realtime-2025-11-27	$0.143353	不计费

千问3-TTS-Flash-Realtime

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	输出单价
qwen3-tts-flash-realtime	$0.143353	不计费
qwen3-tts-flash-realtime-2025-11-27	$0.143353	不计费
qwen3-tts-flash-realtime-2025-09-18	$0.143353	不计费

千问-TTS-Realtime

计费规则：按输入Token和输出Token计费。

模型名称	输入单价（每百万Token）	输入单价（每百万Token）
qwen-tts-realtime	$0.345	$1.721
qwen-tts-realtime-latest	$0.345	$1.721
qwen-tts-realtime-2025-07-15	$0.345	$1.721

Qwen-TTS声音复刻

计费规则：按新建音色个数计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单价（每个音色）	免费额度（注）
qwen-voice-enrollment	$0.01	1000个音色/账号

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	单价（每个音色）
qwen-voice-enrollment	$0.01

Qwen-TTS声音设计

计费规则：按新建音色个数计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	单价（每个音色）	免费额度（注）
qwen-voice-design	$0.2	10个音色/账号

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	单价（每个音色）
qwen-voice-design	$0.2

CosyVoice

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

计费规则：按输入文本的字符数计费，输出不计费。

模型名称

输入单价（每万字符）

免费额度（注）

cosyvoice-v3-plus

$0.26

1万字符

有效期：阿里云百炼开通后90天内

cosyvoice-v3-flash

$0.13

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

计费规则：按输入文本的字符数计费，输出不计费。

模型名称	输入单价（每万字符）	免费额度（注）
cosyvoice-v3.5-plus	$0.22	无免费额度
cosyvoice-v3.5-flash	$0.116
cosyvoice-v3-plus	$0.286706
cosyvoice-v3-flash	$0.14335
cosyvoice-v2	$0.286706

语音识别（语音转文本）与翻译（语音转成指定语种的文本）

千问3-LiveTranslate-Flash-Realtime

计费规则：按输入Token和输出Token计费。不同模态的Token计算规则请参见计费说明。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）		输出单价（每百万Token）		免费额度（注）
模型名称	输入：音频	输入：图片	输出：文本	输出：音频	免费额度（注）
qwen3-livetranslate-flash-realtime	$10	$1.3	$10	$38	各 100 万Token 有效期：阿里云百炼开通后90天内
qwen3-livetranslate-flash-realtime-2025-09-22	$10	$1.3	$10	$38	各 100 万Token 有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）		输出单价（每百万Token）
模型名称	输入：音频	输入：图片	输出：文本	输出：音频
qwen3-livetranslate-flash-realtime	$9.175	$1.147	$9.175	$34.405
qwen3-livetranslate-flash-realtime-2025-09-22	$9.175	$1.147	$9.175	$34.405

千问ASR

计费规则：按输入音频的秒数计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价	免费额度（注）
qwen3-asr-flash-filetrans	$0.000035/秒	36,000秒（10小时）有效期：阿里云百炼开通后90天内
qwen3-asr-flash-filetrans-2025-11-17
qwen3-asr-flash
qwen3-asr-flash-2026-02-10
qwen3-asr-flash-2025-09-08

美国

在美国部署模式下，接入点与数据存储均位于美国（弗吉尼亚）地域，模型推理计算资源仅限于美国境内。

说明

美国部署模式的模型无免费额度。

模型名称	输入单价
qwen3-asr-flash-us	$0.000035/秒
qwen3-asr-flash-2025-09-08-us	$0.000035/秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价
qwen3-asr-flash-filetrans	$0.000032/秒
qwen3-asr-flash-filetrans-2025-11-17
qwen3-asr-flash
qwen3-asr-flash-2026-02-10
qwen3-asr-flash-2025-09-08

千问ASR-Realtime

计费规则：按输入音频的秒数计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价	免费额度（注）
qwen3-asr-flash-realtime	$0.000090/秒	36,000秒（10小时）有效期：阿里云百炼开通后90天内
qwen3-asr-flash-realtime-2026-02-10	$0.000090/秒
qwen3-asr-flash-realtime-2025-10-27	$0.000090/秒

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价
qwen3-asr-flash-realtime	$0.000047/秒
qwen3-asr-flash-realtime-2026-02-10
qwen3-asr-flash-realtime-2025-10-27

Fun-ASR

录音文件识别

计费规则：按输入音频的秒数计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价	免费额度（注）
fun-asr	$0.000035/秒	36,000秒（10小时）有效期 90 天
fun-asr-2025-11-07
fun-asr-2025-08-25
fun-asr-mtl
fun-asr-mtl-2025-08-25

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价
fun-asr	$0.000032/秒
fun-asr-2025-11-07
fun-asr-2025-08-25
fun-asr-mtl
fun-asr-mtl-2025-08-25

实时语音识别

计费规则：按输入音频的秒数计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输入单价

免费额度（注）

fun-asr-realtime

$0.00009/秒

36,000秒（10小时）

有效期90天

fun-asr-realtime-2025-11-07

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价
fun-asr-realtime	$0.000047/秒
fun-asr-realtime-2026-02-28
fun-asr-realtime-2025-11-07
fun-asr-realtime-2025-09-15
fun-asr-flash-8k-realtime	$0.000032/秒
fun-asr-flash-8k-realtime-2026-01-28	$0.000032/秒

Paraformer

录音文件识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入音频的秒数计费，输出不计费。

模型名称	输入单价
paraformer-v2	$0.000012/秒
paraformer-8k-v2	$0.000012/秒

实时语音识别

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

计费规则：按输入音频的秒数计费，输出不计费。

模型名称	输入单价	免费额度（注）
paraformer-realtime-v2	$0.000035/秒	无免费额度
paraformer-realtime-8k-v2	$0.000035/秒	无免费额度

文本向量

计费规则：按输入Token计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	免费额度（注）
text-embedding-v4	$0.07	100万Token 有效期：阿里云百炼开通后90天内
text-embedding-v3	$0.07	50万Token 有效期：阿里云百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）
text-embedding-v4	$0.072

中国香港

在中国香港部署模式下，接入点与数据存储均位于中国香港，模型推理计算资源仅限于中国香港。

模型名称	输入单价（每百万Token）	免费额度（注）
text-embedding-v4	$0.07	100万Token 有效期：阿里云百炼开通后90天内

多模态向量

计费规则：按输入Token计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输入单价（每百万输入Token）

免费额度（注）

tongyi-embedding-vision-plus

$0.09

100万Token

有效期：百炼开通后90天内

tongyi-embedding-vision-flash

图片/视频：$0.03

文本：$0.09

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

模型名称

输入单价（每百万Token）

免费额度（注）

qwen3-vl-embedding

图片/视频：$0.258

文本：$0.1

100万Token

有效期：百炼开通后90天内

multimodal-embedding-v1

免费试用

无Token额度限制

文本排序

计费规则：按输入Token计费，输出不计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称

输入单价（每百万Token）

免费额度（注）

qwen3-rerank

$0.1

100万Token

有效期：百炼开通后90天内

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

说明

中国内地部署模式的模型无免费额度。

模型名称	输入单价（每百万Token）
gte-rerank-v2	$0.115

行业模型

意图理解

说明

仅支持中国内地部署模式。接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
tongyi-intent-detect-v3	$0.058	$0.144	无免费额度

角色扮演

计费规则：按输入Token和输出Token计费。

国际

在国际部署模式下，接入点与数据存储均位于新加坡地域，模型推理计算资源在全球范围内动态调度（不含中国内地）。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-plus-character-ja	$0.5	$1.4	无免费额度

中国内地

在中国内地部署模式下，接入点与数据存储均位于北京地域，模型推理计算资源仅限于中国内地。

模型名称	输入单价（每百万Token）	输出单价（每百万Token）	免费额度（注）
qwen-plus-character	$0.115	$0.287	无免费额度

文本生成-千问

千问Max

国际

更多模型

全球

中国内地

更多模型

中国香港

欧盟

千问Plus

国际

全球

美国

中国内地

更多模型

中国香港

欧盟

千问Flash

国际

全球

美国

中国内地

中国香港

欧盟

千问Turbo

国际

更多模型

中国内地

QwQ

国际

中国内地

千问Long

千问Omni

国际

Qwen3.5-Omni

Qwen3-Omni-Flash

更多模型

中国内地

Qwen3.5-Omni

Qwen3-Omni-Flash

更多模型

千问Omni-Realtime

国际

Qwen3.5-Omni-Realtime

Qwen3-Omni-Flash-Realtime

中国内地

Qwen3.5-Omni

Qwen3-Omni-Flash-Realtime

QVQ

国际

中国内地

千问VL

国际

更多模型

全球

美国

中国内地

更多模型

中国香港

欧盟

千问OCR

国际

全球

中国内地

千问数学模型

千问Coder

国际

全球

中国内地

qwen3-coder系列模型

早期qwen-coder系列模型

千问翻译模型

国际

全球

中国内地

千问数据挖掘模型

千问深入研究模型

文本生成-千问-开源版

Qwen3.5

全球