模型调用（按量付费） - 开源大数据平台E-MapReduce

按量付费是一种先使用后付费的计费方式，根据您工作空间实际的 AI 中心内置模型 Token 用量进行结算。

说明

AI 中心已于 2026 年 4 月 27 日全面开启商业化收费，详情请参见EMR Serverless Spark AI中心商业化公告。

按量付费说明

特性

说明

计费规则

按照工作空间一个周期内（1 小时）内置模型服务的 Token 用量计费，不同内置模型的计费规则不同：

模型调用费用为：模型输入 Token 用量 × 模型输入单价 + 模型输出 Token 用量 × 模型输出单价

例如，在新加坡地域调用 ai_query() 10,000 次，每次调用输入 Token 260、输出 Token 50（非思考模式）。对应的费用为：0.48 × 260 × 10000 ÷ 1000000 + 1.44 × 50 × 10000 ÷ 1000000 = 0.8448 美元。

说明

Token 用量预估可参考模型调用。

计费周期

按照每小时整点计算一次费用（以 UTC+8 时间为准），计算完毕后进入新的计费周期。在每个计费周期结束后，系统会生成账单，并从您账户中扣除相应费用。账单流水数据相对于实际费用消耗可能会有延迟，详情请参见了解阿里云账单。

说明

qwen3.6-plus 的思考模式和非思考模式同价。

地域名称	单次请求的输入Token范围	输入单价（$/百万Tokens）	输出单价（$/百万Tokens）
华北2（北京）华东2（上海）华东1（杭州）华南1（深圳）	0<Token≤128K	0.331	1.981
华北2（北京）华东2（上海）华东1（杭州）华南1（深圳）	128K<Token≤256K	1.321	7.927
中国香港新加坡德国（法兰克福）美国（弗吉尼亚）美国（硅谷）日本（东京）印度尼西亚（雅加达）墨西哥	0<Token≤256K	0.6	3.6
中国香港新加坡德国（法兰克福）美国（弗吉尼亚）美国（硅谷）日本（东京）印度尼西亚（雅加达）墨西哥	256K<Token≤1M	2.4	7.2

说明

qwen3.5-plus 的思考模式和非思考模式同价。

地域名称	单次请求的输入Token范围	输入单价（$/百万Tokens）	输出单价（$/百万Tokens）
华北2（北京）华东2（上海）华东1（杭州）华南1（深圳）	0<Token≤128K	0.138	0.826
	128K<Token≤256K	0.344	2.064
	256K<Token≤1M	0.688	4.128
中国香港新加坡德国（法兰克福）美国（弗吉尼亚）美国（硅谷）日本（东京）印度尼西亚（雅加达）墨西哥	0<Token≤256K	0.48	2.88
中国香港新加坡德国（法兰克福）美国（弗吉尼亚）美国（硅谷）日本（东京）印度尼西亚（雅加达）墨西哥	256K<Token≤1M	0.6	3.6

地域名称	模式	单次请求的输入 Token 范围	输入单价（$/百万Tokens）	输出单价（$/百万Tokens）
华北2（北京）华东2（上海）华东1（杭州）华南1（深圳）	非思考模式	0 < Token ≤ 128K	0.138	0.344
		128K < Token ≤ 256K	0.414	3.442
		256K < Token ≤ 1M	0.827	8.257
	思考模式	0 < Token ≤ 128K	0.138	0.344
		128K < Token ≤ 256K	0.414	3.442
		256K < Token ≤ 1M	0.827	8.257
中国香港新加坡德国（法兰克福）美国（弗吉尼亚）美国（硅谷）日本（东京）印度尼西亚（雅加达）墨西哥	非思考模式	0 < Token ≤ 256K	0.48	1.44
	非思考模式	256K < Token ≤ 1M	1.44	4.32
	思考模式	0 < Token ≤ 256K	0.48	1.44
	思考模式	256K < Token ≤ 1M	1.44	4.32

地域名称	输入单价（$/百万Tokens）
华北2（北京）华东2（上海）华东1（杭州）华南1（深圳）	0.086
中国香港新加坡德国（法兰克福）美国（弗吉尼亚）美国（硅谷）日本（东京）印度尼西亚（雅加达）墨西哥	0.084

地域名称	输入模态	输入单价（$/百万Tokens）
印度尼西亚（雅加达）	图片/视频/文本	0.09