按量付费是一种先使用后付费的计费方式,根据您工作空间实际的 AI 中心内置模型 Token 用量进行结算。
当前 AI 中心免费试用中,预计于 2026 年 4 月 8 日开启商业化收费,详情请参见EMR Serverless Spark AI中心商业化公告。
按量付费说明
特性 | 说明 |
计费规则 | 按照工作空间一个周期内(1 小时)内置模型服务的 Token 用量计费,不同内置模型的计费规则不同:
模型调用费用为:模型输入 Token 用量 × 模型输入单价 + 模型输出 Token 用量 × 模型输出单价 例如,在杭州地域调用 ai_query() 10,000 次,每次调用输入 Token 260、输出 Token 50。对应的费用为: 说明 Token 用量预估可参考计费项与计费方式中的模型调用子章节。 |
计费周期 | 按照每小时整点计算一次费用(以 UTC+8 时间为准),计算完毕后进入新的计费周期。在每个计费周期结束后,系统会生成账单,并从您账户中扣除相应费用。账单流水数据相对于实际费用消耗可能会有延迟,详情请参见账单使用说明。 |
地域单价
qwen-plus
地域名称 | 单次请求的输入 Token 范围 | 输入单价($/千 Tokens) | 输出单价($/千 Tokens) |
| 0 < Token ≤ 128K | 0.000138 | 0.000344 |
128K < Token ≤ 256K | 0.000414 | 0.003442 | |
256K < Token ≤ 1M | 0.000827 | 0.008257 | |
| 0 < Token ≤ 256K | 0.000480 | 0.001440 |
256K < Token ≤ 1M | 0.001440 | 0.004320 |
text-embedding-v4
地域名称 | 输入单价($/千 Tokens) |
| 0.000086 |
| 0.000084 |