旗舰模型
国际(新加坡)
旗舰模型 |
适合复杂任务,能力最强 |
效果、速度、成本均衡 |
适合简单任务,速度快、成本低 |
卓越的代码模型,擅长工具调用和环境交互 |
最大上下文长度 (Token数) | 262,144 | 1,000,000 | 1,000,000 | 1,000,000 |
最低输入价格 (每百万Token) | $1.2 | $0.4 | $0.05 | $0.3 |
最低输出价格 (每百万Token) | $6 | $1.2 | $0.4 | $1.5 |
中国大陆(北京)
旗舰模型 |
适合复杂任务,能力最强 |
效果、速度、成本均衡 |
适合简单任务,速度快、成本低 |
卓越的代码模型,擅长工具调用和环境交互 |
最大上下文长度 (Token数) | 262,144 | 1,000,000 | 1,000,000 | 1,000,000 |
最低输入价格 (每百万Token) | $0.459 | $0.115 | $0.022 | $0.144 |
最低输出价格 (每百万Token) | $1.836 | $0.287 | $0.216 | $0.574 |
模型总览
国际(新加坡)
类别 | 子类别 | 说明 |
文本生成 | 通义千问大语言模型:商业版(通义千问Max、通义千问Plus、通义千问Flash)、开源版(Qwen3、Qwen2.5) | |
视觉理解模型通义千问VL、视觉推理模型QVQ、全模态模型通义千问 Omni、实时多模态模型通义千问Omni-Realtime | ||
图像生成 | ||
语音合成与识别 | 通义千问语音合成、通义千问实时语音合成可实现文本转语音,适用于智能语音客服、有声读物、车载导航、教育辅导等场景。 | |
通义千问实时语音识别、通义千问录音文件识别、Qwen3-LiveTranslate-Flash-Realtime、Fun-ASR语音识别可实现语音转文本,适用于实时会议记录、实时直播字幕、电话客服等场景。 | ||
视频生成 | 一句话生成视频,视频风格丰富,画质细腻。 | |
通用视频编辑:基于输入的文本、图片和视频,可执行多种视频编辑任务。例如,通过提取输入视频的运动特征,并结合提示词生成新的视频。 | ||
向量 | 将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。 |
中国大陆(北京)
类别 | 模型 | 说明 |
文本生成 | ||
图像生成 | ||
通用模型: | ||
语音合成与识别 | 通义千问语音合成、通义千问实时语音合成和CosyVoice语音合成可实现文本转语音,适用于智能语音客服、有声读物、车载导航、教育辅导等场景。 | |
通义千问实时语音识别、通义千问录音文件识别、Fun-ASR语音识别、Paraformer语音识别可实现语音转文本,适用于实时会议记录、实时直播字幕、电话客服等场景。 | ||
视频编辑与生成 | 一句话生成视频,视频风格丰富,画质细腻。 | |
| ||
| ||
向量 | 将文本转换成一组可以代表文字的数字,用于搜索、聚类、推荐、分类等。 | |
将文本、图像、语音转换成一组数字,用于音视频分类、图像分类、图文检索等。 |
文本生成-通义千问
以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。
商业版模型参数量暂不透出。
各模型会不定期更新升级。如需使用固定版本,请选择快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。
建议优先使用稳定版或最新版,限流条件更宽松。
通义千问Max
通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验
国际(新加坡)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每千Token) | ||||||||
qwen3-max 当前与qwen3-max-2025-09-23能力相同 Batch调用半价 | 稳定版 | 仅非思考 | 262,144 | 258,048 | - | 65,536 | 阶梯计价,请参见表格下方说明。 | 各100万Token 有效期:百炼开通后90天内 | |
qwen3-max-2025-09-23 | 快照版 | 仅非思考 | |||||||
qwen3-max-preview | 预览版 | 思考 | 81,920 | 32,768 | |||||
非思考 | - | 65,536 | |||||||
以上模型根据本次请求的输入 Token数,采取阶梯计费。
单次请求的输入Token数 | 输入价格(每百万Token) qwen3-max、qwen3-max-preview 支持上下文缓存。 | 输出价格(每百万Token) |
0<Token≤32K | $1.2 | $6 |
32K<Token≤128K | $2.4 | $12 |
128K<Token≤252K | $3 | $15 |
中国大陆(北京)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每千Token) | |||||||
qwen3-max 当前与qwen3-max-2025-09-23能力相同 Batch调用半价 | 稳定版 | 仅非思考 | 262,144 | 258,048 | - | 65,536 | 阶梯计价,请参见表格下方说明。 | |
qwen3-max-2025-09-23 | 快照版 | 仅非思考 | ||||||
qwen3-max-preview | 预览版 | 思考 | 81,920 | 32,768 | ||||
非思考 | - | 65,536 | ||||||
以上模型根据本次请求的输入 Token数,采取阶梯计费。
模型名称 | 单次请求的输入Token数 | 输入单价(每百万Token) | 输出单价(每百万Token) 思维链+回答 |
qwen3-max Batch调用半价 上下文缓存享有折扣 | 0<Token≤32K | $0.459 | $1.836 |
32K<Token≤128K | $0.918 | $3.672 | |
128K<Token≤252K | $1.377 | $5.508 | |
qwen3-max-2025-09-23 | 0<Token≤32K | $0.861 | $3.441 |
32K<Token≤128K | $1.434 | $5.735 | |
128K<Token≤252K | $2.151 | $8.602 | |
qwen3-max-preview 上下文缓存享有折扣 | 0<Token≤32K | $0.861 | $3.441 |
32K<Token≤128K | $1.434 | $5.735 | |
128K<Token≤252K | $2.151 | $8.602 |
qwen3-max-preview 模型的思考模式:在整体推理能力上显著提升,尤其在智能体编程、常识推理,以及数学、科学和通用任务方面表现更优。
通义千问Plus
能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Flash之间,适合中等复杂任务。使用方法 | API参考 | 在线体验|深度思考
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | ||||||
qwen-plus 当前与qwen-plus-2025-07-28能力相同 属于Qwen3系列 | 稳定版 | 1,000,000 | 思考模式 995,904 非思考模式 997,952 默认均为262,144,可通过max_input_tokens 参数调整 | 32,768 思维链最长81,920 | 阶梯计价,请参见表格下方说明。 | 各100万Token 有效期:百炼开通后90天内 | |
qwen-plus-latest 当前与qwen-plus-2025-12-01能力相同 属于Qwen3系列 | 最新版 | 思考模式 995,904 非思考模式 997,952 | |||||
qwen-plus-2025-12-01 属于Qwen3系列 | 快照版 | 思考模式 995,904 非思考模式 997,952 | |||||
qwen-plus-2025-09-11 属于Qwen3系列 | |||||||
qwen-plus-2025-07-28 又称qwen-plus-0728 属于Qwen3系列 | |||||||
qwen-plus-2025-07-14 又称qwen-plus-0714 属于Qwen3系列 | 131,072 | 思考模式 98,304 非思考模式 129,024 | 16,384 思维链最长38,912 | $0.4 | 思考模式 $4 非思考模式 $1.2 | ||
qwen-plus-2025-04-28 又称qwen-plus-0428 属于Qwen3系列 | |||||||
qwen-plus-2025-01-25 又称qwen-plus-0125 | 129,024 | 8,192 | $1.2 | ||||
qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根据本次请求输入的 Token数,采取阶梯计费。
单次请求的输入Token数 | 输入价格(每百万Token) | 模式 | 输出价格(每百万Token) |
0<Token≤256K | $0.4 | 非思考模式 | $1.2 |
思考模式 | $4 | ||
256K<Token≤1M | $1.2 | 非思考模式 | $3.6 |
思考模式 | $12 |
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
qwen-plus 当前与qwen-plus-2025-07-28能力相同 属于Qwen3系列 | 稳定版 | 1,000,000 | 思考模式 995,904 非思考模式 997,952 默认均为131,072,可通过max_input_tokens 参数调整 | 32,768 思维链最长81,920 | 阶梯计价,请参见表格下方说明。 | |
qwen-plus-latest 当前与qwen-plus-2025-12-01能力相同 属于Qwen3系列 | 最新版 | 思考模式 995,904 非思考模式 997,952 | ||||
qwen-plus-2025-12-01 属于Qwen3系列 | 快照版 | 思考模式 995,904 非思考模式 997,952 | ||||
qwen-plus-2025-09-11 属于Qwen3系列 | ||||||
qwen-plus-2025-07-28 又称qwen-plus-0728 属于Qwen3系列 | ||||||
qwen-plus-2025-07-14 又称qwen-plus-0714 属于Qwen3系列 | 131,072 | 思考模式 98,304 非思考模式 129,024 | 16,384 思维链最长38,912 | $0.115 | 思考模式 $1.147 非思考模式 $0.287 | |
qwen-plus-2025-04-28 又称qwen-plus-0428 属于Qwen3系列 | ||||||
qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根据本次请求输入的 Token数,采取阶梯计费。
单次请求的输入Token数 | 输入价格(每百万Token) | 模式 | 输出价格(每百万Token) |
0<Token≤128K | $0.115 | 非思考模式 | $0.287 |
思考模式 | $1.147 | ||
128K<Token≤256K | $0.345 | 非思考模式 | $2.868 |
思考模式 | $3.441 | ||
256K<Token≤1M | $0.689 | 非思考模式 | $6.881 |
思考模式 | $9.175 |
上述模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:
推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。
人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。
Agent 能力:在思考、非思考两种模式下都达到业界领先水平,能精准调用外部工具。
多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。
回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。
对于上述模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。
通义千问Flash
通义千问系列速度最快、成本极低的模型,适合简单任务。通义千问Flash采用灵活的阶梯定价,相比通义千问Turbo计费更合理。使用方法 | API参考 | 在线体验 | 思考模式
国际(新加坡)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 输入成本 | 输出成本 思维链+输出 | 免费额度 |
(Token数) | (每千Token) | ||||||||
qwen-flash 当前与 qwen-flash-2025-07-28能力相同 属于Qwen3系列 Batch调用半价 | 稳定版 | 思考 | 1,000,000 | 995,904 | 81,920 | 32,768 | 阶梯计价,请参见表格下方说明。 | 各100万Token 有效期:百炼开通后90天内 | |
非思考 | 997,952 | - | |||||||
qwen-flash-2025-07-28 属于Qwen3系列 | 快照版 | 思考 | 995,904 | 81,920 | |||||
非思考 | 997,952 | - | |||||||
以上模型根据本次请求输入的 Token数采取阶梯计费,其中qwen-flash支持缓存和 Batch调用。
单次请求的输入Token数 | 输入价格(每百万Token) | 输出价格(每百万Token) |
0<Token≤256K | $0.05 | $0.4 |
256K<Token≤1M | $0.25 | $2 |
中国大陆(北京)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 输入成本 | 输出成本 思维链+输出 |
(Token数) | (每千Token) | |||||||
qwen-flash 当前与 qwen-flash-2025-07-28能力相同 属于Qwen3系列 | 稳定版 | 思考 | 1,000,000 | 995,904 | 81,920 | 32,768 | 阶梯计价,请参见表格下方说明。 | |
非思考 | 997,952 | - | ||||||
qwen-flash-2025-07-28 属于Qwen3系列 | 快照版 | 思考 | 995,904 | 81,920 | ||||
非思考 | 997,952 | - | ||||||
以上模型根据本次请求输入的 Token数采取阶梯计费,其中qwen-flash支持上下文缓存。
单次请求的输入Token数 | 输入价格(每百万Token) | 输出价格(每百万Token) |
0<Token≤128K | $0.022 | $0.216 |
128K<Token≤256K | $0.087 | $0.861 |
256K<Token≤1M | $0.173 | $1.721 |
通义千问Turbo
通义千问Turbo 后续不再更新,建议替换为通义千问Flash。通义千问Flash采用灵活的阶梯定价,计费更合理。使用方法 | API参考 | 在线体验|深度思考
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | ||||||
qwen-turbo 当前与qwen-turbo-2025-04-28能力相同 属于Qwen3系列 | 稳定版 | 思考模式 131,072 非思考模式 1,000,000 | 思考模式 98,304 非思考模式 1,000,000 | 16,384 思维链最长38,912 | $0.05 Batch调用半价 | 思考模式:$0.5 非思考模式:$0.2 Batch调用半价 | 各100万Token 有效期:百炼开通后90天内 |
qwen-turbo-latest 始终与最新快照版能力相同 属于Qwen3系列 | 最新版 | $0.05 | 思考模式:$0.5 非思考模式:$0.2 | ||||
qwen-turbo-2025-04-28 又称qwen-turbo-0428 属于Qwen3系列 | 快照版 | ||||||
qwen-turbo-2024-11-01 又称qwen-turbo-1101 | 1,000,000 | 1,000,000 | 8,192 | $0.2 | |||
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
qwen-turbo 当前与 qwen-turbo-2025-04-28能力相同 属于Qwen3系列 | 稳定版 | 思考模式 131,072 非思考模式 1,000,000 | 思考模式 98,304 非思考模式 1,000,000 | 16,384 思维链最长38,912 | $0.044 | 思考模式 $0.431 非思考模式 $0.087 |
qwen-turbo-latest 始终与最新快照版能力相同 属于Qwen3系列 | 最新版 | |||||
qwen-turbo-2025-07-15 又称qwen-turbo-0715 属于Qwen3系列 | 快照版 | |||||
qwen-turbo-2025-04-28 又称qwen-turbo-0428 属于Qwen3系列 | ||||||
QwQ
基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。使用方法
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||||
qwq-plus | 稳定版 | 131,072 | 98,304 | 32,768 | 8,192 | $0.8 | $2.4 | 100万 Token 有效期:百炼开通后90天内 |
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||||
qwq-plus 当前与qwq-plus-2025-03-05能力相同 | 稳定版 | 131,072 | 98,304 | 32,768 | 8,192 | $0.230 | $0.574 |
qwq-plus-latest 始终与最新快照版能力相同 | 最新版 | ||||||
qwq-plus-2025-03-05 又称qwq-plus-0305 | 快照版 | ||||||
通义千问Long
通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。使用方法 | 在线体验
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
qwen-long-latest 始终与最新快照版能力相同 | 稳定版 | 10,000,000 | 10,000,000 | 32,768 | $0.072 | $0.287 |
qwen-long-2025-01-25 又称qwen-long-0125 | 快照版 | |||||
通义千问Omni
Qwen-Omni 模型能够接收文本、图片、音频、视频等多种模态的组合输入,并生成文本或语音形式的回复, 提供多种高表现力拟人音色,支持多语言和方言的语音输出,可应用于视觉识别、情绪感知、教育培训等音视频聊天场景。使用方法|API 参考
国际(新加坡)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 免费额度 |
(Token数) | |||||||
qwen3-omni-flash 当前与qwen3-omni-flash-2025-09-15能力相同 | 稳定版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | 各100万Token(不区分模态) 有效期:百炼开通后90天内 |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-12-01 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-09-15 又称qwen3-omni-flash-0915 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
免费额度用完后,输入与输出的计费规则如下,思考模式和非思考模式的计费相同,且思考模式下不支持输出音频。
|
|
中国大陆(北京)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 免费额度 |
(Token数) | |||||||
qwen3-omni-flash 当前与qwen3-omni-flash-2025-09-15能力相同 | 稳定版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | 无免费额度 |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-12-01 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
qwen3-omni-flash-2025-09-15 又称qwen3-omni-flash-0915 | 快照版 | 思考模式 | 65,536 | 16,384 | 32,768 | 16,384 | |
非思考模式 | 49,152 | - | |||||
免费额度用完后,输入与输出的计费规则如下,思考模式和非思考模式的计费相同,且思考模式下不支持输出音频。
|
|
建议优先使用Qwen3-Omni-Flash模型,相较于Qwen-Omni-Turbo(后续不再更新),模型的能力得到大幅提升:
属于混合思考模型,支持思考模式和非思考模式,可通过
enable_thinking参数实现两种模式的切换,默认不开启思考模式。思考模式下不支持输出音频;在非思考模式下,对于模型输出的音频:
qwen3-omni-flash-2025-12-01支持的音色增加至49种,qwen3-omni-flash-2025-09-15、qwen3-omni-flash支持的音色增加至 17 种,Qwen-Omni-Turbo 仅支持 4 种;
支持语言增加至 10 种,Qwen-Omni-Turbo 仅支持 2 种。
通义千问Omni-Realtime
相比于通义千问Omni,支持音频的流式输入,且内置 VAD(Voice Activity Detection,语音活动检测)功能,可自动检测用户语音的开始和结束。使用方法|客户端事件|服务端事件
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 免费额度 |
(Token数) | |||||
qwen3-omni-flash-realtime 当前能力等同 qwen3-omni-flash-realtime-2025-09-15 | 稳定版 | 65,536 | 49,152 | 16,384 | 各100万Token(不区分模态) 有效期:百炼开通后90天内 |
qwen3-omni-flash-realtime-2025-12-01 | 快照版 | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
免费额度用完后,输入与输出的计费规则如下:
|
|
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 免费额度 |
(Token数) | |||||
qwen3-omni-flash-realtime 当前能力等同 qwen3-omni-flash-realtime-2025-09-15 | 稳定版 | 65,536 | 49,152 | 16,384 | 无免费额度 |
qwen3-omni-flash-realtime-2025-12-01 | 快照版 | ||||
qwen3-omni-flash-realtime-2025-09-15 | |||||
免费额度用完后,输入与输出的计费规则如下:
|
|
建议优先使用Qwen3-Omni-Flash-Realtime 模型,相较于Qwen-Omni-Turbo-Realtime(后续不再更新),模型的能力得到大幅提升。对于模型输出的音频:
qwen3-omni-flash-realtime-2025-12-01支持的音色增加至49种,qwen3-omni-flash-realtime-2025-09-15、qwen3-omni-realtime-flash支持的音色增加至 17 种,Qwen-Omni-Turbo-Realtime 仅支持 4 种
支持的语言增加至 10 种,Qwen-Omni-Turbo-Realtime 仅支持 2 种
QVQ
QVQ是视觉推理模型,支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。使用方法 | 在线体验
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||||
qvq-max 当前与 qvq-max-2025-03-25能力相同 | 稳定版 | 131,072 | 106,496 单图最大16384 | 16,384 | 8,192 | $1.2 | $4.8 | 各100万 Token 有效期:百炼开通后90天内 |
qvq-max-latest 始终与最新快照版能力相同 | 最新版 | |||||||
qvq-max-2025-03-25 又称qvq-max-0325 | 快照版 | |||||||
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||||
qvq-max 相比 qvq-plus 具有更强的视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。 当前与qvq-max-2025-03-25能力相同 | 稳定版 | 131,072 | 106,496 单图最大16384 | 16,384 | 8,192 | $1.147 | $4.588 |
qvq-max-latest 始终与最新快照版能力相同 | 最新版 | ||||||
qvq-max-2025-05-15 又称qvq-max-0515 | 快照版 | ||||||
qvq-max-2025-03-25 又称qvq-max-0325 | |||||||
qvq-plus 当前与qvq-plus-2025-05-15能力相同 | 稳定版 | $0.287 | $0.717 | ||||
qvq-plus-latest 始终与最新快照版能力相同 | 最新版 | ||||||
qvq-plus-2025-05-15 又称qvq-plus-0515 | 快照版 | ||||||
通义千问VL
通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。如何使用 | API参考 | 在线体验
通义千问VL模型按输入和输出的总Token数进行计费。图像Token的计算规则视觉理解。
国际(新加坡)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 输入成本 | 输出成本 思维链+输出 | 免费额度 |
(Token数) | (每百万Token) | ||||||||
qwen3-vl-plus 当前与qwen3-vl-plus-2025-09-23能力相同 | 稳定版 | 思考 | 262,144 | 258,048 单图最大16384 | 81,920 | 32,768 | 阶梯计价,请参见表格下方说明。 | 各100万Token 有效期:百炼开通后90天内 | |
非思考 | 260,096 单图最大16384 | - | |||||||
qwen3-vl-plus-2025-09-23 | 快照版 | 思考 | 258,048 单图最大16384 | 81,920 | |||||
非思考 | 260,096 单图最大16384 | - | |||||||
qwen3-vl-flash 当前与qwen3-vl-flash-2025-10-15能力相同 | 稳定版 | 思考 | 258,048 单图最大16384 | 81,920 | |||||
非思考 | 260,096 单图最大16384 | - | |||||||
qwen3-vl-flash-2025-10-15 | 快照版 | 思考 | 258,048 单图最大16384 | 81,920 | |||||
非思考 | 260,096 单图最大16384 | - | |||||||
以上模型根据本次请求输入的 Token数,采取阶梯计费。思考模式与非思考模式的输入输出价格相同。
qwen3-vl-plus系列
单次请求的输入Token数 | 输入价格(每百万Token) | 输出价格(每百万Token) |
0<Token≤32K | $0.2 | $1.6 |
32K<Token≤128K | $0.3 | $2.4 |
128K<Token≤256K | $0.6 | $4.8 |
qwen3-vl-flash系列
单次请求的输入Token数 | 输入价格(每百万Token) | 输出价格(每百万Token) |
0<Token≤32K | $0.05 | $0.4 |
32K<Token≤128K | $0.075 | $0.6 |
128K<Token≤256K | $0.12 | $0.96 |
中国大陆(北京)
模型名称 | 版本 | 模式 | 上下文长度 | 最大输入 | 最长思维链 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | ||||||||
qwen3-vl-plus 当前与qwen3-vl-plus-2025-09-23能力相同 | 稳定版 | 思考 | 262,144 | 258,048 单图最大16384 | 81,920 | 32,768 | 阶梯计价,请参见表格下方说明。 | 无免费额度 | |
非思考 | 260,096 单图最大16384 | - | |||||||
qwen3-vl-plus-2025-09-23 | 快照版 | 思考 | 258,048 单图最大16384 | 81,920 | |||||
非思考 | 260,096 单图最大16384 | - | |||||||
qwen3-vl-flash 当前与qwen3-vl-flash-2025-10-15能力相同 | 稳定版 | 思考 | 258,048 单图最大16384 | 81,920 | |||||
非思考 | 260,096 单图最大16384 | - | |||||||
qwen3-vl-flash-2025-10-15 | 快照版 | 思考 | 258,048 单图最大16384 | 81,920 | |||||
非思考 | 260,096 单图最大16384 | - | |||||||
以上模型根据本次请求输入的 Token数,采取阶梯计费。思考模式与非思考模式的输入输出价格相同。
qwen3-vl-plus系列
单次请求的输入Token数 | 输入价格(每百万Token) | 输出价格(每百万Token) |
0<Token≤32K | $0.143353 | $1.433525 |
32K<Token≤128K | $0.215029 | $2.150288 |
128K<Token≤256K | $0.430058 | $4.300576 |
qwen3-vl-flash系列
单次请求的输入Token数 | 输入价格(每百万Token) | 输出价格(每百万Token) |
0<Token≤32K | $0.022 | $0.215 |
32K<Token≤128K | $0.043 | $0.43 |
128K<Token≤256K | $0.086 | $0.859 |
通义千问OCR
通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考|在线体验
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入单价 | 输出单价 | 免费额度 |
(Token数) | (每百万Token) | ||||||
qwen-vl-ocr | 稳定版 | 34,096 | 30,000 单图最大30000 | 4096 | $0.72 | $0.72 | 各100万Token 有效期:百炼开通后90天内 |
qwen-vl-ocr-2025-11-20 又称qwen-vl-ocr-1120 基于Qwen3-VL架构,大幅提升文档解析、文字定位能力。 | 快照版 | 38,192 | 8,192 | $0.07 | $0.16 | ||
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入单价 | 输出单价 | 免费额度 |
(Token数) | (每百万Token) | ||||||
qwen-vl-ocr 当前与qwen-vl-ocr-2025-08-28能力相同 | 稳定版 | 34,096 | 30,000 单图最大30000 | 4,096 | $0.717 | $0.717 | 无免费额度 |
qwen-vl-ocr-latest 始终与最新版能力相同 | 最新版 | 38,192 | 8,192 | $0.043 | $0.072 | ||
qwen-vl-ocr-2025-11-20 又称qwen-vl-ocr-1120 基于Qwen3-VL架构,大幅提升文档解析、文字定位能力。 | 快照版 | ||||||
qwen-vl-ocr-2025-08-28 又称qwen-vl-ocr-0828 | 34,096 | 4,096 | $0.717 | $0.717 | |||
qwen-vl-ocr-2025-04-13 又称qwen-vl-ocr-0413 | |||||||
qwen-vl-ocr-2024-10-28 又称qwen-vl-ocr-1028 | |||||||
通义千问数学模型
通义千问数学模型是专门用于数学解题的语言模型。使用方法 | API参考 | 在线体验
仅支持中国大陆(北京)地域。
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
qwen-math-plus 当前与qwen-math-plus-2024-09-19能力相同 | 稳定版 | 4,096 | 3,072 | 3,072 | $0.574 | $1.721 |
qwen-math-plus-latest 始终与最新快照版能力相同 | 最新版 | |||||
qwen-math-plus-2024-09-19 又称qwen-math-plus-0919 | 快照版 | |||||
qwen-math-plus-2024-08-16 又称qwen-math-plus-0816 | ||||||
qwen-math-turbo 当前与qwen-math-turbo-2024-09-19能力相同 | 稳定版 | $0.287 | $0.861 | |||
qwen-math-turbo-latest 始终与最新快照版能力相同 | 最新版 | |||||
qwen-math-turbo-2024-09-19 又称qwen-math-turbo-0919 | 快照版 | |||||
通义千问Coder
通义千问代码模型。最新的 Qwen3-Coder-Plus 系列模型是基于 Qwen3 的代码生成模型,具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程,代码能力卓越的同时兼具通用能力。使用方法 | API参考 | 在线体验
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | ||||||
qwen3-coder-plus 当前与qwen3-coder-plus-2025-07-22能力相同 | 稳定版 | 1,000,000 | 997,952 | 65,536 | 阶梯计价,请参见表格下方说明。 | 各100万Token 有效期:百炼开通后90天内 | |
qwen3-coder-plus-2025-09-23 | 快照版 | ||||||
qwen3-coder-plus-2025-07-22 | 快照版 | ||||||
qwen3-coder-flash 当前与qwen3-coder-flash-2025-07-28能力相同 | 稳定版 | ||||||
qwen3-coder-flash-2025-07-28 | 快照版 | ||||||
上述模型根据本次请求输入的Token数,采取阶梯计费。
qwen3-coder-plus系列
qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 价格如下,其中 qwen3-coder-plus 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。
单次请求的输入Token数 | 输入成本(每百万Token) | 输出成本(每百万Token) |
0<Token≤32K | $1 | $5 |
32K<Token≤128K | $1.8 | $9 |
128K<Token≤256K | $3 | $15 |
256K<Token≤1M | $6 | $60 |
qwen3-coder-flash系列
qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下,其中 qwen3-coder-flash 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。
单次请求的输入Token数 | 输入成本(每百万Token) | 输出成本(每百万Token) |
0<Token≤32K | $0.3 | $1.5 |
32K<Token≤128K | $0.5 | $2.5 |
128K<Token≤256K | $0.8 | $4 |
256K<Token≤1M | $1.6 | $9.6 |
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
qwen3-coder-plus 当前与qwen3-coder-plus-2025-07-22能力相同 | 稳定版 | 1,000,000 | 997,952 | 65,536 | 阶梯计价,请参见表格下方说明。 | |
qwen3-coder-plus-2025-09-23 | 快照版 | |||||
qwen3-coder-plus-2025-07-22 | 快照版 | |||||
qwen3-coder-flash 当前与qwen3-coder-flash-2025-07-28能力相同 | 稳定版 | |||||
qwen3-coder-flash-2025-07-28 | 快照版 | |||||
上述模型根据本次请求输入的Token数,采取阶梯计费。
qwen3-coder-plus系列
qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 价格如下,其中 qwen3-coder-plus 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。
单次请求的输入Token数 | 输入成本(每百万Token) | 输出成本(每百万Token) |
0<Token≤32K | $0.574 | $2.294 |
32K<Token≤128K | $0.861 | $3.441 |
128K<Token≤256K | $1.434 | $5.735 |
256K<Token≤1M | $2.868 | $28.671 |
qwen3-coder-flash系列
qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下,其中 qwen3-coder-flash 支持上下文缓存,命中隐式缓存的输入文本按单价的 20% 计费,命中显式缓存的输入文本按单价的 10% 计费。
单次请求的输入Token数 | 输入成本(每百万Token) | 输出成本(每百万Token) |
0<Token≤32K | $0.144 | $0.574 |
32K<Token≤128K | $0.216 | $0.861 |
128K<Token≤256K | $0.359 | $1.434 |
256K<Token≤1M | $0.717 | $3.584 |
通义千问翻译模型
基于 Qwen 3全面升级的旗舰级翻译大模型,支持92个语种(包括中、英、日、韩、法、西、德、泰、印尼、越、阿等)互译,模型性能和翻译效果全面升级,提供更稳定的术语定制、格式还原度、领域提示能力,让译文更精准、自然。使用方法
国际(新加坡)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||
qwen-mt-plus 属于Qwen3-MT | 16,384 | 8,192 | 8,192 | $2.46 | $7.37 | 各100万Token 有效期:百炼开通后90天内 |
qwen-mt-flash 属于Qwen3-MT | $0.16 | $0.49 | ||||
qwen-mt-lite 属于Qwen3-MT | $0.12 | $0.36 | ||||
qwen-mt-turbo 属于Qwen3-MT | $0.16 | $0.49 | ||||
中国大陆(北京)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qwen-mt-plus 属于Qwen3-MT | 16,384 | 8,192 | 8,192 | $0.259 | $0.775 |
qwen-mt-flash 属于Qwen3-MT | $0.101 | $0.280 | |||
qwen-mt-lite 属于Qwen3-MT | $0.086 | $0.229 | |||
qwen-mt-turbo 属于Qwen3-MT | $0.101 | $0.280 | |||
通义千问数据挖掘模型
通义千问数据挖掘模型可以提取文档中的结构化信息并用于数据标注和内容审核等领域。使用方法 | API参考
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||
qwen-doc-turbo | 262,144 | 253,952 | 32,768 | $0.087 | $0.144 | 无免费额度 |
通义千问深入研究模型
通义千问深入研究模型可以拆解复杂问题,结合互联网搜索进行推理分析并生成研究报告。使用方法 | API参考
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每千Token) | ||||
qwen-deep-research | 1,000,000 | 997,952 | 32,768 | $0.007742 | $0.023367 |
文本生成-通义千问-开源版
模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。
百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen3和Qwen2.5模型。
Qwen3
2025 年 9月发布的 qwen3-next-80b-a3b-thinking 仅支持思考模式,相较于qwen3-235b-a22b-thinking-2507提升了指令遵循能力,总结回复更加精简。
2025 年 9月发布的 qwen3-next-80b-a3b-instruct 仅支持非思考模式,相较于qwen3-235b-a22b-instruct-2507增强了中文理解、逻辑推理及文本生成能力。
2025 年 7月发布的 qwen3-235b-a22b-thinking-2507、qwen3-30b-a3b-thinking-2507 模型仅支持思考模式,是qwen3-235b-a22b(思考模式)与qwen3-30b-a3b (思考模式)的升级版。
2025 年 7月发布的 qwen3-235b-a22b-instruct-2507、qwen3-30b-a3b-instruct-2507 模型仅支持非思考模式,是qwen3-235b-a22b(非思考模式)与qwen3-30b-a3b (非思考模式)的升级版。
2025 年 4月发布的 Qwen3 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,Qwen3 模型的能力得到了大幅提升:
推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。
人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。
Agent 能力:在推理、非推理两种模式下都达到业界领先水平,能够实现精准的外部工具调用。
多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。
回复格式问题修复:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。
2025 年 4月发布的Qwen3 开源模型在思考模式下不支持非流式输出方式。
Qwen3 开源模型开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。
国际(新加坡)
模型名称 | 模式 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||||
qwen3-next-80b-a3b-thinking | 仅支持思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.15 | $1.2 | 各100万 Token 有效期:百炼开通后90天内 |
qwen3-next-80b-a3b-instruct | 不支持思考模式 | 129,024 | - | |||||
qwen3-235b-a22b-thinking-2507 | 仅支持思考模式 | 126,976 | 81,920 | $0.23 | $2.3 | |||
qwen3-235b-a22b-instruct-2507 | 不支持思考模式 | 129,024 | - | $0.92 | ||||
qwen3-30b-a3b-thinking-2507 | 仅支持思考模式 | 126,976 | 81,920 | $0.2 | $2.4 | |||
qwen3-30b-a3b-instruct-2507 | 不支持思考模式 | 129,024 | - | $0.8 | ||||
qwen3-235b-a22b 本模型与以下模型均于2025 年 4月发布 | 非思考 | 129,024 | - | 16,384 | $0.7 | $2.8 | ||
思考 | 98,304 | 38,912 | $8.4 | |||||
qwen3-32b | 非思考 | 129,024 | - | $0.16 | $0.64 | |||
思考 | 98,304 | 38,912 | ||||||
qwen3-30b-a3b | 非思考 | 129,024 | - | $0.2 | $0.8 | |||
思考 | 98,304 | 38,912 | $2.4 | |||||
qwen3-14b | 非思考 | 129,024 | - | 8,192 | $0.35 | $1.4 | ||
思考 | 98,304 | 38,912 | $4.2 | |||||
qwen3-8b | 非思考 | 129,024 | - | $0.18 | $0.7 | |||
思考 | 98,304 | 38,912 | $2.1 | |||||
qwen3-4b | 非思考 | 129,024 | - | $0.11 | $0.42 | |||
思考 | 98,304 | 38,912 | $1.26 | |||||
qwen3-1.7b | 非思考 | 32,768 | 30,720 | - | $0.42 | |||
思考 | 28,672 | 与输入相加不超过30,720 | $1.26 | |||||
qwen3-0.6b | 非思考 | 30,720 | - | $0.42 | ||||
思考 | 28,672 | 与输入相加不超过30,720 | $1.26 | |||||
中国大陆(北京)
模型名称 | 模式 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||||
qwen3-next-80b-a3b-thinking | 仅思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.144 | $1.434 |
qwen3-next-80b-a3b-instruct | 仅非思考模式 | 129,024 | - | $0.574 | |||
qwen3-235b-a22b-thinking-2507 | 仅思考模式 | 126,976 | 81,920 | $0.287 | $2.868 | ||
qwen3-235b-a22b-instruct-2507 | 仅非思考模式 | 129,024 | - | $1.147 | |||
qwen3-30b-a3b-thinking-2507 | 仅思考模式 | 126,976 | 81,920 | $0.108 | $1.076 | ||
qwen3-30b-a3b-instruct-2507 | 仅非思考模式 | 129,024 | - | $0.431 | |||
qwen3-235b-a22b | 非思考 | 129,024 | - | 16,384 | $0.287 | $1.147 | |
思考 | 98,304 | 38,912 | $2.868 | ||||
qwen3-32b | 非思考 | 129,024 | - | $0.287 | $1.147 | ||
思考 | 98,304 | 38,912 | $2.868 | ||||
qwen3-30b-a3b | 非思考 | 129,024 | - | $0.108 | $0.431 | ||
思考 | 98,304 | 38,912 | $1.076 | ||||
qwen3-14b | 非思考 | 129,024 | - | 8,192 | $0.144 | $0.574 | |
思考 | 98,304 | 38,912 | $1.434 | ||||
qwen3-8b | 非思考 | 129,024 | - | $0.072 | $0.287 | ||
思考 | 98,304 | 38,912 | $0.717 | ||||
qwen3-4b | 非思考 | 129,024 | - | $0.044 | $0.173 | ||
思考 | 98,304 | 38,912 | $0.431 | ||||
qwen3-1.7b | 非思考 | 32,768 | 30,720 | - | $0.173 | ||
思考 | 28,672 | 与输入相加不超过30,720 | $0.431 | ||||
qwen3-0.6b | 非思考 | 30,720 | - | $0.173 | |||
思考 | 28,672 | 与输入相加不超过30,720 | $0.431 | ||||
QwQ-开源版
基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法|API 参考
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
qwq-32b | 131,072 | 98,304 | 32,768 | 8,192 | $0.287 | $0.861 |
QwQ-Preview
qwq-32b-preview 模型是由 Qwen 团队于2024年开发的实验性研究模型,专注于增强 AI 推理能力,尤其是数学和编程领域。qwq-32b-preview 模型的局限性请参见QwQ官方博客。使用方法 | API参考|在线体验
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qwq-32b-preview | 32,768 | 30,720 | 16,384 | $0.287 | $0.861 |
Qwen2.5
QVQ
qvq-72b-preview模型是由 Qwen 团队开发的实验性研究模型,专注于提升视觉推理能力,尤其在数学推理领域。qvq-72b-preview模型的局限性请参见QVQ官方博客。使用方法 | API参考
如果希望模型先输出思考过程再输出回答内容,请使用商业版模型QVQ。
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qvq-72b-preview | 32,768 | 16,384 单图最大16384 | 16,384 | $1.721 | $5.161 |
Qwen-Omni
基于Qwen2.5训练的全新多模态理解生成大模型,支持文本、图像、语音、视频输入理解,具备文本和语音同时流式生成的能力,多模态内容理解速度显著提升。使用方法|API 参考
国际(新加坡)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 免费额度 |
(Token数) | ||||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 | 100万Token(不区分模态) 有效期:百炼开通后90天内 |
免费额度用完后,输入与输出的计费规则如下:
|
|
中国大陆(北京)
模型名称 | 上下文长度 | 最大输入 | 最大输出 |
(Token数) | |||
qwen2.5-omni-7b | 32,768 | 30,720 | 2,048 |
输入与输出的计费规则如下:
|
|
Qwen3-Omni-Captioner
Qwen3-Omni-Captioner以通义千问3-Omni为基座的开源模型,无需任何提示,自动为复杂语音、环境声、音乐、影视声效等生成精准、全面的描述,能识别说话人情绪、音乐元素(如风格、乐器)、敏感信息等,适用于音频内容分析、安全审核、意图识别、音频剪辑等多个领域。使用方法|API 参考
国际(新加坡)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||
qwen3-omni-30b-a3b-captioner | 65,536 | 32,768 | 32,768 | $3.81 | $3.06 | 100万Token 有效期:阿里云百炼开通后90天内 |
中国大陆(北京)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | (每百万Token) | |||||
qwen3-omni-30b-a3b-captioner | 65,536 | 32,768 | 32,768 | $2.265 | $1.821 | 无免费额度 |
Qwen-VL
相较于Qwen2.5-VL,Qwen3-VL模型能力有极大提升:
智能体交互:可操作电脑或手机界面,识别 GUI 元素、理解功能、调用工具执行任务,在 OS World 等评测中达到顶尖水平。
视觉编码:可通过图像或视频生成代码,用于将设计图、网站截图等生成HTML、CSS、JS 代码。
空间感知:支持二维和三维定位,精准判断物体方位、视角变化、遮挡关系。
长视频理解:支持长达20分钟的视频内容理解,并能精确定位到秒级时刻。
深度思考:具有深度思考能力, 擅长捕捉细节、分析因果,在 MathVista、MMMU 等评测中达到顶尖水平。
文字识别:支持语言扩展至 33种,在复杂光线、模糊、倾斜等场景下表现更稳定;显著提升生僻字、古籍字、专业术语的识别准确率。
国际(新加坡)
模型名称 | 模式 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 思维链+输出 | 免费额度 |
(Token数) | (每百万Token) | |||||||
qwen3-vl-235b-a22b-thinking | 仅思考模式 | 126,976 | 81,920 | $0.4 | $4 | 各100万 Token 有效期:百炼开通后90天内 | ||
qwen3-vl-235b-a22b-instruct | 仅非思考模式 | 129,024 | - | $1.6 | ||||
qwen3-vl-32b-thinking | 仅思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.16 | $0.64 | |
qwen3-vl-32b-instruct | 仅非思考模式 | 129,024 | - | |||||
qwen3-vl-30b-a3b-thinking | 仅思考模式 | 126,976 | 81,920 | $0.2 | $2.4 | |||
qwen3-vl-30b-a3b-instruct | 仅非思考模式 | 129,024 | - | $0.8 | ||||
qwen3-vl-8b-thinking | 仅思考模式 | 126,976 | 81,920 | $0.18 | $2.1 | |||
qwen3-vl-8b-instruct | 仅非思考模式 | 129,024 | - | $0.7 | ||||
中国大陆(北京)
模型名称 | 模式 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 思维链+输出 | 免费额度 |
(Token数) | (每百万Token) | |||||||
qwen3-vl-235b-a22b-thinking | 仅思考模式 | 131,072 | 126,976 | 81,920 | $0.286705 | $2.867051 | 无免费额度 | |
qwen3-vl-235b-a22b-instruct | 仅非思考模式 | 129,024 | - | $1.146820 | ||||
qwen3-vl-32b-thinking | 仅思考模式 | 131,072 | 126,976 | 81,920 | 32,768 | $0.287 | $2.868 | |
qwen3-vl-32b-instruct | 仅非思考模式 | 129,024 | - | $1.147 | ||||
qwen3-vl-30b-a3b-thinking | 仅思考模式 | 126,976 | 81,920 | $0.108 | $1.076 | |||
qwen3-vl-30b-a3b-instruct | 仅非思考模式 | 129,024 | - | $0.431 | ||||
qwen3-vl-8b-thinking | 仅思考模式 | 126,976 | 81,920 | $0.072 | $0.717 | |||
qwen3-vl-8b-instruct | 仅非思考模式 | 129,024 | - | $0.287 | ||||
Qwen-Math
基于Qwen模型构建的专门用于数学解题的语言模型。Qwen2.5-Math支持中文和英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API参考 | 在线体验
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qwen2.5-math-72b-instruct | 4,096 | 3,072 | 3,072 | $0.574 | $1.721 |
qwen2.5-math-7b-instruct | $0.144 | $0.287 | |||
qwen2.5-math-1.5b-instruct | 限时免费 | ||||
Qwen-Coder
通义千问代码模型开源版。最新的 Qwen3-Coder系列具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程、代码能力卓越的同时兼具通用能力。使用方法 | API参考
国际(新加坡)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 免费额度 |
(Token数) | ||||||
qwen3-coder-480b-a35b-instruct | 262,144 | 204,800 | 65,536 | 阶梯计价,请参见表格下方说明。 | 各100万Token 有效期:百炼开通后90天内 | |
qwen3-coder-30b-a3b-instruct | ||||||
qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数,采取阶梯计费。
模型名称 | 单次请求的输入 Token 数 | 输入成本(每百万Token) | 输出成本(每百万Token) |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $1.5 | $7.5 |
32K<Token≤128K | $2.7 | $13.5 | |
128K<Token≤200K | $4.5 | $22.5 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0.45 | $2.25 |
32K<Token≤128K | $0.75 | $3.75 | |
128K<Token≤200K | $1.2 | $6 |
中国大陆(北京)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qwen3-coder-480b-a35b-instruct | 262,144 | 204,800 | 65,536 | 阶梯计价,请参见表格下方说明。 | |
qwen3-coder-30b-a3b-instruct | |||||
qwen2.5-coder-32b-instruct | 131,072 | 129,024 | 8,192 | $0.287 | $0.861 |
qwen2.5-coder-14b-instruct | |||||
qwen2.5-coder-7b-instruct | $0.144 | $0.287 | |||
qwen2.5-coder-3b-instruct | 32,768 | 30,720 | 限时免费体验 | ||
qwen2.5-coder-1.5b-instruct | |||||
qwen2.5-coder-0.5b-instruct | |||||
qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数,采取阶梯计费。
模型名称 | 单次请求的输入 Token 数 | 输入成本(每百万Token) | 输出成本(每百万Token) |
qwen3-coder-480b-a35b-instruct | 0<Token≤32K | $0.861 | $3.441 |
32K<Token≤128K | $1.291 | $5.161 | |
128K<Token≤200K | $2.151 | $8.602 | |
qwen3-coder-30b-a3b-instruct | 0<Token≤32K | $0.216 | $0.861 |
32K<Token≤128K | $0.323 | $1.291 | |
128K<Token≤200K | $0.538 | $2.151 |
文本生成-第三方模型
DeepSeek
DeepSeek 是由深度求索公司推出的大语言模型。API参考|在线体验
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
deepseek-v3.2 685B 满血版 | 131,072 | 98,304 | 32,768 | 65,536 | $0.287 | $0.431 |
deepseek-v3.2-exp 685B 满血版 | ||||||
deepseek-v3.1 685B 满血版 | $0.574 | $1.721 | ||||
deepseek-r1 685B 满血版 | 16,384 | $2.294 | ||||
deepseek-r1-0528 685B 满血版 | ||||||
deepseek-v3 671B 满血版 | 131,072 | 不涉及 | $0.287 | $1.147 | ||
deepseek-r1-distill-qwen-1.5b 基于 Qwen2.5-Math-1.5B | 32,768 | 32,768 | 16,384 | 16,384 | 限时免费体验 | |
deepseek-r1-distill-qwen-7b 基于 Qwen2.5-Math-7B | $0.072 | $0.144 | ||||
deepseek-r1-distill-qwen-14b 基于 Qwen2.5-14B | $0.144 | $0.431 | ||||
deepseek-r1-distill-qwen-32b 基于 Qwen2.5-32B | $0.287 | $0.861 | ||||
deepseek-r1-distill-llama-8b 基于 Llama-3.1-8B | 限时免费体验 | |||||
deepseek-r1-distill-llama-70b 基于 Llama-3.3-70B | ||||||
Kimi
Kimi-K2 是由月之暗面公司推出的大语言模型,具有卓越的编码和工具调用能力。使用方法|在线体验
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大思维链长度 | 最大回复长度 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | |||||
kimi-k2-thinking | 262,144 | 229,376 | 32,768 | 16,384 | $0.574 | $2.294 |
Moonshot-Kimi-K2-Instruct | 131,072 | 131,072 | - | 8,192 | $0.574 | $2.294 |
图像生成
通义千问文生图
通义千问文生图模型在复杂文本渲染方面表现突出,特别是中英文文本渲染。当前qwen-image-plus与qwen-image能力相同,但qwen-image-plus价格更优惠。API参考
国际(新加坡)
模型名称 | 单价 | 免费额度 |
qwen-image-plus | $0.03/张 | 免费额度:各100张 有效期:阿里云百炼开通后90天内 |
qwen-image | $0.035/张 |
中国大陆(北京)
模型名称 | 单价 | 免费额度 |
qwen-image-plus | $0.028671/张 | 无免费额度 |
qwen-image | $0.035/张 |
输入提示词 | 输出图像 |
Healing-style hand-drawn poster featuring three puppies playing with a ball on lush green grass, adorned with decorative elements such as birds and stars. The main title “Come Play Ball!” is prominently displayed at the top in bold, blue cartoon font. Below it, the subtitle “Come [Show Off Your Skills]!” appears in green font. A speech bubble adds playful charm with the text: “Hehe, watch me amaze my little friends next!” At the bottom, supplementary text reads: “We get to play ball with our friends again!” The color palette centers on fresh greens and blues, accented with bright pink and yellow tones to highlight a cheerful, childlike atmosphere. |
|
通义千问图像编辑
通义千问图像编辑模型支持精准的中英双语文字编辑、调色、细节增强、风格迁移、增删物体、改变位置和动作等操作,可实现复杂的图文编辑。API参考
国际(新加坡)
模型名称 | 计费单价 | 免费额度 |
qwen-image-edit-plus 当前与qwen-image-edit-plus-2025-10-30能力相同 | $0.03/张 | 免费额度:各100张 有效期:阿里云百炼开通后90天内 |
qwen-image-edit-plus-2025-10-30 | $0.03/张 | |
qwen-image-edit | $0.045/张 |
中国大陆(北京)
模型名称 | 计费单价 | 免费额度 |
qwen-image-edit-plus 当前与qwen-image-edit-plus-2025-10-30能力相同 | $0.028671/张 | 无免费额度 |
qwen-image-edit-plus-2025-10-30 | $0.028671/张 | |
qwen-image-edit | $0.043/张 |
原图 |
将图中的人物改为站立姿势,弯腰握住狗的前爪 |
原图 |
将字母块上的单词'HEALTH INSURANCE’ 替换为'明天会更好' |
原图 |
用浅蓝色衬衫替换圆点衬衫 |
原图 |
将图中背景改为南极 |
原图 |
生成人物的卡通头像 |
原图 |
删除餐盘上的头发 |
通义千问图像翻译
通义千问图像翻译模型支持将11种语言图片的文字翻译成中文或英文,能精准保留原始排版与内容信息,并提供术语定义、敏感词过滤、图像主体检测等自定义功能。API参考
仅支持中国大陆(北京)地域。
模型名称 | 单价 | 免费额度 |
qwen-mt-image | $0.000431/张 | 无免费额度 |
原图 |
日语 |
葡语 |
阿拉伯语 |
通义万相文生图
通义万相-文生图模型通过文本即可生成精美的图片。API参考 | 在线体验
国际(新加坡)
模型名称 | 说明 | 单价 | 免费额度(注) 有效期:阿里云百炼开通后90天内 |
wan2.6-t2i | 万相2.6。支持新增的同步接口,同时支持在总像素面积与宽高比约束内,自由选尺寸。 | $0.03/张 | 50张 |
wan2.5-t2i-preview | 万相2.5 preview。取消单边限制,在总像素面积与宽高比约束内,自由选尺寸。 | $0.03/张 | 50张 |
wan2.2-t2i-plus | 万相2.2专业版。在创意性、稳定性、写实质感上全面升级。 | $0.05/张 | 100张 |
wan2.2-t2i-flash | 万相2.2极速版。在创意性、稳定性、写实质感上全面升级。 | $0.025/张 | 100张 |
wan2.1-t2i-plus | 万相2.1专业版。支持多种风格,生成图像细节丰富。 | $0.05/张 | 200张 |
wan2.1-t2i-turbo | 万相2.1极速版。支持多种风格,生成速度快。 | $0.025/张 | 200张 |
中国大陆(北京)
模型名称 | 说明 | 单价 | 免费额度(注) 有效期:阿里云百炼开通后90天内 |
wan2.6-t2i | 万相2.6。支持新增的同步接口,同时支持在总像素面积与宽高比约束内,自由选尺寸。 | $0.028671/张 | 无免费额度 |
wan2.5-t2i-preview | 万相2.5 preview。取消单边限制,在总像素面积与宽高比约束内,自由选尺寸。 | $0.028671/张 | 无免费额度 |
wan2.2-t2i-plus | 万相2.2专业版。在创意性、稳定性、写实质感上全面升级。 | $0.02007/张 | 无免费额度 |
wan2.2-t2i-flash | 万相2.2极速版。在创意性、稳定性、写实质感上全面升级。 | $0.028671/张 | 无免费额度 |
wanx2.1-t2i-plus | 万相2.1专业版。支持多种风格,生成图像细节丰富。 | $0.028671/张 | 无免费额度 |
wanx2.1-t2i-turbo | 万相2.1极速版。支持多种风格,生成速度快。 | $0.020070/张 | 无免费额度 |
wanx2.0-t2i-turbo | 万相2.0极速版。擅长质感人像与创意设计,性价比高。 | $0.005735/张 | 无免费额度 |
输入提示词 | 输出图像 |
一个用针毡制作的圣诞老人手持礼物,旁边站着一只白色的猫咪,背景中有许多五颜六色的礼物。整个场景应该是可爱、温暖和舒适的,并且背景中还有一些绿色植物。 |
|
通义万相图像生成与编辑2.6
通义万相图像生成模型支持图像编辑、图文混合输出,满足多样化生成与集成需求。API参考
国际(新加坡)
模型名称 | 单价 | 免费额度(注) 有效期:阿里云百炼开通后90天内 |
wan2.6-image | $0.03/张 | 50张 |
中国大陆(北京)
模型名称 | 单价 | 免费额度 |
wan2.6-image | $0.028671/张 | 无免费额度 |
通义万相通用图像编辑2.5
通义万相-通用图像编辑2.5模型支持输入文本、单图或多图实现基于主体一致性的图像编辑、多图融合创作等能力。API参考
国际(新加坡)
模型名称 | 单价 | 免费额度(注) 有效期:阿里云百炼开通后90天内 |
wan2.5-i2i-preview | $0.03/张 | 50张 |
中国大陆(北京)
模型名称 | 单价 | 免费额度 |
wan2.5-i2i-preview | $0.028671/张 | 无免费额度 |
模型功能 | 输入示例 | 输出图像 |
单图编辑 |
|
将花卉连衣裙换成一件复古风格的蕾丝长裙,领口和袖口有精致的刺绣细节。 |
多图融合 |
|
将图1中的闹钟放置到图2的餐桌的花瓶旁边位置 |
通义万相通用图像编辑2.1
通义万相-通用图像编辑模型通过简单的指令即可实现多样化的图像编辑,适用于扩图、去水印、风格迁移、图像修复、图像美化等场景。使用方法 | API参考
仅支持中国大陆(北京)地域。
模型名称 | 计费单价 | 免费额度 |
wanx2.1-imageedit | $0.020070/张 | 无免费额度 |
目前通用图像编辑支持以下功能:
模型功能 | 输入图像 | 输入提示词 | 输出图像 |
全局风格化 |
| 转换成法国绘本风格 |
|
局部风格化 |
| 把房子变成木板风格。 |
|
指令编辑 |
| 把女孩的头发修改为红色。 |
|
局部重绘 | 输入图像
涂抹区域图像(白色为涂抹区域)
| 一只陶瓷兔子抱着一朵陶瓷花。 | 输出图像
|
去文字水印 |
| 去除图像中的文字。 |
|
扩图 |
| 一位绿色仙子。 |
|
图像超分 | 模糊图像
| 图像超分。 | 清晰图像
|
图像上色 |
| 蓝色背景,黄色的叶子。 |
|
线稿生图 |
| 北欧极简风格的客厅。 |
|
垫图 |
| 卡通形象小心翼翼地探出头,窥视着房间内一颗璀璨的蓝色宝石。 |
|
AI试衣
AI试衣-Plus版相较于基础版模型,在图片清晰度、服饰纹理细节和logo还原效果等方面均有提升,但生成耗时较长,适用于对时效性要求不高的场景。API参考 | 在线体验
AI试衣-图片分割支持对模特图、服饰图进行分割,可用于AI试衣图片的前后处理。API参考
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 示例输入 | 示例输出 |
aitryon-plus | AI试衣-Plus版 |
|
|
aitryon-parsing-v1 | AI试衣-图片分割 |
AI试衣计费单价
模型服务 | 模型名称 | 计量单价 | 折扣 | 阶梯层级 |
AI试衣-Plus版 | aitryon-plus | $0.071677/张 | 无 | 无 |
AI试衣-图片分割 | aitryon-parsing-v1 | $0.000574/张 | 无 | 无 |
视频生成-通义万相
文生视频
通义万相-文生视频模型通过一句话即可生成视频,视频呈现丰富的艺术风格及影视级画质。API参考|在线体验
国际(新加坡)
模型名称 | 说明 | 单价 | 免费额度(领取) 有效期:阿里云百炼开通后90天内 |
wan2.6-t2v | 万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。 | 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.5-t2v-preview | 万相2.5 preview。支持自动配音和传入自定义音频文件。 | 480P:$0.05/秒 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.2-t2v-plus | 万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。 | 480P:$0.02/秒 1080P:$0.10/秒 | 50秒 |
wan2.1-t2v-turbo | 万相2.1极速版。生成速度快,表现均衡。 | $0.036/秒 | 200秒 |
wan2.1-t2v-plus | 万相2.1专业版。生成细节丰富,画面更具质感。 | $0.10/秒 | 200秒 |
中国大陆(北京)
模型名称 | 说明 | 单价 | 免费额度 |
wan2.6-t2v | 万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。 | 720P:$0.086012/秒 1080P:0.143353/秒 | 无免费额度 |
wan2.5-t2v-preview | 万相2.5 preview。支持自动配音和传入自定义音频文件。 | 480P:$0.043006/秒 720P:$0.086012/秒 1080P:$0.143353/秒 | 无免费额度 |
wan2.2-t2v-plus | 万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。 | 480P:$0.02007/秒 1080P:$0.100347/秒 | 无免费额度 |
wanx2.1-t2v-turbo | 生成速度更快,表现均衡。 | $0.034405/秒 | 无免费额度 |
wanx2.1-t2v-plus | 生成细节更丰富,画面更具质感。 | $0.100347/秒 | 无免费额度 |
输入示例 | 输出视频(wan2.5) |
输入提示词:Shot from a low angle, in a medium close-up, with warm tones, mixed lighting (the practical light from the desk lamp blends with the overcast light from the window), side lighting, and a central composition. In a classic detective office, wooden bookshelves are filled with old case files and ashtrays. A green desk lamp illuminates a case file spread out in the center of the desk. A fox, wearing a dark brown trench coat and a light gray fedora, sits in a leather chair, its fur crimson, its tail resting lightly on the edge, its fingers slowly turning yellowed pages. Outside, a steady drizzle falls beneath a blue sky, streaking the glass with meandering streaks. It slowly raises its head, its ears twitching slightly, its amber eyes gazing directly at the camera, its mouth clearly moving as it speaks in a smooth, cynical voice: 'The case was cold, colder than a fish in winter. But every chicken has its secrets, and I, for one, intended to find them '. 输入音频: |
图生视频-基于首帧
通义万相-图生视频模型将输入图片作为视频首帧,再根据提示词生成视频。视频呈现丰富的艺术风格及影视级画质。API参考|在线体验
国际(新加坡)
模型名称 | 说明 | 单价 | 免费额度(注) 有效期:阿里云百炼开通后90天内 |
wan2.6-i2v | 万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。 | 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.5-i2v-preview | 万相2.5 preview。支持自动配音和传入自定义音频文件。 | 480P:$0.05/秒 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 |
wan2.2-i2v-flash | 万相2.2极速版。极致生成速度,在画面细节表现、运动稳定性方面均有显著提升。 | 480P:$0.015/秒 720P:$0.036/秒 | 50秒 |
wan2.2-i2v-plus | 万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。 | 480P:$0.02/秒 1080P:$0.10/秒 | 50秒 |
wan2.1-i2v-turbo | 万相2.1极速版。生成速度快,表现均衡。 | $0.036/秒 | 200秒 |
wan2.1-i2v-plus | 万相2.1专业版。生成细节丰富,画面更具质感。 | $0.10/秒 | 200秒 |
中国大陆(北京)
模型名称 | 说明 | 单价 | 免费额度 |
wan2.6-i2v | 万相2.6。新增多镜头叙事能力,同时支持自动配音和传入自定义音频文件。 | 720P:$0.086012/秒 1080P:$0.143353/秒 | 无免费额度 |
wan2.5-i2v-preview | 万相2.5 preview。支持自动配音和传入自定义音频文件。 | 480P:$0.043006/秒 720P:$0.086012/秒 1080P:$0.143353/秒 | 无免费额度 |
wan2.2-i2v-plus | 万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。 | 480P:$0.02007/秒 1080P:$0.100347/秒 | 无免费额度 |
wanx2.1-i2v-turbo | 万相2.1极速版。生成速度快,表现均衡。 | $0.034405/秒 | 无免费额度 |
wanx2.1-i2v-plus | 万相2.1专业版。生成细节丰富,画面更具质感。 | $0.100347/秒 | 无免费额度 |
输入首帧图像和音频 | 输出视频(wan2.6) |
输入音频: | |
输入提示词:一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由他的rap构成,没有其他对话或杂音。 | |
图生视频-基于首尾帧
通义万相-首尾帧生视频模型,只需要提供首帧和尾帧图片,便能根据提示词生成一段丝滑流畅的动态视频。视频呈现丰富的艺术风格及影视级画质。API参考|在线体验
国际(新加坡)
模型名称 | 单价 | 免费额度(注) |
wan2.1-kf2v-plus | $0.10/秒 | 200秒 有效期:百炼开通后90天内 |
中国大陆(北京)
模型名称 | 单价 | 免费额度(注) |
wanx2.1-kf2v-plus | $0.100347/秒 | 无免费额度 |
输入示例 | 输出视频 | ||
首帧图片 | 尾帧图片 | 提示词 | |
|
| 写实风格,一只黑色小猫好奇地看向天空,镜头从平视逐渐上升,最后俯拍小猫好奇的眼神。 | |
参考生视频
通义万相-参考生视频模型支持参考输入视频中的角色形象和音色,搭配提示词生成保持角色一致性的视频。API参考
计费规则:输入视频和输出视频均计费,按视频秒数计费,失败不计费也不占用免费额度。
输入视频的计费时长不超过 5 秒,具体规则参见计费与限流。
输出视频的计费时长为成功生成的视频秒数。
国际(新加坡)
模型名称 | 输入单价 | 输出单价 | 免费额度(注) |
wan2.6-r2v | 720P:$0.10/秒 1080P:$0.15/秒 | 720P:$0.10/秒 1080P:$0.15/秒 | 50秒 有效期:百炼开通后90天内 |
中国大陆(北京)
模型名称 | 输入单价 | 输出单价 | 免费额度(注) |
wan2.6-r2v | 720P:$0.086012/秒 1080P:$0.143353/秒 | 720P:$0.086012/秒 1080P:$0.143353/秒 | 无免费额度 |
通用视频编辑
通义万相-视频编辑统一模型支持多模态输入,包括文本、图像和视频,能够执行视频生成与通用编辑任务。API参考 | 在线体验
国际(新加坡)
模型名称 | 单价 | 免费额度(注) |
wan2.1-vace-plus | $0.1/秒 | 50秒 有效期:百炼开通后90天内 |
中国大陆(北京)
模型名称 | 单价 | 免费额度(注) |
wanx2.1-vace-plus | $0.100347/秒 | 无免费额度 |
视频编辑统一模型支持以下功能:
模型功能 | 输入参考图 | 输入提示词 | 输出视频 |
多图参考 | 参考图1(参考主体)
参考图2(参考背景)
| 视频中,一位女孩自晨雾缭绕的古老森林深处款款走出,她步伐轻盈,镜头捕捉她每一个灵动瞬间。当她站定,环顾四周葱郁林木时,她脸上绽放出惊喜与喜悦交织的笑容。这一幕,定格在了光影交错的瞬间,记录下她与大自然的美妙邂逅。 | 输出视频 |
视频重绘 | 视频展示了一辆黑色的蒸汽朋克风格汽车,绅士驾驶着,车辆装饰着齿轮和铜管。背景是蒸汽驱动的糖果工厂和复古元素,画面复古与趣味 | ||
局部编辑 | 输入视频 输入掩码图像(白色区域表示编辑区域)
| 视频展示了一家巴黎风情的法式咖啡馆,一只穿着西装的狮子优雅地品着咖啡。它一手端着咖啡杯,轻轻啜饮,神情惬意。咖啡馆装饰雅致,柔和的色调与温暖灯光映照着狮子所在的区域。 | 根据提示词修改编辑区域的内容 |
视频延展 | 输入首片段视频(1秒) | 一只戴着墨镜的狗在街道上滑滑板,3D卡通。 | 输出延长后的视频(5秒) |
视频画面扩展 | 一位优雅的女士正在激情演奏小提琴,她身后是一支完整的交响乐团。 |
通义万相-数字人
基于单张人物图片和音频,生成动作自然的说话、唱歌或表演视频。使用时需依次调用下述模型。wan2.2-s2v 图像检测 | wan2.2-s2v 视频生成
仅支持中国大陆(北京)地域。
模型名称 | 模型简介 | 单价 |
wan2.2-s2v-detect | 检查输入图像是否满足要求(如清晰度、单人、正面)。 | $0.000574/张 |
wan2.2-s2v | 根据检测通过的图片和一段音频,生成人物动态视频。 | 480P:$0.071677/秒 720P:$0.129018/秒 |
输入示例 | 输出视频 |
输入音频: |
通义万相-图生动作
提供标准和专业两种服务模式,基于人物图片和参考视频,将视频角色的动作、表情迁移到图片角色中,生成人物动作视频,赋予图片角色动态表现力。API参考
国际(新加坡)
模型名称 | 模型服务 | 服务简介 | 计费单价 | 免费额度(查看) |
wan2.2-animate-move | 标准模式 | 生成速度快,满足基础动画演示等轻需求,性价比高。 | $0.12/秒 | 两种模式共50秒 |
专业模式 | 动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。 | $0.18/秒 |
中国大陆(北京)
模型名称 | 模型服务 | 服务简介 | 计费单价 | 免费额度(查看) |
wan2.2-animate-move | 标准模式 | 生成速度快,满足基础动画演示等轻需求,性价比高。 | $0.06/秒 | 无免费额度 |
专业模式 | 动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。 | $0.09/秒 |
人物图片 | 参考视频 | 输出视频(标准模式) | 输出视频(专业模式) |
|
通义万相-视频换人
提供标准和专业两种服务模式,基于人物图片和参考视频,将视频中的主角替换为图片中的角色,同时保留原视频的场景、光照和色调。API 参考
国际(新加坡)
模型名称 | 模型服务 | 服务简介 | 计费单价 | 免费额度(查看) |
wan2.2-animate-mix | 标准模式 | 生成速度快,满足基础动画演示等轻需求,性价比高。 | $0.18/秒 | 两种服务共50秒 |
专业模式 | 动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。 | $0.26/秒 |
中国大陆(北京)
模型名称 | 模型服务 | 服务简介 | 计费单价 | 免费额度(查看) |
wan2.2-animate-mix | 标准模式 | 生成速度快,满足基础动画演示等轻需求,性价比高。 | $0.09/秒 | 无免费额度 |
专业模式 | 动画流畅度高,动作表情过渡自然,效果更接近真实拍摄。 | $0.13/秒 |
人物图片 | 参考视频 | 输出视频(标准模式) | 输出视频(专业模式) |
|
舞动人像AnimateAnyone
基于人物图片和人物动作模板,生成人物动作视频。直接使用时需依次调用下述三个模型。AnimateAnyone图像检测 API详情 | AnimateAnyone 动作模板生成| AnimateAnyone视频生成API详情
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 单价 |
animate-anyone-detect-gen2 | 检测输入的图片是否符合要求 | $0.000574/张 |
animate-anyone-template-gen2 | 从人物运动视频中提取人物动作并生成动作模板 | $0.011469/秒 |
animate-anyone-gen2 | 基于人物图片和动作模板生成人物动作视频 |
输入:人物图片 | 输入:动作视频 | 输出(按图片背景生成) | 输出(按视频背景生成) |
|
以上示例,由集成了“舞动人像AnimateAnyone”的通义APP生成。
舞动人像AnimateAnyone模型的生成内容为视频画面,不包含音频
悦动人像EMO
基于人物肖像图片和人声音频文件,生成人物肖像动态视频。使用时需依次调用下述模型。EMO 图像检测 | EMO 视频生成
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 单价 |
emo-detect-v1 | 检测输入的图片是否符合要求,不需要部署,可直接调用 | $0.000574/张 |
emo-v1 | 生成人物肖像动态视频,不需要部署,可直接调用 |
|
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
人物肖像:
人声音频:参见右侧视频 | 人物视频: 使用动作风格强度:活泼("style_level": "active") |
灵动人像LivePortrait
基于人物肖像图片和人声音频文件,快速、轻量地生成人物肖像动态视频。与悦动人像EMO模型相比,生成速度快、价格低,但是生成效果不如悦动人像EMO模型。使用时需依次调用下述两个模型。LivePortrait 图像检测 | LivePortrait 视频生成
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 单价 |
liveportrait-detect | 检测输入的图片是否符合要求 | $0.000574/张 |
liveportrait | 生成人物肖像动态视频 | $0.002868/秒 |
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
人物肖像:
人声音频:参见右侧视频 | 人物视频: |
表情包Emoji
基于人脸图片和预设的人脸动态模板,生成人脸动态视频。该能力可用于表情包制作、视频素材生成等场景。使用时需依次调用下述模型。Emoji 图像检测 | Emoji 视频生成
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 单价 |
emoji-detect-v1 | 检测输入图片是否符合要求 | $0.000574/张 |
emoji-v1 | 基于人物肖像图片和指定的表情包模板生成人物同款表情 | $0.011469/秒 |
输入:人物肖像图片 | 输出:人物肖像动态视频 |
| “开心”表情的模板序列:("input.driven_id": "mengwa_kaixin") |
声动人像VideoRetalk
基于人物视频和人声音频,生成人物讲话口型与输入音频相匹配的视频。使用时需调用下述模型。API参考
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 单价 |
videoretalk | 生成人物讲话口型与输入音频相匹配的新视频 | $0.011469/秒 |
视频风格重绘
支持根据用户输入的文字内容,生成符合语义描述的不同风格的视频,或者根据用户输入的视频,进行视频风格重绘。API参考
仅支持中国大陆(北京)地域。
模型名称 | 说明 | 单价 | |
video-style-transform | 将输入视频转换为日式漫画、美式漫画等风格 | 720P | $0.071677/秒 |
540P | $0.028671/秒 | ||
输入视频 | 输出视频(日式漫画) |
语音合成(文本转语音)
通义千问语音合成
支持输入多语种混合文本,并流式输出音频。使用方法|API 参考
国际(新加坡)
模型名称 | 版本 | 单价 | 最大输入字符数 | 支持的语种 | 免费额度(注) |
qwen3-tts-flash 当前能力等同 qwen3-tts-flash-2025-09-18 | 稳定版 | $0.1/万字符 | 600 | 中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 | 2025年11月13日0点前开通阿里云百炼:2000字符 2025年11月13日0点后开通阿里云百炼:1万字符 有效期:阿里云百炼开通后90天内 |
qwen3-tts-flash-2025-11-27 | 快照版 | 1万字符 有效期:阿里云百炼开通后90天内 | |||
qwen3-tts-flash-2025-09-18 | 快照版 | 2025年11月13日0点前开通阿里云百炼:2000字符 2025年11月13日0点后开通阿里云百炼:1万字符 有效期:阿里云百炼开通后90天内 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
中国大陆(北京)
通义千问3-TTS-Flash
模型名称 | 版本 | 单价 | 最大输入字符数 | 支持的语种 |
qwen3-tts-flash 当前能力等同 qwen3-tts-flash-2025-09-18 | 稳定版 | $0.114682/万字符 | 600 | 中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 |
qwen3-tts-flash-2025-11-27 | 快照版 | |||
qwen3-tts-flash-2025-09-18 | 快照版 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
通义千问-TTS
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每千Token) | |||||
qwen-tts 当前与 qwen-tts-2025-04-10 能力相同 | 稳定版 | 8,192 | 512 | 7,680 | $0.230 | $1.434 |
qwen-tts-latest 始终与最新快照版能力相同 | 最新版 | |||||
qwen-tts-2025-05-22 | 快照版 | |||||
qwen-tts-2025-04-10 | ||||||
音频转换为 Token 的规则:每1秒的音频对应 50个 Token 。若音频时长不足1秒,则按 50个 Token 计算。
通义千问实时语音合成
支持文本的流式输入并流式输出音频,具有根据文本内容与标点符号自适应调节语音语速的能力。使用方法 | API参考
通义千问3-TTS-VD-Realtime支持使用声音设计音色进行实时语音合成,但不支持使用默认音色。
通义千问3-TTS-VC-Realtime支持使用声音复刻音色进行实时语音合成,但不支持使用默认音色。
通义千问3-TTS-Flash-Realtime和通义千问-TTS-Realtime仅可使用默认音色,但不支持使用声音复刻/设计音色。
国际(新加坡)
通义千问3-TTS-VD-Realtime
模型名称 | 版本 | 单价 | 支持的语种 | 免费额度(注) |
qwen3-tts-vd-realtime-2025-12-16 | 快照版 | $0.143353/万字符 | 中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 | 1万字符 有效期:阿里云百炼开通后90天内 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
通义千问3-TTS-VC-Realtime
模型名称 | 版本 | 单价 | 支持的语种 | 免费额度(注) |
qwen3-tts-vc-realtime-2025-11-27 | 快照版 | $0.13/万字符 | 中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 | 1万字符 有效期:阿里云百炼开通后90天内 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
通义千问3-TTS-Flash-Realtime
模型名称 | 版本 | 单价 | 支持的语种 | 免费额度(注) |
qwen3-tts-flash-realtime 当前能力等同 qwen3-tts-flash-realtime-2025-09-18 | 稳定版 | $0.13/万字符 | 中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 | 2025年11月13日0点前开通阿里云百炼:2000字符 2025年11月13日0点后开通阿里云百炼:1万字符 有效期:阿里云百炼开通后90天内 |
qwen3-tts-flash-realtime-2025-11-27 | 快照版 | 1万字符 有效期:阿里云百炼开通后90天内 | ||
qwen3-tts-flash-realtime-2025-09-18 | 快照版 | 2025年11月13日0点前开通阿里云百炼:2000字符 2025年11月13日0点后开通阿里云百炼:1万字符 有效期:阿里云百炼开通后90天内 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
中国大陆(北京)
通义千问3-TTS-VD-Realtime
模型名称 | 版本 | 单价 | 支持的语种 |
qwen3-tts-vd-realtime-2025-12-16 | 快照版 | $0.143353/万字符 | 中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
通义千问3-TTS-VC-Realtime
模型名称 | 版本 | 单价 | 支持的语种 |
qwen3-tts-vc-realtime-2025-11-27 | 快照版 | $0.143353/万字符 | 中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
通义千问3-TTS-Flash-Realtime
模型名称 | 版本 | 单价 | 支持的语种 |
qwen3-tts-flash-realtime 当前能力等同 qwen3-tts-flash-realtime-2025-09-18 | 稳定版 | $0.143353/万字符 | 中文(普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语)、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语 |
qwen3-tts-flash-realtime-2025-11-27 | 快照版 | ||
qwen3-tts-flash-realtime-2025-09-18 | 快照版 |
按输入的字符数计费,计算规则如下:
一个汉字(包括简/繁体汉字、日文汉字和韩文汉字) = 2个字符
其他,如一个英文字母、一个标点符号、一个空格 = 1个字符
通义千问-TTS-Realtime
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 | 支持的语种 |
(Token数) | (每千Token) | ||||||
qwen-tts-realtime 当前能力等同 qwen-tts-realtime-2025-07-15 | 稳定版 | 8,192 | 512 | 7,680 | $0.345 | $1.721 | 中文、英文 |
qwen-tts-realtime-latest 当前能力等同 qwen-tts-realtime-2025-07-15 | 最新版 | 中文、英文 | |||||
qwen-tts-realtime-2025-07-15 | 快照版 | 中文、英文 | |||||
音频转换为 Token 的规则:每1秒的音频对应 50个 Token 。若音频时长不足1秒,则按 50个 Token 计算。
通义千问声音复刻
声音复刻依托大模型进行特征提取,无需训练即可复刻声音。仅需提供 10~20 秒的音频,即可生成高度相似且听感自然的定制音色。使用方法 | API参考
国际(新加坡)
模型名称 | 单价 | 免费额度(注) |
qwen-voice-enrollment | $0.01/音色 | 1000个音色 有效期:阿里云百炼开通后90天内 |
中国大陆(北京)
模型名称 | 单价 |
qwen-voice-enrollment | $0.01/音色 |
通义千问声音设计
声音设计通过文本描述生成定制化音色,支持多语言和多维度音色特征定义,适用于广告配音、角色塑造、有声内容创作等多种应用。使用方法 | API参考
国际(新加坡)
模型名称 | 单价 | 免费额度(注) |
qwen-voice-design | $0.2/音色 | 1000个音色 有效期:阿里云百炼开通后90天内 |
中国大陆(北京)
模型名称 | 单价 |
qwen-voice-design | $0.2/音色 |
CosyVoice语音合成
CosyVoice是通义实验室依托大规模预训练语言模型,深度融合文本理解和语音生成的新一代生成式语音合成大模型,支持文本至语音的实时流式合成。使用方法 | API参考
仅支持中国大陆(北京)地域。
模型名称 | 单价 |
cosyvoice-v3-plus | $0.286706/万字符 |
cosyvoice-v3-flash | $0.14335/万字符 |
cosyvoice-v2 | $0.286706/万字符 |
字符计算规则:汉字(包括简/繁体汉字、日文汉字和韩文汉字)按2个字符计算,其他所有字符(如字母、数字、日韩文假名/谚文等)均按 1个字符计算。SSML标签内容不计费。
语音识别(语音转文本)与翻译(语音转成指定语种的文本)
通义千问3-LiveTranslate-Flash
通义千问3-LiveTranslate-Flash-Realtime
qwen3-livetranslate-flash-realtime 是一款多语言音视频实时翻译模型,可识别 18 种语言,并实时翻译为 10 种语言的音频。
核心特性:
多语言支持:支持 18 种语言及 6 种汉语方言。包括中文、英文、法语、德语、俄语、日语、韩语等。支持普通话、粤语、四川话等方言。
视觉增强:利用视觉内容提升翻译准确性。模型通过分析口型、动作和画面中的文字,改善在嘈杂环境下或一词多义场景中的翻译效果。
3秒延迟:实现低至 3 秒的同传延迟。
无损同传:通过语义单元预测技术,解决跨语言语序问题。实时翻译质量接近离线翻译结果。
音色自然:生成音色自然的拟人语音。模型能根据源语音内容,自适应调节语气和情感。
国际(新加坡)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 | 免费额度 |
(Token数) | |||||
qwen3-livetranslate-flash-realtime 当前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22 | 稳定版 | 53,248 | 49,152 | 4,096 | 各100万Token 有效期:阿里云百炼开通后90天内 |
qwen3-livetranslate-flash-realtime-2025-09-22 | 快照版 | ||||
免费额度用完后,输入与输出的计费规则如下:
|
|
Token计算规则:
音频:输入或输出每秒音频均消耗 12.5 Token
图片:每输入 28*28 像素消耗 0.5 Token
中国大陆(北京)
模型名称 | 版本 | 上下文长度 | 最大输入 | 最大输出 |
(Token数) | ||||
qwen3-livetranslate-flash-realtime 当前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22 | 稳定版 | 53,248 | 49,152 | 4,096 |
qwen3-livetranslate-flash-realtime-2025-09-22 | 快照版 | |||
输入与输出的计费规则如下:
|
|
Token计算规则:
音频:输入或输出每秒音频均消耗 12.5 Token
图片:每输入 28*28 像素消耗 0.5 Token
通义千问录音文件识别
基于通义千问多模态基座,支持多语言识别、歌唱识别、噪声拒识等功能。使用方法 | API参考
国际(新加坡)
通义千问3-ASR-Flash-Filetrans
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 单价 | 免费额度(注) |
qwen3-asr-flash-filetrans 当前等同qwen3-asr-flash-filetrans-2025-11-17 | 稳定版 | 中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语 | 任意 | $0.000035/秒 | 36,000秒(10小时) 有效期:阿里云百炼开通后90天内 |
qwen3-asr-flash-filetrans-2025-11-17 | 快照版 |
通义千问3-ASR-Flash
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 单价 | 免费额度(注) |
qwen3-asr-flash 当前等同qwen3-asr-flash-2025-09-08 | 稳定版 | 中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语 | 16kHz | $0.000035/秒 | 36,000秒(10小时) 有效期:阿里云百炼开通后90天内 |
qwen3-asr-flash-2025-09-08 | 快照版 |
中国大陆(北京)
通义千问3-ASR-Flash-Filetrans
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 单价 |
qwen3-asr-flash-filetrans 当前等同qwen3-asr-flash-filetrans-2025-11-17 | 稳定版 | 中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语 | 任意 | $0.000032/秒 |
qwen3-asr-flash-filetrans-2025-11-17 | 快照版 |
通义千问3-ASR-Flash
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 单价 |
qwen3-asr-flash 当前等同qwen3-asr-flash-2025-09-08 | 稳定版 | 中文(普通话、四川话、闽南语、吴语、粤语)、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语 | 16kHz | $0.000032/秒 |
qwen3-asr-flash-2025-09-08 | 快照版 |
通义千问实时语音识别
通义千问实时语音识别大模型具备自动语种识别功能,可识别 11 种语音类型,并能在复杂音频环境下较为准确地转录。使用方法 | API参考
国际(新加坡)
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 单价 | 免费额度(注) |
qwen3-asr-flash-realtime 当前等同qwen3-asr-flash-realtime-2025-10-27 | 稳定版 | 中文(普通话、四川话、闽南语、吴语)、粤语、英语、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语、捷克语、丹麦语、菲律宾语、芬兰语、冰岛语、马来语、挪威语、波兰语、瑞典语 | 8kHz、16kHz | $0.000090/秒 | 36,000秒(10小时) 有效期:阿里云百炼开通后90天内 |
qwen3-asr-flash-realtime-2025-10-27 | 快照版 |
中国大陆(北京)
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 单价 |
qwen3-asr-flash-realtime 当前等同qwen3-asr-flash-realtime-2025-10-27 | 稳定版 | 中文(普通话、四川话、闽南语、吴语)、粤语、英语、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语、捷克语、丹麦语、菲律宾语、芬兰语、冰岛语、马来语、挪威语、波兰语、瑞典语 | 8kHz、16kHz | $0.000047/秒 |
qwen3-asr-flash-realtime-2025-10-27 | 快照版 |
Paraformer语音识别
Paraformer是通义实验室旗下的语音识别模型,提供录音文件识别和实时语音识别两个版本。
录音文件识别
仅支持中国大陆(北京)地域。
模型名称 | 支持的语言 | 支持的采样率 | 适用场景 | 支持的音频格式 | 单价 |
paraformer-v2 | 中文(普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话)、英文、日语、韩语、德语、法语、俄语 | 任意 | 视频直播 | aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv | $0.000012/秒 |
paraformer-8k-v2 | 中文普通话 | 8kHz | 电话语音 |
实时语音识别
仅支持中国大陆(北京)地域。
模型名称 | 支持的语言 | 支持的采样率 | 适用场景 | 支持的音频格式 | 单价 |
paraformer-realtime-v2 | 中文(普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话)、英文、日语、韩语、德语、法语、俄语 支持多个语种自由切换 | 任意 | 视频直播、会议等 | pcm、wav、mp3、opus、speex、aac、amr | $0.000035/秒 |
paraformer-realtime-8k-v2 | 8kHz | 电话客服等 |
Fun-ASR语音识别
Fun-ASR是通义百聆旗下语音识别模型,提供录音文件识别和实时语音识别两个版本。
录音文件识别
国际(新加坡)
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 适用场景 | 支持的音频格式 | 单价 | 免费额度(注) |
fun-asr 当前等同fun-asr-2025-11-07 | 稳定版 | 中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语 | 任意 | 视频直播、电话语音、会议同传等 | aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv | $0.000035/秒 | 36,000秒(10小时) 有效期90天 |
fun-asr-2025-11-07 相较fun-asr-2025-08-25做了远场VAD优化,识别更准 | 快照版 | ||||||
fun-asr-2025-08-25 | 中文(普通话)、英文 | ||||||
fun-asr-mtl 当前等同fun-asr-mtl-2025-08-25 | 稳定版 | 中文(普通话、粤语)、英文、日语、韩语、越南语、印尼语、泰语、马来语、菲律宾语、阿拉伯语、印地语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、爱尔兰语、拉脱维亚语、立陶宛语、马耳他语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语 | |||||
fun-asr-mtl-2025-08-25 | 快照版 |
中国大陆(北京)
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 适用场景 | 支持的音频格式 | 单价 |
fun-asr 当前等同fun-asr-2025-11-07 | 稳定版 | 中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语 | 任意 | 视频直播、电话语音、会议同传等 | aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv | $0.000032/秒 |
fun-asr-2025-11-07 相较fun-asr-2025-08-25做了远场VAD优化,识别更准 | 快照版 | |||||
fun-asr-2025-08-25 | 中文(普通话)、英文 | |||||
fun-asr-mtl 当前等同fun-asr-mtl-2025-08-25 | 稳定版 | 中文(普通话、粤语)、英文、日语、韩语、越南语、印尼语、泰语、马来语、菲律宾语、阿拉伯语、印地语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、爱尔兰语、拉脱维亚语、立陶宛语、马耳他语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语 | ||||
fun-asr-mtl-2025-08-25 | 快照版 |
实时语音识别
国际(新加坡)
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 适用场景 | 支持的音频格式 | 单价 | 免费额度(注) |
fun-asr-realtime 当前等同fun-asr-realtime-2025-11-07 | 稳定版 | 中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语 | 16kHz | 视频直播、会议、电话客服等 | pcm、wav、mp3、opus、speex、aac、amr | $0.00009/秒 | 36,000秒(10小时) 有效期90天 |
fun-asr-realtime-2025-11-07 | 快照版 |
中国大陆(北京)
模型名称 | 版本 | 支持的语言 | 支持的采样率 | 适用场景 | 支持的音频格式 | 单价 |
fun-asr-realtime 当前等同fun-asr-realtime-2025-11-07 | 稳定版 | 中文(普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语;并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等,包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音)、英文、日语 | 16kHz | 视频直播、会议、电话客服等 | pcm、wav、mp3、opus、speex、aac、amr | $0.000047/秒 |
fun-asr-realtime-2025-11-07 相较fun-asr-realtime-2025-09-15做了远场VAD优化,识别更准 | 快照版 | |||||
fun-asr-realtime-2025-09-15 | 中文(普通话)、英文 |
文本向量
文本向量模型用于将文本转换成一组可以代表文字的数字,适用于搜索、聚类、推荐、分类任务。模型根据输入Token数计费。API参考
国际(新加坡)
模型名称 | 向量维度 | 批次大小 | 单批次最大处理Token数(注) | 支持语种 | 单价 (每百万输入Token) | 免费额度 |
text-embedding-v4 属于Qwen3-Embedding系列 | 2,048、1,536、1,024(默认)、768、512、256、128、64 | 10 | 8,192 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言 | $0.07 | 100万Token 有效期:百炼开通后90天内 |
text-embedding-v3 | 1,024(默认)、768或512 | 10 | 8,192 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+语种 | 50万Token 有效期:百炼开通后90天内 |
中国大陆(北京)
模型名称 | 向量维度 | 批次大小 | 单批次最大处理Token数(注) | 支持语种 | 单价 (每百万输入Token) | 免费额度 |
text-embedding-v4 属于Qwen3-Embedding系列 | 2,048、1,536、1,024(默认)、768、512、256、128、64 | 10 | 8,192 | 中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言 | $0.072 | 无免费额度 |
批次大小指单次API调用中能处理的文本数量上限。例如,text-embedding-v4的批次大小为10,意味着一次请求最多可传入10个文本进行向量化,且每个文本不得超过 8192 个Token。这个限制适用于:
字符串数组输入:数组最多包含10个元素。
文件输入:文本文件最多包含10行文本。
多模态向量
多模态向量模型将文本、图像或视频转换成一组由浮点数组成的向量,适用于视频分类、图像分类、图文检索等。API参考
国际(新加坡)
模型名称 | 数据类型 | 向量维度 | 单价(每百万输入Token) | 免费额度(注) |
tongyi-embedding-vision-plus | float(32) | 1,152 | $0.09 | 100万Token 有效期:百炼开通后90天内 |
tongyi-embedding-vision-flash | float(32) | 768 | 图片/视频:$0.03 文本:$0.09 |
中国大陆(北京)
模型名称 | 数据类型 | 向量维度 | 单价(每千输入Token) | 免费额度(注) |
multimodal-embedding-v1 | float(32) | 1,024 | 免费试用 | 无Token额度限制 |
文本排序
通常用于语义检索,即给定查询 (Query) 和一系列候选文本 (Documents),会根据与查询的语义相关性从高到低对候选文本进行排序。API参考
仅支持中国大陆(北京)地域。
模型名称 | 最大Document数量 | 单行最大输入Token | 最大输入Token | 支持语言 | 单价(每百万输入Token) |
gte-rerank-v2 | 500 | 4,000 | 30,000 | 中、英、日、韩、泰语、西、法、葡、德、印尼语、阿拉伯语等50+语种 | $0.115 |
单行最大输入Token:每个Query或Document的最大Token数量为4,000。如果输入内容超过此长度,将会被截断。
最大Document数量:每次请求中Document的最大数量为500。
最大输入Token:每次请求中所有Query和Document的Token总数不得超过30,000。
行业
意图理解
通义意图理解模型,能够在百毫秒级时间内快速、准确地解析用户意图,并选择合适工具来解决用户问题。API参考|使用方法
仅支持中国大陆(北京)地域。
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
tongyi-intent-detect-v3 | 8,192 | 8,192 | 1,024 | $0.058 | $0.144 |
角色扮演
通义千问的角色扮演模型,适合拟人化的对话场景(如虚拟社交、游戏NPC、IP复刻、硬件/玩具/车机等)。相比于其它通义千问模型,提升了人设还原、话题推进、倾听共情等能力。使用方法
国际(新加坡)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qwen-plus-character-ja | 8,192 | 7,680 | 512 | $0.5 | $1.4 |
中国大陆(北京)
模型名称 | 上下文长度 | 最大输入 | 最大输出 | 输入成本 | 输出成本 |
(Token数) | (每百万Token) | ||||
qwen-plus-character | 32,768 | 32,000 | 4,096 | $0.115 | $0.287 |

























































