为AI智能体、聊天机器人、文档处理等场景选择合适的文本生成模型。
做 AI 编程或 Agent 开发(OpenClaw、Claude Code、Hermes 等)该选哪个模型?
推荐 qwen3.7-plus——能力与成本均衡,完整工具调用支持,1M 上下文适合大型代码库。如需最强推理能力,可选择 qwen3.7-max。
从闭源模型迁移到百炼?
如果你正在使用 GPT、Claude 或 Gemini,可参考下表按能力档选择百炼对位模型。
闭源模型代表 | 百炼推荐 | |
高能力 | GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro |
|
平衡 | GPT-5.4、Claude Sonnet 4.6、Gemini 3 Pro |
|
轻量低成本 | GPT-5.4-mini、Claude Haiku 4.5、Gemini 3.1 Flash |
|
应用场景
聊天机器人、内容生成、摘要总结、文档处理等场景,推荐使用 qwen3.7-plus,能力与成本均衡,拥有100万上下文窗口和完整的内置工具。确认效果满足需求后,可以尝试 qwen3.6-flash 来降低成本,效果接近旗舰模型,且拥有相同的上下文长度和功能支持。如需最强推理能力,可选择 qwen3.7-max(百万 token 上下文),但成本较高。
上下文窗口
100万Token约相当于70万个汉字或10本小说。
长文档或大型代码库:
qwen3.7-plus/qwen3.6-flash(100万)。常规任务:128k-256k已足够。
模型的上下文信息请前往模型广场查看。
思考模式
逐步推理,适用于多步数学计算、代码调试、架构规划或法律交叉引用等场景。
通过 enable_thinking 参数开启(Responses API 通过reasoning.effort参数控制思考模式开关与深度)。所有Qwen3及以上模型均支持,大多数为混合模式,可按请求灵活切换。
详情参见深度思考。
Function Calling与内置工具
让模型执行操作:查询天气、查询数据库、预订会议等。
Function Calling(自定义工具,模型调用):所有通用模型均支持。
内置工具(联网搜索、代码解释器、网页抓取等,无需复杂配置)。
详情参见工具调用。
结构化输出
获取有效的JSON返回,例如从文本中提取姓名和地址。
详情参见结构化输出。
批量推理
适用于大量请求且对延迟要求不高的场景,可降低请求成本。
详情参见批量推理。
推荐模型
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M | |||||
| 1M | |||||
| 1M | |||||
| 1M | |||||
| 1M | |||||
| 256k | |||||
| 1M | |||||
| 192k |
快照模型
以下为各模型的历史快照版本(带日期)。生产环境建议固定到具体快照版本,以保证输出稳定。
qwen3.7-max
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M | |||||
| 1M | |||||
| 1M | |||||
| 1M |
qwen3.7-plus
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M |
qwen3.6-flash
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M |
qwen3.6-plus
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M |
qwen3.5-plus
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M |
qwen3.5-flash
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M |
qwen3-max
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 256k | |||||
| 256k | |||||
| 256k |
qwen3-coder-plus
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M | |||||
| 1M |
qwen3-coder-flash
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M |
qwen-long
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 10M |
旧版模型
以下模型不再作为首选推荐。新项目建议使用Qwen3.6或Qwen3.5系列。如需查看模型详细参数(上下文窗口、计费等),请前往模型广场。
Qwen3.6
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 256k | |||||
| 1M |
Qwen3.5
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M | |||||
| 1M | |||||
| 256k | |||||
| 256k | |||||
| 256k | |||||
| 256k |
Qwen3
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 256k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 80k | |||||
| 128k | |||||
| 128k | |||||
| 128k |
Qwen3-Coder
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 1M | |||||
| 1M | |||||
| 256k | |||||
| 256k | |||||
| 256k |
翻译
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 16k | |||||
| 16k | |||||
| 16k | |||||
| 16k |
千问Long
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 10M | |||||
| 10M |
角色扮演
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 32k | |||||
| 32k | |||||
| 8k |
旧版Qwen
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 32k | |||||
| 1M | (仅主线版本) | ||||
| 32k | (仅主线版本) | ||||
| 1M | (仅主线版本) | ||||
| 128k | (仅主线版本) | ||||
| 128k | |||||
| 128k | |||||
| 32k | (仅主线版本) |
三方模型
模型ID | 上下文 | 思考模式 | Function Calling | 内置工具 | 结构化输出 | 批量调用 |
| 198k | |||||
| 198k | |||||
| 198k | |||||
| 128k | |||||
| 128k | |||||
| 192k | |||||
| 192k | |||||
| 200k | |||||
| 256k | |||||
| 256k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k | |||||
| 128k |