全部产品
Search
文档中心

:文本生成模型

更新时间:Apr 21, 2026

为AI智能体、聊天机器人、文档处理等场景选择合适的文本生成模型。

使用 OpenClaw、Claude Code或 Hermes?

qwen3.6-plus -- 能力与成本均衡,完整工具调用支持,100万上下文窗口,适用于大型代码库。 Coding Plan用户还可选择 glm-5MiniMax-M2.5,均针对智能体工作流进行了优化。

应用场景

聊天机器人、内容生成、摘要总结、文档处理等场景,推荐使用 qwen3.6-plus,能力与成本均衡,拥有100万上下文窗口和完整的内置工具。确认效果满足需求后,可以尝试 qwen3.6-flash 来降低成本,效果接近旗舰模型,且拥有相同的上下文长度和功能支持。如需最强推理能力,可选择 qwen3.6-max-preview,但成本较高。

上下文窗口

100万token约相当于75万个汉字或10本小说。

  • 长文档或大型代码库:qwen3.6-plus / qwen3.6-flash(100万)。

  • 常规任务:128k-256k已足够。

模型的上下文信息请前往模型广场查看。

华北2(北京) | 新加坡 | 美国 | 中国香港 | 法兰克福

思考模式

逐步推理,适用于多步数学计算、代码调试、架构规划或法律交叉引用等场景。

通过 enable_thinking 参数开启(Responses API 通过reasoning.effort参数控制思考模式开关与深度)。所有Qwen3及以上模型均支持,大多数为混合模式,可按请求灵活切换。

详情参见深度思考

Function Calling与内置工具

让模型执行操作:查询天气、查询数据库、预订会议等。

  • Function Calling(自定义工具,模型调用):所有通用模型均支持。

  • 内置工具(联网搜索、代码解释器、网页抓取等,无需复杂配置)。

详情参见工具调用

结构化输出

获取有效的JSON返回,例如从文本中提取姓名和地址。

详情参见结构化输出

批量推理

适用于大量请求且对延迟要求不高的场景,可降低请求成本。

详情参见批量推理

推荐模型

国际

模型

上下文

思考模式

Function Calling

内置工具

结构化输出

批量调用

qwen3.6-max-preview

256k

支持

支持

不支持

支持

不支持

qwen3.6-plus

100万

支持

支持

支持

支持

支持

qwen3.6-flash

100万

支持

支持

支持

支持

支持

deepseek-v3.2

128k

支持

支持

不支持

不支持

不支持

全球

模型

上下文

思考模式

Function Calling

内置工具

结构化输出

批量调用

qwen3.6-max-preview

256k

仅非思考

支持

不支持

支持

不支持

qwen3.6-plus

100万

支持

支持

支持

支持

不支持

qwen3.6-flash

100万

支持

支持

支持

支持

不支持

美国

模型

上下文

思考模式

Function Calling

内置工具

结构化输出

批量调用

qwen-plus-us

100万

支持

支持

不支持

支持

不支持

qwen-flash-us

100万

支持

支持

不支持

支持

不支持

中国内地

模型

上下文

思考模式

Function Calling

内置工具

结构化输出

批量调用

qwen3.6-max-preview

256k

支持

支持

不支持

支持

不支持

qwen3.6-max-preview

256k

支持

支持

不支持

支持

不支持

qwen3.6-plus

100万

支持

支持

支持

支持

支持

qwen3.6-flash

100万

支持

支持

支持

支持

支持

deepseek-v3.2

128k

支持

支持

不支持

不支持

支持

kimi-k2.5

256k

支持

支持

不支持

不支持

不支持

glm-5.1

198k

支持

支持

不支持

支持

不支持

MiniMax-M2.5

192k

支持

支持

不支持

不支持

不支持

中国香港 / 欧盟

模型

上下文

思考模式

Function Calling

内置工具

结构化输出

批量调用

qwen-plus

100万

支持

支持

不支持

支持

不支持

qwen3.5-flash

100万

支持

支持

支持

支持

不支持

所有模型

Qwen3.6

模型ID

上下文

最大输出

思考预算

Function Calling

内置工具

结构化输出

批量

Coding Plan

qwen3.6-max-preview

256k

64k

128k

支持

不支持

支持

不支持

不支持

qwen3.6-plus

100万

64k

80k

支持

支持

支持

不支持

支持(仅pro)

qwen3.6-plus-2026-04-02

100万

64k

80k

支持

支持

支持

不支持

不支持

qwen3.6-flash

100万

64k

128k

支持

支持

支持

支持

不支持

qwen3.6-flash-2026-04-16

100万

64k

128k

支持

支持

支持

支持

不支持

Qwen3.5

国际 / 全球 / 中国内地

模型ID

上下文

最大输出

思考预算

Function Calling

内置工具

结构化输出

批量

Coding Plan

qwen3.5-plus

100万

64k

80k

支持

支持

支持

不支持

支持

qwen3.5-plus-2026-02-15

100万

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-flash

100万

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-flash-2026-02-23

100万

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-397b-a17b

256k

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-122b-a10b

256k

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-27b

256k

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-35b-a3b

256k

64k

80k

支持

支持

支持

不支持

不支持

中国香港 / 欧盟

模型ID

上下文

最大输出

思考预算

Function Calling

内置工具

结构化输出

批量

Coding Plan

qwen3.5-flash

100万

64k

80k

支持

支持

支持

不支持

不支持

qwen3.5-flash-2026-02-23

100万

64k

80k

支持

支持

支持

不支持

不支持

第三方模型

模型ID

上下文

最大输出

思考预算

Function Calling

内置工具

结构化输出

批量

Coding Plan

glm-5.1

198k

128k

128k

支持

不支持

支持

不支持

不支持

kimi-k2.5

256k

96k

80k

支持

不支持

不支持

不支持

支持

MiniMax-M2.5

192k

32k(含思维链)

不支持

支持

不支持

不支持

不支持

支持

deepseek-v3.2

128k

64k

32k

支持

不支持

不支持

支持

不支持

旧版及其他模型

以下模型不再作为首选推荐。新项目建议使用Qwen3.6或Qwen3.5系列。如需查看模型详细参数(上下文窗口、计费等),请前往模型广场。

华北2(北京) | 新加坡 | 美国 | 中国香港 | 法兰克福

查看旧版及其他模型列表

Qwen3

  • qwen3-max

  • qwen3-max-2026-01-23

  • qwen3-max-preview

  • qwen3-max-2025-09-23

  • qwen3-235b-a22b

  • qwen3-235b-a22b-thinking-2507

  • qwen3-235b-a22b-instruct-2507

  • qwen3-next-80b-a3b-thinking

  • qwen3-next-80b-a3b-instruct

  • qwen3-32b

  • qwen3-30b-a3b

  • qwen3-30b-a3b-thinking-2507

  • qwen3-30b-a3b-instruct-2507

  • qwen3-14b

  • qwen3-8b

  • qwen3-4b

  • qwen3-1.7b

  • qwen3-0.6b

Qwen3-Coder

  • qwen3-coder-plus

  • qwen3-coder-plus-2025-09-23

  • qwen3-coder-plus-2025-07-22

  • qwen3-coder-flash

  • qwen3-coder-flash-2025-07-28

  • qwen3-coder-next

  • qwen3-coder-480b-a35b-instruct

  • qwen3-coder-30b-a3b-instruct

Qwen2.5(开源)

  • qwen2.5-omni-7b

  • qwen2.5-vl-72b-instruct

  • qwen2.5-vl-32b-instruct

  • qwen2.5-vl-7b-instruct

  • qwen2.5-vl-3b-instruct

  • qwen2.5-72b-instruct

  • qwen2.5-72b-instruct-1m

  • qwen2.5-32b-instruct

  • qwen2.5-14b-instruct

  • qwen2.5-14b-instruct-1m

  • qwen2.5-7b-instruct

  • qwen2.5-7b-instruct-1m

翻译

  • qwen-mt-plus

  • qwen-mt-turbo

  • qwen-mt-flash

  • qwen-mt-lite

千问Long

  • qwen-long

  • qwen-long-latest

  • qwen-long-2025-01-25

角色扮演

  • qwen-plus-character

  • qwen-plus-character-ja

  • qwen-flash-character

旧版Qwen

  • qwen-plus及其快照版本

  • qwen-max及其快照版本

  • qwen-flash及其快照版本

  • qwen-turbo及其快照版本

  • qwq-plus

  • qvq-max及其快照版本

  • qwen-omni-turbo及其快照版本

三方模型

  • glm-5、glm-4.7、glm-4.5、glm-4.5-air

  • MiniMax-M2.1

  • kimi-k2-thinking、Moonshot-Kimi-K2-Instruct