为优化资源利用和确保用户使用最新、最优模型,阿里云百炼平台将根据模型迭代升级情况不定期下线历史模型。本文将为您介绍模型下线机制。
通知机制
通知时间
快照模型(模型名称带有具体的日期标识,例如qwen-max-2025-01-25,常见于通义千问系列模型)将在正式下线前30天发布下线通知。
主线模型(系列模型的核心版本)将在正式下线前3个月发布下线通知。
通知方式
通过邮件、站内信、官网公告等方式。
邮件、站内信仅面向近3个月有待下线模型调用记录的用户。
下线影响
自下线通知发布之日起,将逐步缩减待下线模型的QPM(每分钟调用次数)和TPM(每分钟消耗Token数)。对于申请过扩容的模型,会先恢复至默认限流数据后再进行缩减。在此过程中,模型API接口、控制台上的相关功能均保持正常使用。
自模型正式下线之日起:
模型推理:停止支持模型推理服务,已创建的调用该模型的应用和服务将无法返回结果。
模型调优及模型部署:不再支持基于下线模型进行新的调优和部署操作(部分模型的调优与部署功能可能在模型下线后仍可正常使用,具体请以下线通知为准)。已经训练和部署的模型不受影响。
控制台功能及官方文档:模型相关的控制台功能(模型广场、模型体验等)、官方文档将同步下线。
操作建议
下线模型列表(“新加坡”地域)
2025年8月20日已下线
类别 | 模型名称 | 下线时间 | 替代模型 |
文本生成-通义千问-开源版 | qwen2-72b-instruct | 2025年8月20日00:00:00(UTC+08:00) | |
qwen2-57b-a14b-instruct | |||
qwen2-7b-instruct | |||
qwen1.5-110b-chat | |||
qwen1.5-72b-chat | |||
qwen1.5-32b-chat | |||
qwen1.5-14b-chat | |||
qwen1.5-7b-chat |