全部产品
Search
文档中心

:模型下线机制说明

更新时间:Aug 21, 2025

为优化资源利用和确保用户使用最新、最优模型,阿里云百炼平台将根据模型迭代升级情况不定期下线历史模型。本文将为您介绍模型下线机制。

通知机制

通知时间

  • 快照模型(模型名称带有具体的日期标识,例如qwen-max-2025-01-25,常见于通义千问系列模型)将在正式下线前30天发布下线通知。

  • 主线模型(系列模型的核心版本)将在正式下线前3个月发布下线通知。

通知方式

通过邮件、站内信、官网公告等方式。

邮件、站内信仅面向近3个月有待下线模型调用记录的用户。

下线影响

  • 自下线通知发布之日起,将逐步缩减待下线模型的QPM(每分钟调用次数)和TPM(每分钟消耗Token数)对于申请过扩容的模型,会先恢复至默认限流数据后再进行缩减。在此过程中,模型API接口、控制台上的相关功能均保持正常使用。

  • 自模型正式下线之日起

    • 模型推理:停止支持模型推理服务,已创建的调用该模型的应用和服务将无法返回结果。

    • 模型调优及模型部署:不再支持基于下线模型进行新的调优和部署操作(部分模型的调优与部署功能可能在模型下线后仍可正常使用,具体请以下线通知为准)。已经训练和部署的模型不受影响。

    • 控制台功能及官方文档:模型相关的控制台功能(模型广场、模型体验等)、官方文档将同步下线。

操作建议

  1. 前往“新加坡”地域的模型观测页面,检查您的账号是否正在使用待下线的模型。

    如需使用“华北2(北京)”地域的模型,请前往“华北2(北京)”地域的模型观测页面
  2. 如果在使用,建议您先测试替代模型的业务效果,再切换至替代模型。

下线模型列表(“新加坡”地域)

2025年8月20日已下线

类别

模型名称

下线时间

替代模型

文本生成-通义千问-开源版

qwen2-72b-instruct

2025年8月20日00:00:00(UTC+08:00)

通义千问大语言模型:QwQ通义千问Max通义千问Plus通义千问TurboQwen3

qwen2-57b-a14b-instruct

qwen2-7b-instruct

qwen1.5-110b-chat

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat