全部產品
Search
文件中心

:模型下線機制說明

更新時間:Feb 07, 2026

為最佳化資源利用和確保使用者使用最新、最優模型,阿里雲百鍊平台將根據模型迭代升級情況不定期下線歷史模型。本文將為您介紹模型下線機制。

通知機制

通知時間

  • 快照模型(模型名稱帶有具體的日期標識,例如qwen-max-2025-01-25,常見於千問系列模型)將在正式下線前30天發布下線通知。

  • 主線模型(系列模型的核心版本)將在正式下線前3個月發布下線通知。

通知方式

通過郵件、站內信、官網公告等方式。

郵件、站內信僅面向近3個月有待下線模型調用記錄的使用者。

下線影響

  • 自下線通知發布之日起,將逐步縮減待下線模型的QPM(每分鐘調用次數)和TPM(每分鐘消耗Token數)對於申請過擴容的模型,會先恢複至預設限流資料後再進行縮減。在此過程中,模型API介面、控制台上的相關功能均保持正常使用。

  • 自模型正式下線之日起

    • 模型推理:停止支援模型推理服務,已建立的調用該模型的應用和服務將無法返回結果。

    • 模型調優及模型部署:不再支援基於下線模型進行新的調優和部署操作(部分模型的調優與部署功能可能在模型下線後仍可正常使用,具體請以下線通知為準)。已經訓練和部署的模型不受影響。

    • 控制台功能及官方文檔:模型相關的控制台功能(模型廣場、模型體驗等)、官方文檔將同步下線。

操作建議

  1. 前往“國際(新加坡)”地區的模型觀測頁面,檢查您的帳號是否正在使用待下線的模型。

    如需使用“中國內地(北京)”地區的模型,請前往“中國內地(北京)”地區的模型觀測頁面
  2. 如果在使用,建議您先測試替代模型的業務效果,再切換至替代模型。

下線模型列表

2026年1月30日已下線

類別

模型名稱

下線時間

替代模型

千問Plus

qwen-plus-2024-11-27

2026年1月30日00:00:00

qwen-plus-2025-12-01

qwen-plus-2024-11-25

qwen-plus-2024-09-19

qwen-plus-2024-08-06

千問Turbo

qwen-turbo-2024-09-19

qwen-flash-2025-07-28

千問VL

qwen-vl-max-2024-10-30

qwen3-vl-plus-2025-12-19

qwen-vl-max-2024-08-09

qwen-vl-plus-2024-08-09

qwen3-vl-flash-2025-10-15

2025年8月20日已下線

類別

模型名稱

下線時間

替代模型

文本產生-千問-開源版

qwen2-72b-instruct

2025年8月20日00:00:00(UTC+08:00)

千問大語言模型:模型列表模型列表模型列表模型列表模型列表

qwen2-57b-a14b-instruct

qwen2-7b-instruct

qwen1.5-110b-chat

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat