全部產品
Search
文件中心

:模型下線機制說明

更新時間:Aug 22, 2025

為最佳化資源利用和確保使用者使用最新、最優模型,阿里雲百鍊平台將根據模型迭代升級情況不定期下線歷史模型。本文將為您介紹模型下線機制。

通知機制

通知時間

  • 快照模型(模型名稱帶有具體的日期標識,例如qwen-max-2025-01-25,常見於通義千問系列模型)將在正式下線前30天發布下線通知。

  • 主線模型(系列模型的核心版本)將在正式下線前3個月發布下線通知。

通知方式

通過郵件、站內信、官網公告等方式。

郵件、站內信僅面向近3個月有待下線模型調用記錄的使用者。

下線影響

  • 自下線通知發布之日起,將逐步縮減待下線模型的QPM(每分鐘調用次數)和TPM(每分鐘消耗Token數)對於申請過擴容的模型,會先恢複至預設限流資料後再進行縮減。在此過程中,模型API介面、控制台上的相關功能均保持正常使用。

  • 自模型正式下線之日起

    • 模型推理:停止支援模型推理服務,已建立的調用該模型的應用和服務將無法返回結果。

    • 模型調優及模型部署:不再支援基於下線模型進行新的調優和部署操作(部分模型的調優與部署功能可能在模型下線後仍可正常使用,具體請以下線通知為準)。已經訓練和部署的模型不受影響。

    • 控制台功能及官方文檔:模型相關的控制台功能(模型廣場、模型體驗等)、官方文檔將同步下線。

操作建議

  1. 前往“新加坡”地區的模型觀測頁面,檢查您的帳號是否正在使用待下線的模型。

    如需使用“華北2(北京)”地區的模型,請前往“華北2(北京)”地區的模型觀測頁面
  2. 如果在使用,建議您先測試替代模型的業務效果,再切換至替代模型。

下線模型列表(“新加坡”地區)

2025年8月20日已下線

類別

模型名稱

下線時間

替代模型

文本產生-通義千問-開源版

qwen2-72b-instruct

2025年8月20日00:00:00(UTC+08:00)

通義千問大語言模型:QwQ通義千問Max通義千問Plus通義千問TurboQwen3

qwen2-57b-a14b-instruct

qwen2-7b-instruct

qwen1.5-110b-chat

qwen1.5-72b-chat

qwen1.5-32b-chat

qwen1.5-14b-chat

qwen1.5-7b-chat