為最佳化資源利用和確保使用者使用最新、最優模型,阿里雲百鍊平台將根據模型迭代升級情況不定期下線歷史模型。本文將為您介紹模型下線機制。
通知機制
通知時間
快照模型(模型名稱帶有具體的日期標識,例如qwen-max-2025-01-25,常見於通義千問系列模型)將在正式下線前30天發布下線通知。
主線模型(系列模型的核心版本)將在正式下線前3個月發布下線通知。
通知方式
通過郵件、站內信、官網公告等方式。
郵件、站內信僅面向近3個月有待下線模型調用記錄的使用者。
下線影響
自下線通知發布之日起,將逐步縮減待下線模型的QPM(每分鐘調用次數)和TPM(每分鐘消耗Token數)。對於申請過擴容的模型,會先恢複至預設限流資料後再進行縮減。在此過程中,模型API介面、控制台上的相關功能均保持正常使用。
自模型正式下線之日起:
模型推理:停止支援模型推理服務,已建立的調用該模型的應用和服務將無法返回結果。
模型調優及模型部署:不再支援基於下線模型進行新的調優和部署操作(部分模型的調優與部署功能可能在模型下線後仍可正常使用,具體請以下線通知為準)。已經訓練和部署的模型不受影響。
控制台功能及官方文檔:模型相關的控制台功能(模型廣場、模型體驗等)、官方文檔將同步下線。
操作建議
下線模型列表(“新加坡”地區)
2025年8月20日已下線
類別 | 模型名稱 | 下線時間 | 替代模型 |
文本產生-通義千問-開源版 | qwen2-72b-instruct | 2025年8月20日00:00:00(UTC+08:00) | |
qwen2-57b-a14b-instruct | |||
qwen2-7b-instruct | |||
qwen1.5-110b-chat | |||
qwen1.5-72b-chat | |||
qwen1.5-32b-chat | |||
qwen1.5-14b-chat | |||
qwen1.5-7b-chat |