模型訓練完成後,可以通過EAS(Elastic Algorithm Service)快速部署為線上推理服務或AI-Web應用。EAS支援異構資源,結合自動擴縮容、一鍵壓測、灰階發布、即時監控等能力,以更低成本保障高並發情境下的服務穩定性與商務持續性。
EAS產品功能

計費說明
當您使用EAS部署服務,可能會涉及計算資源、系統硬碟和專屬網關的使用和計費:
計算資源:包括公用資源、專屬資源、靈駿智算資源。
系統硬碟(可選):提供免費額度(公用資源30G,專屬資源200G),使用額外系統硬碟需單獨計費。
專屬網關(可選):部署預設使用共用網關(免費),如果您有安全隔離、存取控制、自訂網域名等需求,可以付費購買專屬網關,使用專屬網關需手動設定。
關於計費模式,EAS提供以下2種計費模式。
隨用隨付:根據服務運行時間長度進行計費(非服務調用量)。適合不確定的、需求波動大的情境。
訂用帳戶:先付費再使用,可以享受更優惠的價格。適合長期穩定的業務。
對於SDWebUI和ComfyUI,EAS提供了Serverless版本,服務部署完全免費,僅在服務調用時根據實際推理時間長度計費。
如果使用了彈性公網、 OSS、NAS 等其他阿里雲服務,將產生歸屬於其他雲端服務的費用。
更多請參見模型線上服務(EAS)計費說明。
使用流程
步驟1:準備工作
步驟2:部署服務
步驟3:調用與壓測服務
步驟4:監控服務與服務擴縮容
服務運行正常後,建議開通服務監控警示,及時掌握資源使用方式、效能指標和潛在異常,確保服務健康運行。
開啟水平或定時自動擴縮容功能,實現線上服務計算資源的即時動態管理。詳見Auto Scaling。
步驟5:非同步推理服務
對於文生圖、視頻處理等耗時較長的請求,建議啟用非同步推理。通過佇列服務接收請求,處理完成後將結果寫入輸出隊列,用戶端非同步查詢結果,避免請求堆積丟失,提高了系統輸送量。EAS支援根據隊列積壓程度自動擴縮容,智能調控執行個體數量。更多介紹請參見非同步推理服務。
步驟6:服務更新
在推理服務列表中,單擊目標服務操作列下的更新,可以更新服務版本。
服務更新過程中將暫時中斷運行,可能導致依賴此服務的請求失敗,請務必謹慎操作。
服務更新完成後,單擊目前的版本,查看版本資訊或切換服務版本。
快速開始
情境案例
常見問題
Q:專屬資源 vs 公用資源?
公用資源:適合對成本敏感、效能波動容忍度較高的開發測試或小規模業務。成本較低,但高峰期可能存在資源爭用。
專屬資源:適合對服務穩定性和效能有高要求的生產環境核心業務。物理隔離無搶佔風險,彈性資源集區特性允許在專屬資源用滿後,自動溢出到公用資源,兼顧成本與高峰期的業務穩定性。對於庫存緊張的機型,需要通過專屬資源鎖定購買。
Q:EAS相比自建服務有什麼優勢?
EAS提供託管營運:自動處理資源調度、故障恢複和監控,提供標準化的Auto Scaling、灰階發布功能。開發人員可專註模型開發,省去營運成本,加速上線。
Q:服務報錯怎麼辦?
請參考EAS常見問題擷取解決方案。