API 网关 - Model API限流策略新增请求数和并发数维度
Oct 28 2025
API 网关Model API支持按请求数、并发数、Token数限流,支持包括文生文、embedding、rerank、多模态在内的各种场景。
适用客户
所有使用模型代理的用户
新增功能/规格
Model API限流策略新增请求数、并发数维度,对于文生文场景,可按请求数、并发数、token数设置限流策略;对于其它场景,可按请求数、并发数设置限流策略。同时,新增API级别的限流,可对于API配置整体请求数和并发数阈值。