AI网关支持专享实例与Serverless两个版本,本文介绍相关版本的各项能力、参数、配额与限制说明,帮助用户选择合适的版本与规格。
版本对比
-
Serverless:支持自动弹性伸缩,用户无需管理底层资源,实现免运维。服务按调用量计费,助力业务快速接入与低成本启动。
-
专享实例:提供独立部署的专属资源实例,支持插件扩展、硬件加速和WAF集成等高级能力,保障高安全性并提供更高的SLA服务等级承诺,满足企业对稳定性、安全性与可扩展性的更高要求。
|
分类 |
特性 |
Serverless |
专享实例 |
|
模型代理 |
文生文 |
支持 |
支持 |
|
多模态 |
支持 |
支持 |
|
|
内置策略 |
支持 |
支持 |
|
|
MCP Server |
MCP 代理 |
支持 |
支持 |
|
HTTP to MCP |
支持 |
支持 |
|
|
Agent 代理 |
百炼 |
支持 |
支持 |
|
Dify |
支持 |
支持 |
|
|
自定义 |
支持 |
支持 |
|
|
插件 |
系统插件 |
支持 |
支持 |
|
插件市场 |
不支持 |
支持 |
|
|
自定义插件 |
不支持 |
支持 |
|
|
规格 |
容量规格 |
自动弹性 |
根据QPS与客户端连接数分为不同容量规格 |
|
硬件加速 |
TLS 硬件加速 |
不支持 |
支持 |
|
QAT 硬件压缩解压缩 |
不支持 |
支持 |
|
|
安全 |
WAF 集成 |
不支持 |
支持 |
|
可观测 |
监控与告警 |
仅业务指标 说明
Serverless 设计,托管底层系统,用户无需关注系统级运维。 |
|
|
接入点 |
固定 EIP |
非固定EIP,使用共享接入点 |
支持固定 EIP,独享接入点 |
|
入口带宽 |
多实例共享带宽,单网关实例上限 400Mbps |
独享带宽,单网关实例带宽默认上限 4Gbps,支持动态调整 |
|
|
运维 |
变更配置 |
Serverless 设计,性能自动弹性,用户无需关注服务配置。 |
可按需变更配置,无法降级到 Serverless 版 |
|
稳定性保障 |
SLA |
99.9% |
99.99% |
|
依赖的中间件 |
共享,逻辑隔离 |
独享,物理隔离 |
|
|
版本更新 |
自动 |
手动 |
容量规格
对于专享实例版 AI 网关实例,根据不同实例规格的QPS、客户端连接数的性能差异,提供不同的实例规格。
以下是不同网关实例规格下各项参数详情。
|
实例规格 |
QPS |
客户端连接数 |
|
aigw.small.x1 |
1500 |
20000 |
|
aigw.small.x2 |
3000 |
40000 |
|
aigw.small.x4 |
6000 |
80000 |
|
aigw.medium.x1 |
12000 |
160000 |
|
aigw.medium.x2 |
24000 |
320000 |
|
aigw.medium.x3 |
36000 |
480000 |
|
aigw.large.x1 |
48000 |
640000 |
|
aigw.large.x2 |
96000 |
1280000 |
|
aigw.large.x3 |
144000 |
1920000 |
|
aigw.large.x4 |
192000 |
2560000 |
配额说明
全局配额
配额项 | 配额 |
单Region实例数量 | 100 |
单Region消费者数 | 1000 |
实例配额
配额维度 | Serverless | Small | Medium | Large |
MCP Server数 | 100 | 500 | 1000 | 2000 |
在线路由总数(含Model API路由、Agent API路由) | 2500 | 5000 | 7500 | 10000 |
发布域名数 | 100 | 200 | 500 | 1000 |
关联服务数 | 200 | 800 | 2000 | 4000 |
服务节点数 | 400 | 1600 | 4000 | 8000 |
K8s服务来源数 | 3 | 3 | 5 | 5 |
安装插件数 | NA | 10 | 20 | 30 |
上传自定义插件数 | NA | 20 | 50 | 80 |