AI網關支援專享執行個體與Serverless兩個版本,本文介紹相關版本的各項能力、參數、配額與限制說明,協助使用者選擇合適的版本與規格。
版本對比
-
Serverless:支援自動Auto Scaling,使用者無需管理底層資源,實現免營運。服務按調用量計費,助力業務快速接入與低成本啟動。
-
專享執行個體:提供獨立部署的專屬資源執行個體,支援外掛程式擴充、硬體加速和WAF整合等進階能力,保障高安全性並提供更高的SLA服務等級承諾,滿足企業對穩定性、安全性與可擴充性的更高要求。
|
分類 |
特性 |
Serverless |
專享執行個體 |
|
模型代理 |
文生文 |
支援 |
支援 |
|
多模態 |
支援 |
支援 |
|
|
內建策略 |
支援 |
支援 |
|
|
MCP Server |
MCP 代理 |
支援 |
支援 |
|
HTTP to MCP |
支援 |
支援 |
|
|
Agent 代理 |
百鍊 |
支援 |
支援 |
|
Dify |
支援 |
支援 |
|
|
自訂 |
支援 |
支援 |
|
|
外掛程式 |
系統外掛程式 |
支援 |
支援 |
|
外掛程式市場 |
不支援 |
支援 |
|
|
自訂外掛程式 |
不支援 |
支援 |
|
|
規格 |
容量規格 |
自動彈性 |
根據QPS與用戶端串連數分為不同容量規格 |
|
硬體加速 |
TLS 硬體加速 |
不支援 |
支援 |
|
QAT 硬體壓縮解壓縮 |
不支援 |
支援 |
|
|
安全 |
WAF 整合 |
不支援 |
支援 |
|
可觀測 |
監控與警示 |
僅業務指標 說明
Serverless 設計,託管底層系統,使用者無需關注系統級營運。 |
|
|
存取點 |
固定 EIP |
非固定EIP,使用共用存取點 |
支援固定 EIP,獨享存取點 |
|
入口頻寬 |
多執行個體共用頻寬,單網關執行個體上限 400Mbps |
獨享頻寬,單網關執行個體頻寬預設上限 4Gbps,支援動態調整 |
|
|
營運 |
變更配置 |
Serverless 設計,效能自動彈性,使用者無需關注服務配置。 |
可按需變更配置,無法降級到 Serverless 版 |
|
穩定性保障 |
SLA |
99.9% |
99.99% |
|
依賴的中介軟體 |
共用,邏輯隔離 |
獨享,物理隔離 |
|
|
版本更新 |
自動 |
手動 |
容量規格
對於專享執行個體版 AI 網關執行個體,根據不同執行個體規格的QPS、用戶端串連數的效能差異,提供不同的執行個體規格。
以下是不同網關執行個體規格下各項參數詳情。
|
執行個體規格 |
QPS |
用戶端串連數 |
|
aigw.small.x1 |
1500 |
20000 |
|
aigw.small.x2 |
3000 |
40000 |
|
aigw.small.x4 |
6000 |
80000 |
|
aigw.medium.x1 |
12000 |
160000 |
|
aigw.medium.x2 |
24000 |
320000 |
|
aigw.medium.x3 |
36000 |
480000 |
|
aigw.large.x1 |
48000 |
640000 |
|
aigw.large.x2 |
96000 |
1280000 |
|
aigw.large.x3 |
144000 |
1920000 |
|
aigw.large.x4 |
192000 |
2560000 |
配額說明
全域配額
|
配額項 |
配額 |
|
單Region執行個體數量 |
100 |
執行個體配額
|
配額維度 |
Serverless |
Small |
Medium |
Large |
|
MCP Server數 |
100 |
500 |
1000 |
2000 |
|
線上路由總數(含Model API路由、Agent API路由) |
2500 |
5000 |
7500 |
10000 |
|
發布網域名稱數 |
100 |
200 |
500 |
1000 |
|
關聯服務數 |
200 |
800 |
2000 |
4000 |
|
服務節點數 |
400 |
1600 |
4000 |
8000 |
|
K8s服務來源數 |
3 |
3 |
5 |
5 |
|
安裝外掛程式數 |
NA |
10 |
20 |
30 |
|
上傳自訂外掛程式數 |
NA |
20 |
50 |
80 |
|
消費者授權數 |
500 |
2000 |
6000 |
10000 |