全部產品
Search
文件中心

Server Load Balancer:ALB擴充版概述

更新時間:Mar 28, 2026

為滿足現代應用與AI應用統一接入的需求,阿里雲全新推出ALB擴充版(ALB Extensible Edition)。該版本基於靈活的服務擴充能力,提供身份認證、根據訊息內容決定路由等核心流量治理功能,並新增多模型代理、GPU感知調度、Token限速等AI 原生特性,打造面嚮應用與AI的一體化智能流量入口。

產品優勢

  • 應用程式層高彈性:ALB擴充版面嚮應用層,提供網域名稱與VIP,多級分發承載海量請求。支援通過流量分發擴充應用系統的服務能力,消除單點故障提升應用系統的可用性;允許自訂可用性區域組合和在可用性區域間Auto Scaling,避免單可用性區域資源瓶頸。

  • 基於內容的進階路由:ALB擴充版支援基於路徑、HTTP標題等多種條件來識別特定業務流量,並將其轉寄至不同的後端伺服器;支援重新導向、重寫以及自訂HTTP標題等進階操作。

  • 應用程式層內容感知:ALB擴充版支援深度解析,可根據請求Body內容動態路由流量到不同後端服務,在原有七層代理的基礎上,提供“L7+”代理能力,廣泛適用於AI應用情境。

  • 靈活的服務擴充:ALB支援服務擴充,通過外掛程式和外部服務調用,滿足自訂業務情境,快速響應AI驅動下的業務變化。

  • 安全可靠:ALB擴充版原生支援身份管理、內建DDoS防護、整合Web Application Firewall等安全能力。同時提供全鏈路HTTPS加密,支援TLS安全性原則、TLS 1.3等高效安全加密協議,面向加密敏感型業務,滿足Zero-Trust新一代安全技術架構需求。

  • SSE串流:ALB擴充版支援SSE串流,在大模型AI應用中,可通過SSE即時返回產生的推理結果,以提升使用者體驗。

  • 彈性靈活的計費:ALB擴充版通過Elastic IP Address(Elastic IP Address,簡稱EIP)和共用頻寬提供公網能力,實現公網靈活計費;同時採用了更先進的、更適合彈性業務峰值的效能容量單位LCU(Load Balancer Capacity Unit)的計價方案。

應用情境

  • 應用流量入口:適用於傳統Web、AI應用,具備流量分發、身份認證、限速等功能。

  • 現代應用和AI應用的工作負載:最佳化現代應用和AI/機器學習工作負載,實現模型感知路由,根據特定模型需求導向流量,最佳化GPU利用率,為應用提供經濟高效的低延遲推理。

  • 多模型統一代理:一站式解決模型適配、智能調度與動態容錯移轉難題,融合細粒度身份鑒權,構建安全、彈性且高可靠的AI基礎設施。

  • 混合和多雲應用高可用部署:簡化混合串連並確保安全性,跨雲網路的核心,可為資料中心、分公司和多雲資源提供高效能應用交付和安全性。

  • 容器Ingress入口網關:將外部HTTP(S)請求路由到叢集內的Container Service,支援藍綠髮布、A/B測試;TLS終結、根據訊息內容決定路由。

  • 高效能安全應用交付:具備自動彈性的高效能負載平衡,整合WAF、DDoS、Cloud Firewall等安全產品,保護應用安全交付。

執行個體效能指標

ALB執行個體會從每個指定的交換器中分配3個IP地址,包含1個VIP(對外提供服務)和2個Local IP(用於與後端伺服器互動並進行健全狀態檢查)。

為確保ALB各項彈效能力可用,建議在ALB執行個體所在的每個交換器內預留至少8個IP地址。

單VIP效能指標

最高自動彈性效能

最大每秒請求數(QPS)

500,000

最大建立串連數(CPS)

200,000

最大並發串連數

5,000,000

最大私網頻寬

25Gbps

雙可用性區域的ALB執行個體預設公網頻寬為400Mbps,實際公網頻寬以單ALB執行個體下EIP的頻寬總和為準。

  • 單個地區下,單個阿里雲帳號下所有按使用流量計費EIP的實際業務頻寬峰值總和不能大於 5 Gbps。更多資訊,請參見隨用隨付中的頻寬峰值限制。

  • 如需更大頻寬請購買共用頻寬。關於如何購買共用頻寬,請參見建立與管理共用頻寬

ALB擴充版組成

概念

說明

執行個體

面向七層,提供了超強七層負載平衡能力,通過將流量分發到不同的後端伺服器來擴充應用系統的服務吞吐能力。單一實例可處理高達100萬QPS。

監聽

監聽是ALB的最小業務單元,監聽上需要配置協議與連接埠以告知ALB需要處理什麼流量,例如HTTP協議,80連接埠。每個ALB執行個體至少有一個監聽,才能開始流量處理與分發。每個ALB執行個體預設最多可以配置50個監聽,用於處理不同的業務流量。

轉寄規則

轉寄規則用於確定ALB執行個體如何將請求路由到一個或多個後端伺服器組中的後端伺服器。ALB擴充版具備強大的進階路由能力,支援基於網域名稱、路徑、HTTP標題等多種規則。關聯服務擴充,支援深度解析請求體,實現應用程式層內容感知調度。

服務擴充

ALB 服務擴充是一項全新能力,支援將自訂邏輯直接注入ALB擴充版的資料轉寄路徑。通過外掛程式機制與外部服務調用(Callouts),使用者可在請求處理的關鍵節點靈活執行動態路由、認證鑒權、內容改寫、AI 上下文感知等商務邏輯。同時,ALB擴充版提供豐富的內建群組件庫,覆蓋多種常見情境,開箱即用,顯著降低定製開發成本。該能力顯著提升了ALB擴充版的靈活性與可程式化性,協助使用者快速響應 AI 驅動下的業務變化,滿足複雜、多變的定製化情境需求,同時無需修改應用代碼或部署額外代理層。

伺服器組

伺服器組是一個邏輯組,包含多個後端伺服器用於處理ALB分發的業務請求。ALB中伺服器組獨立於ALB存在,可以將同一伺服器組掛載到不同ALB執行個體。ALB擴充版的伺服器組支援伺服器類型(ECS、ECI、ENI)、IP類型、Function Compute類型、DNS網域名稱類型、AI服務類型。

健全狀態檢查

ALB通過健全狀態檢查來判斷後端伺服器的業務可用性。ALB探測伺服器組中不健康的伺服器,並避免將流量分發給不健康的伺服器。ALB支援豐富靈活的健全狀態檢查配置,如協議、連接埠以及各種健全狀態檢查閾值。同時ALB提供健全狀態檢查模板,可將健全狀態檢查模板快速地應用到不同的伺服器組。

身份管理

ALB擴充版的身份管理功能支援集中建立和管理出站身份憑證,並通過KMS進行加密儲存。添加後端服務時,可直接引用已建立的身份憑證,ALB在轉寄請求時自動攜帶憑證完成身份認證。

執行個體類型

阿里雲提供公網和私網兩種類型的ALB。使用者可以根據業務情境選擇配置對外公開或對內私人的ALB,系統會根據使用者的選擇來決定是否使用共用頻寬和Elastic IP Address。

概念

說明

VIP(Virtual IP address)

ALB實施流量分發的實體。每個VIP都是Virtual Private Cloud(Virtual Private Cloud)中的一個私網IP地址。

EIP

僅在建立公網ALB時需要使用EIP,在建立私網ALB時無需配置。ALB對公網服務的IP地址,一個公網ALB執行個體可以有多個EIP。為了實現高可用性,一個公網ALB執行個體至少應包含兩個分布在不同可用性區域的EIP。

共用頻寬

共用頻寬提供地區級的頻寬共用和複用能力,使用者可將同地區下的Elastic IP Address(EIP)添加到共用頻寬執行個體中,複用共用頻寬中的頻寬,以節省公網頻寬使用成本。

網域名稱

一個在公網(私網)上可解析的網域名稱,解析至ALB執行個體的EIP(VIP)。使用者需要將自有網域名稱通過CNAME方式解析到ALB的網域名稱上來使用,參考為ALB配置CNAME解析

開通擴充版ALB

  1. 申請配額:提交ALB擴充著作權益配額申請,審批通過後即可使用。

  2. 開始使用:登入應用型負載平衡ALB控制台,建立並配置ALB擴充版執行個體。

ALB擴充版正在公測中,請訪問公測說明瞭解詳細資料並申請使用。

注意事項

ALB擴充版執行個體不支援33.0.0.0/822.0.0.0/16網段地址的用戶端訪問。

相關文檔