全部产品
Search
文档中心

负载均衡:ALB扩展版概述

更新时间:Mar 27, 2026

为满足现代应用与AI应用统一接入的需求,阿里云全新推出ALB扩展版(ALB Extensible Edition)。该版本基于灵活的服务扩展能力,提供身份认证、基于内容的路由等核心流量治理功能,并新增多模型代理、GPU感知调度、Token限速等AI 原生特性,打造面向应用与AI的一体化智能流量入口。

image

产品优势

  • 应用层高弹性:ALB扩展版面向应用层,提供域名与VIP,多级分发承载海量请求。支持通过流量分发扩展应用系统的服务能力,消除单点故障提升应用系统的可用性;允许自定义可用区组合和在可用区间弹性伸缩,避免单可用区资源瓶颈。

  • 基于内容的高级路由:ALB扩展版支持基于路径、HTTP标头等多种条件来识别特定业务流量,并将其转发至不同的后端服务器;支持重定向、重写以及自定义HTTP标头等高级操作。

  • 应用层内容感知:ALB扩展版支持深度解析,可根据请求Body内容动态路由流量到不同后端服务,在原有七层代理的基础上,提供“L7+”代理能力,广泛适用于AI应用场景。

  • 灵活的服务扩展:ALB支持服务扩展,通过插件和外部服务调用,满足自定义业务场景,快速响应AI驱动下的业务变化。

  • 安全可靠:ALB扩展版原生支持身份管理、自带DDoS防护、集成Web应用防火墙等安全能力。同时提供全链路HTTPS加密,支持TLS安全策略、TLS 1.3等高效安全加密协议,面向加密敏感型业务,满足Zero-Trust新一代安全技术架构需求。

  • SSE流式传输:ALB扩展版支持SSE流式传输,在大模型AI应用中,可通过SSE实时返回生成的推理结果,以提升用户体验。

  • 弹性灵活的计费:ALB扩展版通过弹性公网IP(Elastic IP Address,简称EIP)和共享带宽提供公网能力,实现公网灵活计费;同时采用了更先进的、更适合弹性业务峰值的性能容量单位LCU(Load Balancer Capacity Unit)的计价方案。

应用场景

  • 应用流量入口:适用于传统Web、AI应用,具备流量分发、身份认证、限速等功能。

  • 现代应用和AI应用的工作负载:优化现代应用和AI/机器学习工作负载,实现模型感知路由,根据特定模型需求导向流量,优化GPU利用率,为应用提供经济高效的低延迟推理。

  • 多模型统一代理:一站式解决模型适配、智能调度与动态故障转移难题,融合细粒度身份鉴权,构建安全、弹性且高可靠的AI基础设施。

  • 混合和多云应用高可用部署:简化混合连接并确保安全性,跨云网络的核心,可为数据中心、分支机构和多云资源提供高性能应用交付和安全性。

  • 容器Ingress入口网关:将外部HTTP(S)请求路由到集群内的容器服务,支持蓝绿发布、A/B测试;TLS终结、基于内容的路由。

  • 高性能安全应用交付:具备自动弹性的高性能负载均衡,集成WAF、DDoS、云防火墙等安全产品,保护应用安全交付。

实例性能指标

ALB实例会从每个指定的交换机中分配3个IP地址,包含1个VIP(对外提供服务)和2个Local IP(用于与后端服务器交互并进行健康检查)。

为确保ALB各项弹性能力可用,建议在ALB实例所在的每个交换机内预留至少8个IP地址。

单VIP性能指标

最高自动弹性性能

最大每秒请求数(QPS)

500,000

最大新建连接数(CPS)

200,000

最大并发连接数

5,000,000

最大私网带宽

25Gbps

双可用区的ALB实例默认公网带宽为400Mbps,实际公网带宽以单ALB实例下EIP的带宽总和为准。

  • 单个地域下,单个阿里云账号下所有按使用流量计费EIP的实际业务带宽峰值总和不能大于 5 Gbps。更多信息,请参见按量付费中的带宽峰值限制。

  • 如需更大带宽请购买共享带宽。关于如何购买共享带宽,请参见创建与管理共享带宽

ALB扩展版组成

image

概念

说明

实例

面向七层,提供了超强七层负载均衡能力,通过将流量分发到不同的后端服务器来扩展应用系统的服务吞吐能力。单实例可处理高达100万QPS。

监听

监听是ALB的最小业务单元,监听上需要配置协议与端口以告知ALB需要处理什么流量,例如HTTP协议,80端口。每个ALB实例至少有一个监听,才能开始流量处理与分发。每个ALB实例默认最多可以配置50个监听,用于处理不同的业务流量。

转发规则

转发规则用于确定ALB实例如何将请求路由到一个或多个后端服务器组中的后端服务器。ALB扩展版具备强大的高级路由能力,支持基于域名、路径、HTTP标头等多种规则。关联服务扩展,支持深度解析请求体,实现应用层内容感知调度。

服务扩展

ALB 服务扩展是一项全新能力,支持将自定义逻辑直接注入ALB扩展版的数据转发路径。通过插件机制与外部服务调用(Callouts),用户可在请求处理的关键节点灵活执行动态路由、认证鉴权、内容改写、AI 上下文感知等业务逻辑。同时,ALB扩展版提供丰富的内置组件库,覆盖多种常见场景,开箱即用,显著降低定制开发成本。该能力显著提升了ALB扩展版的灵活性与可编程性,帮助用户快速响应 AI 驱动下的业务变化,满足复杂、多变的定制化场景需求,同时无需修改应用代码或部署额外代理层。

服务器组

服务器组是一个逻辑组,包含多个后端服务器用于处理ALB分发的业务请求。ALB中服务器组独立于ALB存在,可以将同一服务器组挂载到不同ALB实例。ALB扩展版的服务器组支持服务器类型(ECS、ECI、ENI)、IP类型、函数计算类型、DNS域名类型、AI服务类型。

健康检查

ALB通过健康检查来判断后端服务器的业务可用性。ALB探测服务器组中不健康的服务器,并避免将流量分发给不健康的服务器。ALB支持丰富灵活的健康检查配置,如协议、端口以及各种健康检查阈值。同时ALB提供健康检查模板,可将健康检查模板快速地应用到不同的服务器组。

身份管理

ALB扩展版的身份管理功能支持集中创建和管理出站身份凭证,并通过KMS进行加密存储。添加后端服务时,可直接引用已创建的身份凭证,ALB在转发请求时自动携带凭证完成身份认证。

实例类型

阿里云提供公网和私网两种类型的ALB。用户可以根据业务场景选择配置对外公开或对内私有的ALB,系统会根据用户的选择来决定是否使用共享带宽和弹性公网IP。

image

概念

说明

VIP(Virtual IP address)

ALB实施流量分发的实体。每个VIP都是专有网络VPC(Virtual Private Cloud)中的一个私网IP地址。

EIP

仅在创建公网ALB时需要使用EIP,在创建私网ALB时无需配置。ALB对公网服务的IP地址,一个公网ALB实例可以有多个EIP。为了实现高可用性,一个公网ALB实例至少应包含两个分布在不同可用区的EIP。

共享带宽

共享带宽提供地域级的带宽共享和复用能力,用户可将同地域下的弹性公网IP(EIP)添加到共享带宽实例中,复用共享带宽中的带宽,以节省公网带宽使用成本。

域名

一个在公网(私网)上可解析的域名,解析至ALB实例的EIP(VIP)。用户需要将自有域名通过CNAME方式解析到ALB的域名上来使用,参考为ALB配置CNAME解析

开通扩展版ALB

  1. 申请配额:提交ALB扩展版权益配额申请,审批通过后即可使用。

  2. 开始使用:登录应用型负载均衡ALB控制台,创建并配置ALB扩展版实例。

ALB扩展版正在公测中,请访问公测说明了解详细信息并申请使用。

注意事项

ALB扩展版实例不支持33.0.0.0/822.0.0.0/16网段地址的客户端访问。

相关文档