调用百炼前先选择地域、服务部署范围、接入域名:
地域:决定接入点和数据存储位置,就近选择可降低延迟;
服务部署范围:决定推理执行位置,有数据合规需求选择特定地理边界的部署范围,无合规需求选择全球部署范围(推理资源池更大);
接入域名:影响并发上限、超时等服务保障,各地域具有独立的接入域名。
一次完整的模型调用流程如下:
应用经接入域名将请求发送到所选地域(如新加坡),请求数据存于该地域;
接入地域将请求转发至服务部署范围内的推理节点完成计算(过程数据不持久化,传输全程加密);
推理结果回到接入地域存储,再响应给应用(用户静态数据始终存于所选地域)。
选择地域和服务部署范围
按场景查表选地域和服务部署范围:
使用场景 | 地域 | 服务部署范围 |
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) | 美国(弗吉尼亚) | 全球(任意可用节点,含中国境内及海外) |
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) | 德国(法兰克福) | 全球(任意可用节点,含中国境内及海外) |
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) | 日本(东京) | 全球(任意可用节点,含中国境内及海外) |
无数据驻留限制,追求更大推理资源池(跨多地域调度推理,自行确保跨境合法) | 中国香港 | 全球(任意可用节点,含中国境内及海外) |
要求数据不经过中国内地(会跨多地域调度推理,自行确保跨境合法) | 新加坡 | 国际(除中国内地以外的全球节点) |
要求数据不出中国内地 | 华北2(北京) | 中国内地(限境内推理) |
要求数据不出中国香港 | 中国香港 | 中国香港(限境内推理) |
要求数据不出美国 | 美国(弗吉尼亚) | 美国(限境内推理) |
要求数据不出欧盟 | 德国(法兰克福) | 欧盟(限境内推理) |
要求数据不出日本 | 日本(东京) | 日本(限境内推理) |
选择接入域名
百炼为模型推理 API 提供业务空间专属、Dashscope 和试用三种接入域名,适用于从试用体验到企业级生产的不同场景。推荐使用业务空间专属域名,各域名的核心差异如下:
对比项 | 业务空间专属域名(推荐) | Dashscope 域名(现有域名) | 试用域名 |
域名格式 |
|
以新加坡地域为例 |
|
适用场景 | 推荐在生产环境中使用,具备更高并发承载能力与网络隔离性,保障大流量场景下的稳定、低延迟访问体验。 | 存量业务兼容,建议迁移至业务空间专属域名。 | 快速体验、功能验证,不建议用于生产环境。 |
鉴权方式 | 仅访问当前业务空间 | 可访问所有业务空间 | 可访问所有业务空间 |
限流额度 | RPM、TPM 按模型区分 | RPM、TPM 按模型区分 | RPM 为1000,TPM 按模型区分 |
请求超时 | 3600 秒 | 600 秒 | 600 秒 |
协议支持 | HTTP、SSE、WebSocket、WebRTC | HTTP、SSE、WebSocket | HTTP、SSE |
SLA | 99.9% | 99.9% | 不提供 |
各地域接入信息
每个地域有独立的接入域名、API Key 和模型列表,不能跨地域混用。
地域 | 地域ID | 业务空间专属域名 | Dashscope 域名 | 试用域名 | API Key | 模型列表 |
华北2(北京) |
|
|
|
| ||
新加坡 |
|
|
|
| ||
德国(法兰克福) |
|
| 不支持 | 暂不支持 | ||
日本(东京) |
|
| 不支持 | 暂不支持 | ||
中国香港 |
|
|
|
| ||
美国(弗吉尼亚) |
| 暂不支持 |
| 暂不支持 |
迁移至业务空间专属域名
从 Dashscope 域名或试用域名迁移到业务空间专属域名只需两步,无需修改业务逻辑代码:
获取业务空间专属域名:
方式一:在API Key 创建后的弹窗中,复制 API Host 。
方式二:在业务空间管理页面,复制 API Host 列的内容。
替换 Base URL 中的域名:将原域名替换为业务空间专属域名。以华北2(北京)地域为例,
llm-xxx为业务空间 ID:OpenAI 兼容接口:从
https://dashscope.aliyuncs.com/compatible-mode/v1替换为https://llm-xxx.cn-beijing.maas.aliyuncs.com/compatible-mode/v1DashScope 接口:从
https://dashscope.aliyuncs.com/api/v1替换为https://llm-xxx.cn-beijing.maas.aliyuncs.com/api/v1Anthropic 兼容接口:从
https://dashscope.aliyuncs.com/apps/anthropic替换为https://llm-xxx.cn-beijing.maas.aliyuncs.com/apps/anthropic
各地域功能支持
功能 | 新加坡 | 美国(弗吉尼亚) | 华北2(北京) | 中国香港 | 德国(法兰克福) | 日本(东京) |
实时推理 | ||||||
批量推理 | ||||||
模型体验 | ||||||
模型监控(普通) | ||||||
模型监控(高级) | ||||||
模型告警 | ||||||
传输安全 | ||||||
权限管理 | ||||||
模型调优 |
相关文档
选择模型 — 各地域模型及上下文长度
模型调用计费 — 各地域价格
限流— RPM、TPM 限制
获取API Key — 创建和管理 Key
Base URL总览 — 模型服务调用地址