大语言模型(Large Language Model, LLM)无法直接访问专有知识库或获取实时动态信息。针对这一瓶颈,阿里云百炼提供了智能体(Agent)应用。智能体支持以零代码方式,将大模型与外部工具进行集成,从而扩展模型的能力边界。
基本原理
智能体(Agent)由提示词(Prompt)驱动,通过协同多种外部能力来完成复杂任务。在接收请求后,大模型进行意图理解和任务规划,自主决策并调用一个或多个外部能力来执行任务,最终整合信息生成响应。
百炼智能体支持核心能力包括:
知识库(RAG):通过连接外部知识库,使应用能基于私有数据回答问题,解决大模型无法访问特定信息的问题。
插件:能调用平台预置的效率工具(如代码执行、图像生成、天气查询等)。
快速开始
创建一个基础智能体
访问阿里云百炼控制台应用管理,单击+创建应用,在智能体应用页签,单击立即创建。

在应用配置界面的模型选择下拉菜单中选择一个模型,例如
通义千问-Plus。其他参数若无特定需求可保持默认。
创建完成后,在左侧对话框中输入
你好进行测试。
智能体能力
阿里云百炼智能体应用支持通过选择模型、优化系统提示词、添加 RAG、调用插件以拓展能力。
模型
模型是驱动智能体进行思考、推理和决策的核心。百炼智能体支持选择通义千问系列官方模型。
模型选择
在模型选择的下拉菜单中选择模型,例如
通义千问-Plus。
单击更多模型可以选择更多其他模型。

参数配置
单击模型下拉框右侧的
,可以勾选、配置参数。支持修改的参数如下:最长回复长度:模型生成的长度限制,不包含提示词。允许的最大长度因模型不同有所改变。
携带的上下文轮数:设置输入模型的最大历史对话轮数,轮数越多,对话相关性越强。
temperature:控制生成随机性和多样性,数值越高多样性越强,数值越低一致性越强,取值范围为[0, 2)。
enable_thinking:是否开启推理模式。部分不支持推理模式的模型无法配置 enable_thinking 参数。
开启推理模式后,模型在生成回复时进行更多的内部推理和上下文处理,Token 消耗会增加。
系统提示词(System Prompt)
系统提示词是为智能体预设的元指令,用于定义其角色、行为准则与能力边界,以确保其在交互中始终保持一致性、可控性和任务合规性。

配置提示词
配置系统提示词为
请你模仿《百年孤独》的风格来回答我的问题,以下是效果对比:无系统提示词:

配置系统提示词

知识库(RAG)
知识检索增强 (Retrieval-Augmented Generation, RAG) 能够使智能体查询外部知识库,并将检索到的最相关的信息作为生成答案的直接依据。在处理私有知识或垂直领域问答时,RAG 能显著提升智能体的回答准确率,减少幻觉问题。详情请参考知识库。
RAG 检索到的文本也会占用大模型的上下文窗口长度(Context Window),因此需要根据实际情况调整检索策略和文本长度,以充分利用上下文窗口并避免超出限制。
插件
智能体应用通过调用插件,可完成代码执行、网络搜索、基于文本生成图片等具体任务。阿里云百炼提供了多种官方插件,同时也支持添加自定义插件,详情参见插件概述。

智能体交互
文本对话
文本对话是智能体应用的核心交互方式,能够提供智能和个性化的多轮对话体验。
文本对话支持两种主要输入方式:
文本输入: 输入文字与智能体进行对话。
文件上传: 上传文件作为附件给到智能体,支持文档、图片、视频、音频等多种格式。

智能体发布与调用
百炼智能体支持通过 API 外部调用,同时支持一键发布到三方平台,并通过组件或魔笔分享渠道集成到其他业务流程中。
应用发布
应用发布是后续所有智能体应用调用、集成的前提条件。
单击智能体应用管理界面右上角的发布按钮,单击确认发布,即可完成应用发布。
若应用非首次发布,弹窗会展示自上次发布以来的变更详情。
如果应用为 RAM 账号所创建,发布应用前请确认已拥有服务关联角色权限 ram:CreateServiceLinkedRole,详情请参考服务关联角色。
通过 API 调用
您可以在智能体应用发布渠道页签,单击API调用右侧的查看API,查看通过API调用智能体应用的方法。
将YOUR_API_KEY替换为实际的百炼 API Key 才可发起调用。

智能体管理
删除与复制
可以在应用管理找到已发布的应用卡片,在进行删除与复制智能体、修改应用名操作。

版本管理
通过版本管理功能,可以编辑历史版本描述信息,或选择和使用发布过的历史版本。
在智能体应用的配置页签,单击顶部导航栏右侧的版本管理。

在历史版本列表中,选中目标版本后:

如果需要修改版本信息,请将鼠标悬浮至
图标位置单击,在编辑版本描述对话框中按需完成修改后,单击确定。如果需要使用该历史版本,请单击覆盖当前草稿,在二次确认对话框中单击确认。
该历史版本内容将覆盖当前版本草稿内容。
计费说明
智能体功能计费主要体现在以下几个方面:
模型调用
智能体会产生模型调用费用,具体费用取决于模型类型、输入和输出 Token 数量。
具体的模型类型和对应的计费规则请参考模型列表。
知识库
知识库功能限时免费。
从知识库召回的文本切片会增加模型输入 Token 数量,可能导致模型推理(调用)费用的增加。
MCP
部分官方 MCP 按模型调用计费,如文生图、文生视频、语音合成等 MCP。
部分 MCP 服务涉及第三方 API 调用,使用后可能会产生费用。这部分费用由第三方收取,阿里云百炼不收取费用。
长期记忆
长期记忆的数据存储不收费。
在调用应用进行问答时,记忆体内容会合并到 Prompt 传递给大模型,从而增加 Token 消耗。被记忆体内容占用的Token暂不计费。
支持的模型
数据更新可能存在延迟,模型的支持情况以智能体应用内显示为准。
