知识库用于为大模型补充私有数据和最新信息。基于 RAG(检索增强生成)技术,大模型在生成回答前会先从知识库中检索相关内容,从而提升回答的准确性。
|
无专属知识库的应用 无专属知识库时,大模型无法准确回答特定领域的问题。
|
有专属知识库的应用 引入专属知识库后,大模型可准确回答特定领域的问题。
|
支持的模型
以下模型支持使用知识库。配置千问使用知识库教程
-
千问-Max/Plus/Turbo
-
千问VL-Max/Plus
-
千问-开源版(Qwen2.5等)
上述列表随时可能更新。请以在 应用管理 页面创建应用时实际可选的模型为准。
快速开始
本节介绍如何无需编写代码,快速构建一个能够回答特定领域问题(以"阿里云百炼手机"为例)的大模型问答应用。
1. 构建知识库
-
进入知识库页面,点击创建知识库。填写知识库名称和知识库描述,其余设置保持默认,点击下一步。
-
选择默认类目,上传阿里云百炼系列手机产品介绍.docx文件。点击下一步,然后点击完成。
2. 集成到业务应用
知识库创建后,可将其关联至同一业务空间下的阿里云百炼应用或外部应用,以处理检索请求。
集成到智能体应用
-
进入应用管理页面,找到目标智能体应用,点击卡片上的配置,并为应用选择模型。
-
点击页面上文档知识库右侧的 + 按钮,添加上一步创建的知识库。相似度阈值和权重可保持默认。
-
在页面右侧的输入框中输入问题,大模型将基于所构建的知识库进行回答。
例如:"请帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。"
集成到工作流应用
-
进入应用管理页面,找到目标工作流应用,点击卡片上的配置。将知识库节点拖入画布,连接在开始节点之后。
-
配置知识库节点:
-
输入:在变量名
content右侧的值下拉列表中,选择。下拉列表为树形结构,需展开"内置变量"分组后选择 query。 -
选择知识库:知识库节点支持以下两种选择方式。
-
选择固定知识库:从下拉菜单中选择上一步创建的知识库。适用于每次调用同一知识库的场景。
-
动态引入:配置
CodeList变量,根据上游节点的输出动态指定知识库。适用于需根据不同输入检索不同知识库的场景。
-
-
设置 TopK(可选):决定返回给下游节点(通常为大模型节点)的知识片段数量。
增大该值通常能提升大模型回答的准确性,但会相应增加大模型的输入 Token 消耗。
-
-
将大模型节点拖入画布,连接在知识库节点之后、结束节点之前。
-
配置大模型节点:
-
在模型配置列表中,为节点选择模型。
-
在提示词中,输入指示大模型使用知识库的提示词。输入"/"可插入
result变量(表示知识库检索返回的结果)。
-
-
配置结束节点:输入
/,选择,输出大模型返回的结果。 -
点击页面右上角的测试,在页面右侧的输入框中输入问题,大模型将基于所构建的知识库进行回答。
例如:"请帮我挑选一款拍照效果最好的阿里云百炼手机,价格在3000元以内。"
集成到外部应用
除在阿里云百炼内构建应用外,也可通过阿里云百炼SDK调用知识库的检索能力,为外部 AI 应用提供检索服务。
具体集成步骤,请参见知识库API指南。
3. 优化知识库效果(可选)
若问答过程中出现知识召回不完整或内容不准确的情况,请参见知识库效果优化。
操作指南
知识库ID: 即每个知识库卡片上 ID 字段的值,用于API调用等场景。
创建知识库
点击创建知识库后,按三步完成创建:填写基础信息并选择知识库类型、配置数据来源、设置索引参数。
-
在知识库页面,点击创建知识库。
-
填写基础信息
根据应用场景选择合适的知识库类型(单一知识库不支持同时选择多个类型)。选择文档搜索类型后,还需选择使用场景(基础文档问答、图文并茂回复):
-
基础文档问答:适用于纯文本文档的语义检索。
-
图文并茂回复:适用于需要返回图文混排内容的场景。
创建后,知识库类型不可更改。
-
文档搜索(检索场景)
-
适用场景:
-
适用于企业内部文档、产品手册等非结构化数据(即未按预定义表结构组织的数据,包含文本、表格和图片)的检索。
-
若文件包含图片,且需阿里云百炼应用在回答中返回,请选择文档搜索。
-
-
数据来源:支持本地上传文件或从阿里云对象存储OSS导入。
-
-
数据查询(Chatbot 或 NL2SQL 场景)
-
适用场景:
-
适合构建基于结构化数据(按预定义表结构组织的数据)的问答系统,例如 FAQ、商品数据、人员信息查询助手等。
-
若数据为完整的 FAQ 问答对,请选择数据查询。例如,Excel 文件包含两列,分别为
问题和答案。数据查询类知识库支持将问题列用于知识库检索,答案列用于大模型回答参考。文档搜索类知识库无法实现此效果。
-
支持导入多个Excel文件,但要求各文件的表结构完全一致。
-
-
数据源接入:支持本地上传 XLS 或 XLSX 文件。
-
-
图片问答(图搜场景)
-
适用场景:
-
适合构建以图搜图、以图搜"图文"的多模态检索应用,如商品导购助手、视觉问答助手等。
-
-
数据源接入:支持本地上传 XLS 或 XLSX 文件。
XLS、XLSX 文件 中需包含 公开可访问 的图片 URL,以便构建图片索引。详见下方创建说明。
-
使用场景可根据需求选择基础文档问答、图文并茂回复。
-
在请求高峰时段,创建过程可能需要数小时(取决于数据量),请耐心等待。
更新知识库
知识库内容的任何变更均会实时同步到所有引用该知识库的应用中。
文档搜索类知识库
-
自动更新(推荐)
可通过整合对象存储 OSS、函数计算 FC 以及阿里云百炼知识库相关API实现。操作步骤如下:
-
手动更新
在知识库页面,找到目标知识库,单击卡片上的查看详情。
-
如何新增文件:单击上传数据,勾选数据连接器中的已有文件。
-
如何删除文件:找到目标文件后,单击其右侧的删除。
-
如何修改文件内容:当前不支持文件的原地更新或覆盖上传。需先删除知识库中的旧版本文件,再将修改后的新版本文件重新导入知识库。
注意:保留旧版本文件可能导致过时内容被检索和召回。
-
数据查询、图片问答类知识库
说明 :图片问答类知识库的详情页没有直接的 上传数据 按钮,需通过 查看数据源 链接跳转到连接器详情页进行数据更新操作。
-
自动更新
不支持。
-
手动更新
当知识库的数据源为应用数据中的数据表时,只能手动更新,分为以下两步。
-
步骤一:更新数据表
进入应用数据页签,在左侧列表中选择目标数据表,单击上传数据。
-
如何插入新数据:导入类型选择增量上传。需上传一个仅包含表头和新增数据行的Excel文件。
文件表头须与当前表结构一致。可使用页面上的 下载模板 功能获取标准表头文件,并在该文件中直接填写新数据。
-
如何删除数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已移除待删除记录)的Excel文件。
如何获取全量数据:单击页面上的
下载XLSX格式数据。 -
如何修改数据:导入类型选择覆盖上传。需上传一个包含表头及最新完整数据(已包含相应修改)的Excel文件。
-
-
步骤二:将变更同步至知识库
返回知识库列表,找到目标知识库,单击卡片上的查看详情。单击数据表左上方的
图标,确认后即可将数据表的最新内容同步至知识库。每次更新后仍需手动重复以上步骤 。
-
音视频搜索类知识库
编辑知识库
知识库创建后,仅支持修改知识库名称、知识库描述和相似度阈值,其他配置均无法更改(如需更改,须删除并重新创建知识库)。编辑操作仅支持通过控制台进行,无对应API。
操作步骤:在知识库页面,找到目标知识库,单击卡片上的
,再单击编辑。注意:同一知识库每个自然日最多允许变配1次,超出后操作将被静默拒绝(无错误提示)。
删除知识库
删除操作不可逆,请谨慎操作。
删除知识库前,建议先解除其与所有已发布的阿里云百炼应用的关联。
已关联的未发布应用不影响删除操作。
变更配置
旗舰版提供RCU以保障高QPS下的检索性能,并支持更大的存储容量;标准版适合开发测试或低并发场景。
标准版与旗舰版支持互转。旗舰版的RCU数量支持修改。
同一知识库每个自然日最多允许变配1次。
RCU: RCU(Retrieval Compute Unit)是知识库检索并发能力的度量单位。1 RCU ≈ 支撑在线检索最高50 QPS。RCU越大,可支撑的并发数越高。
-
注意:
-
如果知识库(旗舰版)使用平台存储,降级为标准版前,需将已用存储空间降至80 GB以下。
可通过删除知识库内的文件或数据来释放存储空间。
-
-
操作步骤:
-
在知识库页面,找到目标知识库,单击卡片上的
,再单击编辑。 -
根据当前版本,在弹出的窗口中选择相应操作:
-
标准版:选择升级。
-
旗舰版:选择降级或变更RCU数量。
-
-
按照界面提示完成操作,单击确定保存后配置即时生效。
-
命中测试
命中测试用于验证知识库能否为AI应用提供准确的知识输入。通过模拟用户提问,检查知识库的召回结果并调优相似度阈值。
命中测试中的排序模型支持三种模式:问答模式(默认,适合用户提问与文档内容不完全匹配的场景)、相似模式(适合查询与文档内容高度相似的场景)和自定义高级模式。不同模式下,同一查询的排序得分可能存在显著差异(例如,同一切片在问答模式下得分47%,在相似模式下可达69%)。
通过命中测试,可以:
-
验证知识库能否为AI应用提供有效的知识输入
-
调优相似度阈值,平衡召回率与准确性
-
发现知识库中的内容缺失或质量问题
场景示例
-
场景1:客户咨询产品价格
测试输入:"你们的阿里云百炼手机多少钱?" 期望结果:能够召回包含价格信息的相关文本切片。 -
场景2:技术问题排查
测试输入:"设备连不上WiFi怎么办?" 期望结果:能够召回WiFi连接故障排除的相关文本切片。 -
场景3:视觉理解文档检索(视觉理解知识库)
视觉理解知识库支持纯文字、纯图片和图文组合三种查询模式: 模式1(纯文字):输入"Object Storage Service",召回文档和图片中的相关切片。 模式2(纯图片):上传一张产品截图,系统通过视觉理解匹配语义相近的切片。 模式3(图+文字):同时上传图片并输入描述文字,组合查询可提升召回相似度。 -
场景4:极速问答(极速问答知识库)
极速问答知识库仅支持文本查询(不支持图片输入),适合结构化文档的快速检索: 测试输入:"千问Pro 8的价格是多少?" 期望结果:快速召回包含价格信息的 FAQ 切片。
操作步骤
-
在知识库页面,找到目标知识库,单击卡片上的命中测试。
-
在测试界面输入问题(建议收集用户常见问题),观察召回结果。
-
召回结果:即本次测试的命中结果(已按相似度降序排列),单击任一切片即可查看其具体内容。
-
图标:若为图片问答类知识库,系统会先将输入图片转为向量并检索相关记录,再将这些记录与提问一起交由大模型生成回答;若为文档搜索、数据查询类知识库,上传的图片不参与检索;若为使用场景选择「视觉理解」的文档搜索类知识库,上传图片同样参与检索,支持纯文字、纯图片和图文组合三种查询模式,图文组合查询可提升召回相似度。
-
-
确认相关文本切片是否被正确召回。如未召回,需调整相似度阈值并重复上一步。
-
单击查看历史召回记录,可对比不同阈值设置下的历史召回效果。
配额与限制
-
关于知识库支持的数据源与容量等信息,请参见知识库配额与限制。
-
单个阿里云百炼应用可关联的知识库数量:
-
文档搜索类:最多5个
-
数据查询类:最多5个
-
图片问答类:最多1个
不同类型知识库可同时关联,总数最多为11个。
-
计费说明
知识库功能本身免费,但调用引用了知识库的阿里云百炼应用时,可能产生相应费用。
|
步骤 |
计费情况 |
|
|
|
不收费。 |
|
|
|
调用阿里云百炼应用时,知识库召回的文本切片会增加大模型输入 Token 数量,从而可能增加模型推理(调用)费用。详情请参见计费项与定价。 注意:若仅通过调用Retrieve 接口在知识库中检索,不经过阿里云百炼应用生成回答,则不产生费用。 |
|
|
|
不收费。 |
|
API参考
-
如需获取最新完整的知识库API列表及输入输出参数,请参见API 目录(知识库)。
-
如需了解相关API的具体用法和代码示例,请参见知识库API指南。














