向指定知识库中追加导入已解析的文件。
接口说明
-
本接口不支持数据查询/图片问答类知识库。关于如何更新数据查询/图片问答类知识库,请参见知识库一文中关于更新知识库的说明。
-
RAM 用户(子账号)需要首先获取阿里云百炼的 API 权限(需要
AliyunBailianDataFullAccess,已包括 sfm:SubmitIndexAddDocumentsJob 权限点),并加入一个业务空间后,方可调用本接口。阿里云账号(主账号)可直接调用无须授权。建议您通过最新版阿里云百炼 SDK来调用本接口。 -
调用本接口前,请确保您的知识库已经创建完成且未被删除(即知识库 ID
IndexId有效)。 -
调用该接口前,请先调用 AddFile 接口将您需要追加导入的文件上传至阿里云百炼。
-
调用本接口后,任务需一定时间执行,高峰期可能耗时数小时。任务完成前请勿重复发起请求。如果需要查询任务的执行状态,可调用 GetIndexJobStatus 接口查询。此接口返回的文件列表
Documents为您本次追加(由您提供的job_id唯一确定)全部文件,您可以查看每个文件是否导入(解析)成功。注意频繁调用 GetIndexJobStatus 接口会被限流,频率请勿高于 20 次/分钟。 -
本接口调用成功后,将执行一段时间,请求返回前请勿重复发起请求。本接口不具备幂等性。
限流说明: 本接口频繁调用会被限流,频率请勿超过 10 次/秒。如遇限流,请稍后重试。
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
调试
授权信息
|
操作 |
访问级别 |
资源类型 |
条件关键字 |
关联操作 |
|
sfm:SubmitIndexAddDocumentsJob |
create |
*全部资源
|
无 | 无 |
请求语法
POST /{WorkspaceId}/index/add_documents_to_index HTTP/1.1
路径参数
|
名称 |
类型 |
必填 |
描述 |
示例值 |
| WorkspaceId |
string |
是 |
知识库所属的业务空间 ID。获取方式请参见如何使用业务空间。 |
llm-3shx2gu255oqxxxx |
请求参数
|
名称 |
类型 |
必填 |
描述 |
示例值 |
| IndexId |
string |
是 |
知识库 ID,即 CreateIndex 接口返回的 |
79c0alxxxx |
| SourceType |
string |
是 |
数据来源类型。取值范围:
说明
如果本参数传入 DATA_CENTER_CATEGORY,则必须指定 枚举值:
|
DATA_CENTER_FILE |
| DocumentIds |
array |
否 |
文件 ID 列表。 |
|
|
string |
否 |
文件 ID,即 AddFile 接口返回的 |
doc_ea4a504d9ce545508d8aa6d90371bf54xxxxxxxx |
|
| CategoryIds |
array |
否 |
类目 ID 列表。 |
|
|
string |
否 |
类目 ID,即 AddCategory 接口返回的 |
cate_21a407a3372c4ba7aedc649709143f0cxxxxxxxx |
|
| ChunkMode |
string |
否 |
说明
该参数暂不开放,请勿传入。 |
length |
| Separator |
string |
否 |
说明
该参数暂不开放,请勿传入。 |
(?<=。) |
| ChunkSize |
integer |
否 |
说明
该参数暂不开放,请勿传入。 |
128 |
| OverlapSize |
integer |
否 |
说明
该参数暂不开放,请勿传入。 |
16 |
| EnableHeaders |
boolean |
否 |
Excel 文件表头是否支持拼装。开启后,知识库会将所有 xlsx、xls 格式文件的首行数据视为表头,并自动拼接到每个文本切片中(数据行),避免大模型误将表头视为普通数据行来处理。 说明
建议仅在导入文件均为 xlsx、xls 格式且含表头时开启,否则无需开启。 取值范围:
默认值为 false,即不开启。 枚举值:
|
false |
| Extra |
object |
否 |
||
| uniqueId |
string |
否 |
返回参数
|
名称 |
类型 |
描述 |
示例值 |
|
object |
Schema of Response |
||
| RequestId |
string |
请求 ID。 |
778C0B3B-xxxx-5FC1-A947-36EDD13606AB |
| Data |
object |
接口返回的业务字段。 |
|
| Id |
string |
任务 ID,又称 |
42687eb254a34802bed398357f5498ae |
| Status |
string |
接口返回的状态码。 |
200 |
| Success |
boolean |
接口调用是否成功,可能值为:
|
true |
| Message |
string |
错误信息。 |
Required parameter(%s) missing or invalid, please check the request parameters. |
| Code |
string |
错误状态码。 |
Index.InvalidParameter |
示例
正常返回示例
JSON格式
{
"RequestId": "778C0B3B-xxxx-5FC1-A947-36EDD13606AB",
"Data": {
"Id": "42687eb254a34802bed398357f5498ae"
},
"Status": "200",
"Success": true,
"Message": "Required parameter(%s) missing or invalid, please check the request parameters.",
"Code": "Index.InvalidParameter"
}
错误码
|
HTTP status code |
错误码 |
错误信息 |
描述 |
|---|---|---|---|
| 400 | IdempotentParameterMismatch | The request uses the same client token as a previous, but non-identical request. Do not reuse a client token with different requests, unless the requests are identical. |
访问错误中心查看更多错误码。
变更历史
更多信息,参考变更详情。