文檔上傳後由系統自動切片(Chunk)。每個 Chunk 儲存向量資料和原文內容,是檢索的最小單元。通過以下介面查看和調整切片內容。
查看切片
調用 list_chunks 分頁查詢指定文檔的切片列表。
請求參數
參數 | 類型 | 說明 |
| string | 知識庫名稱(必填) |
| string | 子空間名稱。開啟 subspace 時必填 |
| string | 文檔 ID。與 |
| string | OSS 路徑。與 |
| int | 返回數量。預設為 10,最大 1000 |
| string | 翻頁 token |
程式碼範例
resp = client.list_chunks({
"knowledgeBaseName": "product_docs_kb",
"docId": "fc6ed97f-...",
"maxResults": 5
})
for chunk in resp["data"]["chunkDetails"]:
print(f"[Chunk {chunk['chunkId']}] ({chunk['status']}) {chunk['content'][:80]}...")響應說明
欄位 | 類型 | 說明 |
| string | 所屬子空間 |
| int | 切片 ID |
| string | 切片內容 |
| string | 切片標題 |
| string | 切片類型,如 |
| string |
|
| string | 所屬文檔 ID |
| string | 所屬文檔 OSS 路徑 |
| int | 建立時間戳記 |
| int | 更新時間戳記 |
| string | 翻頁 token,為空白表示最後一頁 |
更新切片
調用 update_chunks 批次更新切片的標題、內容或狀態。
請求參數
參數 | 類型 | 說明 |
| string | 知識庫名稱(必填) |
| string | 子空間名稱。開啟 subspace 時必填 |
| list<object> | 要更新的切片列表(必填)。單次請求最多 10 個切片。 說明 如需提升請提交工單或加入Table Store技術交流群36165029092後聯絡支援人員。 |
| string | 文檔 ID。與 |
| string | OSS 路徑。與 |
| int | 切片 ID(必填) |
| string | 更新標題 |
| string | 更新內容 |
| string | 修改狀態: |
程式碼範例
修改切片內容:
resp = client.update_chunks({
"knowledgeBaseName": "product_docs_kb",
"chunks": [
{
"docId": "fc6ed97f-...",
"chunkId": 1,
"title": "更新後的標題",
"content": "更新後的內容"
}
]
})屏蔽不準確的切片(設為不可檢索):
resp = client.update_chunks({
"knowledgeBaseName": "product_docs_kb",
"chunks": [
{
"docId": "fc6ed97f-...",
"chunkId": 0,
"status": "inactive"
}
]
})響應說明
欄位 | 類型 | 說明 |
| string | 文檔 ID |
| string | OSS 路徑 |
| int | 切片 ID |
| string |
|
| string | 失敗原因,僅 failed 時 |
注意事項
將切片的
status設為inactive後,該切片不會出現在 Retrieve 結果中。可用於臨時屏蔽不準確的內容,無需刪除整個文檔。