建立知識庫。
調試
您可以在OpenAPI Explorer中直接運行該介面,免去您計算簽名的困擾。運行成功後,OpenAPI Explorer可以自動產生SDK程式碼範例。
調試
授權資訊
|
操作 |
存取層級 |
資源類型 |
條件關鍵字 |
關聯操作 |
|
gpdb:CreateDocumentCollection |
create |
*Collection
|
無 | 無 |
請求參數
|
名稱 |
類型 |
必填 |
描述 |
樣本值 |
| DBInstanceId |
string |
是 |
執行個體 ID。 說明
您可以調用 DescribeDBInstances 介面查看目標地區下所有的 AnalyticDB PostgreSQL 執行個體的詳情,包括執行個體 ID。 |
gp-xxxxxxxxx |
| ManagerAccount |
string |
是 |
具有 rds_superuser 許可權的管理帳號名稱。 說明
您可以通過控制台->帳號管理來建立帳號,或者通過 CreateAccount 介面建立。 |
testaccount |
| ManagerAccountPassword |
string |
是 |
管理帳號密碼。 |
testpassword |
| Namespace |
string |
否 |
命名空間,預設為 public。 說明
您可以通過 CreateNamespace 介面建立,通過 ListNamespaces 介面查看列表。 |
mynamespace |
| Collection |
string |
是 |
要建立的文件庫名稱。 說明
名稱需符合 PostgreSQL 對象名限制。 |
document |
| RegionId |
string |
是 |
執行個體所在地區 ID。 |
cn-hangzhou |
| EmbeddingModel |
string |
否 |
向量化演算法。預設值:text-embedding-v3。 說明
支援的演算法:
|
text-embedding-v1 |
| Dimension |
integer |
否 |
向量維度。預設值是向量化演算法支援的維度。 |
1024 |
| FullTextRetrievalFields |
string |
否 |
用於全文檢索索引的欄位,多個欄位用英文逗號(,)分隔,且欄位必須屬於 Metadata 裡定義的 key。 |
title,page |
| Metadata |
string |
否 |
向量資料的元資訊,為 MAP 格式的 JSON 字串。其中 key 代表欄位名,value 代表資料類型。 說明
支援的資料類型
警告 id、vector、doc_name、content、loader_metadata、source、to_tsvector 欄位為保留欄位,禁止使用。 |
{"title":"text","page":"int"} |
| Parser |
string |
否 |
用於全文檢索索引的分詞器,預設為 zh_cn。 |
zh_cn |
| Metrics |
string |
否 |
向量構建索引時的方法 取值說明:
|
cosine |
| HnswM |
integer |
否 |
HNSW 演算法中的最大鄰居數。介面會根據向量維度自動化佈建此值,一般不需要手動設定。 說明
取值範圍:
說明
建議根據向量維度來設定:
|
64 |
| HnswEfConstruction |
string |
否 |
HNSW 演算法構建索引時的候選集大小。取值需要>= 2*HNSW_M。 說明
取值範圍:
|
128 |
| PqEnable |
integer |
否 |
索引是否開啟 PQ(Product quantization)演算法加速,資料量大於 50w 時建議開啟。取值說明:
|
1 |
| ExternalStorage |
integer |
否 |
是否使用 mmap 構建 HNSW 索引,預設為 0。如果資料不需要刪除,且對上傳資料的速度效能有要求時,建議設定為 1。 取值說明:
重要 僅 6.0 版本支援參數 ExternalStorage。7.0 版本暫不支援。 |
0 |
| MetadataIndices |
string |
否 |
標量索引欄位,多個欄位用英文逗號(,)分隔,且欄位必須屬於 Metadata 裡定義的 key。 |
title |
| EnableGraph |
boolean |
否 |
是否開啟構建知識圖譜。預設值:false。 說明
使用該參數前,執行個體必須升級到開啟圖引擎的版本。(公測期間請提工單升級版本) |
true |
| LLMModel |
string |
否 |
LLM 模型名稱。取值說明:
說明
僅當開啟構建知識圖譜時,該參數生效。 |
knowledge-extract-standard |
| Language |
string |
否 |
構建知識圖譜使用的語言。取值說明:
說明
僅當開啟構建知識圖譜時,該參數生效。 |
Simplified Chinese |
| EntityTypes |
array |
否 |
實體類型列表。 說明
當開啟構建知識圖譜時,該參數必傳。 |
|
|
string |
否 |
實體類型。 |
地點 |
|
| RelationshipTypes |
array |
否 |
關係邊類型列表。 說明
當開啟構建知識圖譜時,該參數必傳。 |
|
|
string |
否 |
關係邊類型。 |
發生 |
|
| SupportSparse |
boolean |
否 |
是否支援稀疏向量。預設值:false。 |
true |
| SparseVectorIndexConfig |
object |
否 |
稀疏向量索引配置。如果傳入,則建立稀疏向量索引。 |
|
| HnswM |
integer |
否 |
HNSW 演算法中的最大鄰居數。介面會根據向量維度自動化佈建此值,一般不需要手動設定。 說明
取值範圍:
說明
建議根據向量維度來設定:
|
64 |
| HnswEfConstruction |
integer |
否 |
HNSW 演算法構建索引時的候選集大小。取值範圍:4~1000,預設值 64。 說明
僅 AnalyticDB PostgreSQL 7.0 版執行個體需要傳該值,且取值需要>= 2*HNSW_M。 |
128 |
| SparseRetrievalFields |
string |
否 |
用於構建稀疏向量的 metadata 欄位,多個欄位用英文逗號(,)分隔,且欄位必須屬於 Metadata 裡定義的 key。 |
title,abstract |
返回參數
|
名稱 |
類型 |
描述 |
樣本值 |
|
object |
|||
| RequestId |
string |
請求 ID。 |
ABB39CC3-4488-4857-905D-2E4A051D0521 |
| Message |
string |
返回資訊。 |
Successful |
| Status |
string |
API 執行狀態,取值如下:
|
successs |
樣本
正常返回樣本
JSON格式
{
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521",
"Message": "Successful",
"Status": "successs"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
更多資訊,參考變更詳情。