前置條件
-
建立及使用應用依賴access key參數,主帳號下access key參數不可為空。
-
在為主帳號建立access key參數後,還可以再建立RAM子帳號access key通過RAM子帳號進行訪問,RAM子帳號賦予對應存取權限,請參考授權訪問鑒權規則。
-
需要使用者擁有VPC環境,詳情可點擊此處進行查看。
如果需要使用子帳號操作召回引擎版執行個體,請使用主帳號為子帳號授予AliyunSearchEngineFullAccess和AliyunSearchEngineReadOnlyAccess 許可權
購買執行個體
-
進入OpenSearch控制台,在左上方切換到OpenSearch-召回引擎版。
-
進入召回引擎版控制台後,在執行個體管理介面,點擊建立執行個體。
-
商品版本選擇召回引擎版,選擇地區,配置“查詢節點個數”、“查詢節點規格”、“資料節點數量”、“資料節點規格”、“單資料節點總儲存空間”,設定“專用網路”和“虛擬交換器”,最後按提示要求設定使用者名稱和使用者密碼(用於查詢時校正許可權,非阿里雲帳號密碼),點擊”立即購買”。
-
購買的查詢節點和資料節點的個數及規格,需根據自身業務進行規劃,確定規格後實際費用可在售賣頁自動產生。
-
專用網路和虛擬交換的配置一定要和訪問召回引擎版執行個體的ECS機器保持一致。否則在訪問召回引擎版執行個體時會報錯{'errors':{'code':'403','message':'Forbidden'}}
-
單資料節點儲存空間有免費額度,使用者也可申請額外額度,按額外額度部分收費(步長50GB)
-
在確認訂單介面,查看服務合約,確認無誤後,點擊立即開通。
-
購買成功後,點擊管理主控台,即可在執行個體管理介面查看已購買的召回引擎版執行個體。
-
新購的執行個體會設定一個預設執行個體名稱,可在操作欄下點擊管理按鈕,進入詳情頁進行修改。
點擊修改表徵圖,按提示框要求修改執行個體名稱最後點擊確認。
配置叢集
新購買的執行個體,在其詳情頁中,執行個體狀態為“待配置”,並且會自動部署一個與購買的查詢節點和資料節點的個數及規格一致的空叢集,之後需要為該叢集配置資料來源--->配置索引--->索引重建,之後才可正常搜尋。
-
配置資料來源(目前支援的資料來源有“MaxCompute資料來源”和“API推送資料來源”)這裡以MaxCompute資料來源為例:點擊“添加資料來源”,資料來源類型選擇“MaxCompute”,設定project、accesskeyID、accesskeyId、accesskeySecret、Table、分組鍵partition,可按需選擇是否開啟“”。
校正成功之後,點擊“確定”,完成資料來源的添加。
-
資料來源配置成功後,需點擊下一步配置索引結構:
2.1. 添加索引表:在索引結構頁面中,單擊添加索引表按鈕。
2.2. 配置索引表:
-
索引表:可自訂
-
資料來源:選擇 1 中配置的資料來源
-
資料分區:根據使用者購買的資料節點個數進行配置
2.3. 欄位設定:
欄位設定表格中包含欄位名稱、欄位類型、主鍵、屬性、屬性壓縮、摘要壓縮、摘要區間、分析方式和進階配置列,可按需配置各欄位屬性。
屬性和欄位內容壓縮:
-
屬性欄位可以選擇是否壓縮,預設為不壓縮,選擇file_compressor表示開啟壓縮
-
欄位內容可以選擇是否壓縮,預設為不壓縮,預設多值和STRING類型選擇uniq,單值數實值型別是equal
-
如果開啟了屬性壓縮,建議前往「部署管理-資料節點-線上表配置」編輯索引載入方式,以此降低對效能的影響。
-
支援複製欄位操作,複製出的新欄位(DUP欄位)與原欄位內容保持一致(推送不一致內容時,將採用原欄位內容覆蓋),如期望欄位內容不一致,請手動刪除DUP欄位進階配置中的copy from配置。
2.4. 索引設定:
索引設定表格中包含索引名稱、索引類型、包含欄位、資料壓縮、進階配置和操作列,可查看和修改各索引配置。
-
索引欄位可以選擇是否壓縮,預設為不壓縮,選擇file_compressor表示開啟壓縮
-
主鍵索引不支援壓縮
-
如果開啟了索引壓縮,建議前往「部署管理-資料節點-線上表配置」編輯索引載入方式,以此降低對效能的影響
-
配置完成後,點擊儲存版本,並在彈框後填寫備忘(可選),點擊發布。
等待索引發布完成後,可點擊“下一步”進行索引重建。
-
索引重建,選擇索引重建需要配置的參數項,點擊“下一步”。
-
API推送資料來源:
選擇資料來源名稱和關聯索引表,確認資料來源類型為API推送資料來源,然後單擊下一步。
-
MaxCompute資料來源:
選擇資料來源名稱和關聯索引表,確認資料來源類型為MaxCompute,配置資料分區和時間戳記參數,然後單擊下一步。
查看索引重建進度
資料來源及索引結構配置完成後,可在營運中心>部署管理中查看叢集拓撲:
拓撲圖展示了查詢接入、叢集(含資料節點和查詢節點)、索引表和資料來源之間的層級關係。
更新配置之後,可在營運中心>變更歷史>資料來源變更處查看索引重建進度:
索引重建流程包含 init、trigger、scan、build 和 switch 五個階段,各階段完成後會顯示綠色對勾標記。
並且在執行個體詳情頁中,也可查看叢集的查詢節點和資料節點的狀態,狀態均為正常後,即可進行查詢測試:
查詢節點顯示服務狀態(服務中)和配置狀態(配置已更新);資料節點額外顯示資料狀態(資料已更新),三項狀態均為 100% 即表示正常。
查詢測試
可在功能擴充>查詢測試中進行簡單的搜尋測試,召回引擎版支援的查詢方式有HA3子句和SQL子句兩種:
選取查詢方式(如SQL子句),在輸入框中輸入查詢語句(例如 select * from index_a),單擊搜尋即可查看查詢結果,結果中包含耗時(USE_TIME)和命中條數(ROW_COUNT)等資訊。
注意事項
-
付費方式暫時僅支援隨用隨付;
-
購買執行個體時設定的使用者名稱和密碼可在執行個體詳情頁進行修改;
-
叢集名稱在購買執行個體時由系統為使用者指定使用的叢集,使用者暫時無法修改;
-
索引重建需按照每次消耗的資源量付費,詳情可參考計費概述;