HoloWeb支援一鍵同步OSS資料功能,允許您使用可視化方式將OSS表資料快速匯入至Hologres內部表並進行查詢,與建立外部表格直接查詢資料的方式相比,其查詢效能更加優越。
前提條件
-
存在已登入執行個體,請參見登入執行個體。
-
已建立Foreign Server,詳情請參見建立Foreign Server。
操作步驟
-
在頂部功能表列左側,選擇相應的地區。
在左側導覽列單擊前往HoloWeb,進入HoloWeb開發頁面。
-
登入目標資料庫後,在頂部功能表列單擊元數據管理 > OSS數據湖加速 > 一鍵OSS數據導入,進入一鍵OSS數據湖數據導入頁面。
-
配置新建OSS數據導入任務的各項參數,SQL Script將為您自動解析當前可視化操作對應的SQL語句。
類別
參數名
描述
選擇執行個體
執行個體名
已登入的執行個體名稱。
DLF源表
Server Name
建立的Foreign Server(外部伺服器)名稱。
資料庫名
需要匯入的OSS資料所在的DLF資料庫名稱。
表名
需要匯入的OSS資料表名。
Hologres目標表
資料庫名
待匯入至Hologres的目標資料庫名稱。
Schema Name
預設為public,可在下拉式清單中選擇其他有許可權的Schema。
表名
建立的Hologres內部表名稱。
您無需手動建立,輸入目標DLF表名後,系統將會自動填入相同的Hologres內部表名,您也可以對其進行重新命名。
對於已經存在的同名內部表:
-
非分區表:執行後,原表和資料會被刪除,並重建。
-
分區表:不刪除原表和資料,根據分區值直接建立分區子表,並插入資料。若DLF表結構與已存在的同名內部表不一致,則執行會報錯。
目標表描述
建立的Hologres內部表描述,可自訂修改。
參數設定
GUC參數
需要設定的GUC參數。
通常需要在控製作業讀寫並發時輸入。格式為:
set <GUC>=<values>;,如需設定多個GUC參數,需要分行填寫。匯入設定
欄位
需要匯入的DLF表欄位。
您可以選擇匯入部分或全部欄位。
分區配置
-
分區字段:選擇分區欄位
-
業務日期:如果DLF表使用日期作為分區,您可以選擇具體的分區日期,系統將會匯入指定日期的資料至Hologres表。
索引配置
-
存儲模式:
-
列存:適用於各種複雜查詢。
-
行存:適用於基於主鍵的點查詢和Scan。
-
行列共存:適用於OLAP複雜分析和高並發點查、非主鍵點查等多種情境。
如果不指定儲存模式,則系統預設使用列存模式。
更多資訊請參見表格儲存體格式:列存、行存、行列共存。
-
-
錶數據生命周期:表資料的生命週期,預設為永久儲存。指定生命週期後,如果資料在指定時間內未被修改,則引擎將會在到期後的某一個時間段刪除資料。
-
Binlog:表是否開啟Binlog,詳情請參見訂閱Hologres Binlog。
說明Hologres V0.9及以上版本支援單表層級的Binlog功能。
-
Binlog生命周期:Binlog的TTL,單位為秒。預設為30天,即預設2592000秒,詳情請參見訂閱Hologres Binlog。
完成上述配置後,您可對需要匯入的DLF表欄位設定欄位屬性。如:分布列、分段列、聚簇列、字典編碼列、位元影像列。
-
-
單擊頁面右上方的提交後,可在一鍵OSS數據導入頁面查看資料匯入任務的執行詳情。
-
(可選)您可在對應匯入任務的操作列對任務進行詳情查看、重新運行、刪除或查看執行歷史操作。
查詢OSS資料
OSS資料匯入任務執行成功後,Hologres將自動產生一個內部表,您可在Hologres中執行如下SQL語句查詢資料:
SELECT * FROM <tablename>;
其中tablename為上述建立OSS資料匯入任務時填寫的Hologres內部表名稱。