全部產品
Search
文件中心

Hologres:一鍵匯入公用資料集

更新時間:Jan 11, 2025

HoloWeb支援使用可視化方式一鍵匯入公用資料集,方便您快速完成公用資料匯入並查詢。本文為您介紹如何使用HoloWeb建立一鍵匯入任務並查看任務狀態資訊。

背景資訊

HoloWeb支援一鍵匯入tpch_10gtpch_100gtpch_1tgithub_event四個公用資料集。其中:

  • tpch_10gtpch_100gtpch_1t公用資料集:類比零售情境的公開資料集,資料量分別為10 GB、100 GB和1 TB,詳情請參見測試方案介紹

  • github_event公用資料集:GitHub官方公開事件數目據集,詳情請參見業務與資料認知

前提條件

  • Hologres執行個體版本為 V1.3.13及以上版本。

  • HoloWeb中已登入執行個體,詳情請參見登入執行個體

注意事項

  • 僅華北2(北京)、華東2(上海)、華東1(杭州)、華南1(深圳)、華北3(張家口)地區的Hologres執行個體支援一鍵匯入公用資料集功能。

  • 執行一鍵匯入公用資料集的使用者需要有建立Schema、建立表、寫入資料等許可權,授權操作請參見Hologres許可權模型

  • 公用資料集匯入任務執行時間長度預計3~20分鐘,具體受執行個體規格等因素影響。請您提前規劃計算資源,避免影響線上業務。

  • 公用資料集匯入任務會自動建立兩個Schema及若干外部表格和內部表,請檢查資料庫中已有的Schema、外部表格和內部表,避免名稱相同,以免資料誤刪。

建立公用資料集匯入任務

  1. 進入HoloWeb開發頁面,詳情請參見串連HoloWeb

  2. 在HoloWeb開發頁面的頂部功能表列,單擊資料方案

  3. 資料方案頁面,單擊左側導覽列的一鍵匯入公用資料集

  4. 一鍵匯入公用資料集頁面,單擊建立公用資料集匯入任務

  5. 建立公用資料集匯入任務頁面,選擇執行個體名資料庫公用資料集名後,選擇是否使用Serverless Computing資源執行資料匯入,然後單擊提交

    image

查看公用資料集匯入任務資訊

  1. 一鍵匯入公用資料集頁面,選擇執行個體名資料庫後,單擊查詢,查看公用資料集工作清單。

    image

    工作清單包含如下資訊和操作:

    • 資訊:序號執行個體名資料庫公用資料集名狀態執行進度(指已完成SQL數/總SQL數)、建立時間結束時間

    • 操作:詳情停止重新運行刪除執行歷史去查詢

  2. 任務狀態執行成功時,公用資料集匯入任務即完成,然後您可單擊目標任務操作列的去查詢,進一步進行資料分析。

刪除公用資料集

執行如下SQL,刪除公用資料集所在Schema以及所有依賴項(以tpch_100g資料集為例),請謹慎使用,以防資料誤刪。

DROP SCHEMA hologres_dataset_tpch_100g, hologres_foreign_dataset_tpch_100g CASCADE;