通過共用範例資料集,可快速驗證資料處理效能、最佳化查詢效率或進行功能驗證,是開發、測試及學習的理想資源。
建立資料集
登入資料湖構建控制台。
單擊左側導覽列資料目錄。
點擊,找到名為dlf_samples的資料共用,並建立Catalog。

單擊Catalogs頁簽,可以看到建立後的Catalog。

查詢資料集
資料共用目錄提供了多種規格的 TPC-DS 標準範例資料庫,適用於不同規模的資料測試、分析及基準效能評估。具體包含以下資料集:
範例資料庫名稱 | 範例資料說明 |
tpcds_paimon_sf1 | TPC-DS 1G Paimon 表 |
tpcds_paimon_sf2 | TPC-DS 2G Paimon 表 |
tpcds_paimon_sf10 | TPC-DS 10G Paimon 表 |
tpcds_paimon_sf100 | TPC-DS 100G Paimon 表 |
tpcds_iceberg_sf1 | TPC-DS 1T Iceberg 表 |
說明
支援在其他平台上(如EMR、Flink等)關聯此Catalog,進行資料查詢,詳情請參見引擎對接。