全部產品
Search
文件中心

Data Lake Formation:共用範例資料集

更新時間:Oct 03, 2025

通過共用範例資料集,可快速驗證資料處理效能、最佳化查詢效率或進行功能驗證,是開發、測試及學習的理想資源。

建立資料集

  1. 登入資料湖構建控制台

  2. 單擊左側導覽列資料目錄

  3. 點擊資料共用 > 我接收的,找到名為dlf_samples的資料共用,並建立Catalog

    image

  4. 單擊Catalogs頁簽,可以看到建立後的Catalog。

    image

查詢資料集

資料共用目錄提供了多種規格的 TPC-DS 標準範例資料庫,適用於不同規模的資料測試、分析及基準效能評估。具體包含以下資料集:

範例資料庫名稱

範例資料說明

tpcds_paimon_sf1

TPC-DS 1G Paimon 表

tpcds_paimon_sf2

TPC-DS 2G Paimon 表

tpcds_paimon_sf10

TPC-DS 10G Paimon 表

tpcds_paimon_sf100

TPC-DS 100G Paimon 表

tpcds_iceberg_sf1

TPC-DS 1T Iceberg 表

說明

支援在其他平台上(如EMR、Flink等)關聯此Catalog,進行資料查詢,詳情請參見引擎對接