本文將以建立表bank_data和result_table為例,為您介紹如何建立表並上傳資料。其中表bank_data用於儲存業務資料,表result_table用於儲存資料分析後產生的結果。

操作步驟

建立表bank_data
  1. 建立項目後,單擊對應項目後的進入工作區
  2. 進入DataStudio(原資料開發)頁面,選擇建立 >

  3. 填寫建立表對話方塊中的表名。

  4. 單擊提交
  5. 進入建立表頁面,選擇DDL模式
  6. DDL模式對話方塊中輸入建表語句,單擊產生表結構

    建立表的更多SQL文法請參見建立/查看/刪除表



    本樣本的建表語句如下所示:
    CREATE TABLE IF NOT EXISTS bank_data
    (
     age             BIGINT COMMENT '年齡',
     job             STRING COMMENT '工作類型',
     marital         STRING COMMENT '婚否',
     education       STRING COMMENT '教育程度',
     default         STRING COMMENT '是否有信用卡',
     housing         STRING COMMENT '房貸',
     loan            STRING COMMENT '貸款',
     contact         STRING COMMENT '聯絡途徑',
     month           STRING COMMENT '月份',
     day_of_week     STRING COMMENT '星期幾',
     duration        STRING COMMENT '期間',
     campaign        BIGINT COMMENT '本次活動聯絡的次數',
     pdays           DOUBLE COMMENT '與上一次聯絡的時間間隔',
     previous        DOUBLE COMMENT '之前與客戶聯絡的次數',
     poutcome        STRING COMMENT '之前行銷活動的結果',
     emp_var_rate    DOUBLE COMMENT '就業變化速率',
     cons_price_idx  DOUBLE COMMENT '消費者物價指數',
     cons_conf_idx   DOUBLE COMMENT '消費者信心指數',
     euribor3m       DOUBLE COMMENT '歐元存款利率',
     nr_employed     DOUBLE COMMENT '職工人數',
     y               BIGINT COMMENT '是否有定期存款'
    );
  7. 表結構產生後,輸入表的中文名,並單擊提交到開發環境

  8. 建立成功後,您可在左側導覽列表管理中輸入表名進行搜尋,查看錶資訊。

建立表result_table
  1. 進入DataStudio頁面,選擇建立 >

  2. 填寫建立表對話方塊中的表名,單擊提交
  3. 進入建立表頁面,選擇DDL模式
  4. DDL模式對話方塊中輸入建表語句,單擊產生表結構。建表語句如下所示:
    CREATE TABLE IF NOT EXISTS result_table
    (  
     education   STRING COMMENT '教育程度',
     num         BIGINT COMMENT '人數'
    );
  5. 建立成功後,您可在左側導覽列表管理中輸入表名進行搜尋,查看錶資訊。

本機資料上傳至bank_data

DataWorks支援以下操作:
  • 將儲存在本地的文字檔中的資料上傳到工作空間的表中。
  • 通過Data Integration模組將業務資料從多個不同的資料來源匯入到工作空間。
说明 本文將使用本地檔案作為資料來源。本地文字檔上傳有以下限制:
  • 檔案類型:僅支援.txt和.csv格式。
  • 檔案大小:不超過10M。
  • 操作對象:支援分區表匯入和非分區表匯入,但不支援分區值為中文。
以匯入本地檔案 banking.txt到DataWorks為例,操作如下:
  1. 單擊匯入,選擇匯入本機資料

  2. 選擇本機資料檔案,配置匯入資訊,單擊下一步

  3. 至少輸入2個字母搜尋表名,選擇需匯入資料的表bank_data。

  4. 選擇欄位匹配方式(本樣本選擇按位置匹配),單擊匯入

檔案匯入後,系統將返回您資料匯入成功的條數或失敗的異常。

其他資料匯入方式

  • 建立資料同步任務

    此方式適用於儲存在RDS、MySQL、SQLServer、PostgreSQL、MaxCompute、OCS、DRDS、OSS、Oracle、FTP、dm、Hdfs和MongoDB等多種資料來源中的各種資料。

    通過DataWorks建立資料同步任務的具體操作請參見建立資料同步任務

  • 本地檔案上傳

    此方式適用於檔案大小不超過10M、檔案類型為.txt和.csv的資料,目標支援分區表和非分區表,但不支援中文作為分區。

    通過DataWorks進行本地檔案上傳,具體操作請參見上文的本機資料上傳至bank_data。

  • 使用Tunnel命令上傳檔案

    此方式適用於大小超過10M的本地檔案和其他資源檔等。

    通過MaxCompute用戶端提供的Tunnel命令來進行資料的上傳及下載,當本機資料檔案需要上傳到分區表時,可以通過用戶端Tunnel命令方式進行上傳。詳情請參見Tunnel命令操作

後續步驟

現在,您已經學習了如何建立表並上傳資料,您可以繼續學習下一個教程。在該教程中您將學習如何建立工作流程來對項目空間的資料進行進一步的計算與分析。詳情請參見建立商務程序