このトピックでは、bank_data テーブルと result_table テーブルを例に取り、DataWorks コンソールでテーブルを作成してデータをインポートする方法について説明します。

このタスクについて

bank_data テーブルは業務データを格納し、result_table テーブルはデータ分析の結果を格納します。

bank_data テーブルの作成

  1. [DataStudio] ページに移動します。
    1. DataWorks コンソールにログインします。
    2. 左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。
    3. 上部のナビゲーションバーで、対象のワークスペースが存在するリージョンを選択します。 対象のワークスペースを見つけて、[アクション] 列の [データ分析] をクリックします。
  2. [DataStudio] ページで、マウスポインターを 作成 アイコンに合わせて、[MaxCompute] > [テーブル] の順に選択します。
    対象のワークフローを見つけて、[MaxCompute] を右クリックし、[作成] > [テーブル] をクリックすることもできます。
  3. [テーブルの作成] ダイアログボックスで、 [テーブル名] bank_data に指定し、[コミット] をクリックします。
    重要
    • テーブルの長さは最大 64 文字です。 テーブル名は先頭文字列を英字にする必要があります。中国語や特殊文字を含めることはできません。
    • 複数の MaxCompute コンピューティングエンジンが現在のワークスペースにバインドされている場合は、 [エンジンタイプを選択してください] ドロップダウンリストから 1 つ選択する必要があります。
  4. テーブル編集ページで、 [DDL ステートメント] をクリックします。
  5. 表示される [DDL ステートメント] ダイアログボックスで、次のステートメントを入力し、 [テーブルスキーマの生成] をクリックします:
    CREATE TABLE IF NOT EXISTS bank_data
    (
     age             BIGINT COMMENT '年齢',
     job             STRING COMMENT '仕事タイプ',
     marital         STRING COMMENT '配偶者の有無',
     education       STRING COMMENT '最終学歴',
     default         STRING COMMENT 'クレジットカード',
     housing         STRING COMMENT '住宅ローン',
     loan            STRING COMMENT 'ローン',
     contact         STRING COMMENT '連絡先',
     month           STRING COMMENT '月',
     day_of_week     STRING COMMENT '曜日',
     duration        STRING COMMENT '期間',
     campaign        BIGINT COMMENT 'キャンペーン中の連絡先の数',
     pdays           DOUBLE COMMENT '最後の連絡からの時間間隔',
     previous        DOUBLE COMMENT '顧客との連絡回数',
     poutcome        STRING COMMENT '前のマーケティングキャンペーンの結果',
     emp_var_rate    DOUBLE COMMENT '雇用変化率',
     cons_price_idx  DOUBLE COMMENT '消費者物価指数',
     cons_conf_idx   DOUBLE COMMENT '消費者信頼感指数',
     euribor3m       DOUBLE COMMENT 'ユーロ預金金利',
     nr_employed     DOUBLE COMMENT '従業員数',
     y               BIGINT COMMENT '定期預金の有無'
    );

    テーブルを作成するための SQL 構文の詳細については、「テーブルの作成と表示」をご参照ください。

  6. 表示されるメッセージボックスで、[OK] をクリックします。
  7. [一般] セクションで Display Name パラメーターを設定し、[開発環境でコミット][本番環境へコミット] をクリックします。
    トピックでは、例として標準モードのワークスペースを使用します。 基本モードでワークスペースを使用している場合は、[本番環境へのコミット] のみをクリックします。
  8. 左側のナビゲーションサブメニューで、[ワークスペーステーブル] アイコンをクリックします。
  9. 表示される [ワークスペーステーブル] タブで、作成されたテーブルの名前をダブルクリックして、テーブル情報を表示します。

result_table テーブルの作成

  1. [DataStudio] ページで、マウスポインターを 作成 アイコンに合わせて、[MaxCompute] > [テーブル] の順に選択します。
    対象のワークフローを見つけて、[MaxCompute] を右クリックし、[作成] > [テーブル] をクリックすることもできます。
  2. 表示される [テーブルの作成] ダイアログボックスで、[テーブル名] result_table に設定して、[コミット] をクリックします。
  3. DDL ステートメント をクリックします。 表示されるダイアログボックスに、次のステートメントを入力して [テーブルスキーマの生成] をクリックします:
    CREATE TABLE IF NOT EXISTS result_table
    (  
     education       STRING COMMENT '最終学歴',
     num         BIGINT COMMENT '人数'
    );
  4. 表示されたメッセージボックスで、[OK] をクリックします。
  5. [一般] セクションで、Display Name パラメーターを設定し、[開発環境でコミット][本番環境へコミット] をクリックします。
  6. 左側のナビゲーションサブメニューで、[ワークスペーステーブル] アイコンをクリックします。
  7. 表示される [ワークスペーステーブル] タブで、作成されたテーブルの名前をダブルクリックして、テーブル情報を表示します。

ローカルファイルをアップロードして、データを bank_data テーブルにインポートします。

また、DataWorks コンソールで以下の操作を実行することもできます。
  • ローカルテキストファイルをアップロードして、そのデータをワークスペースのテーブルにインポートします。
  • Data Integration を使用して、さまざまなデータソースから業務データをワークスペースへインポートします。
次のルールに従ってローカルファイルをアップロードしてください。
  • ファイル形式:ファイルは次の形式である必要があります: .txt.csv.log
  • ファイル容量:ファイルの容量は 30 MB を超えることはできません。
  • オブジェクト:対象のオブジェクトは、パーティションテーブルまたは非パーティションテーブルにすることができます。 パーティションキーの値を中国語にすることはできません。

ローカルファイル banking.txt を DataWorks にアップロードするには、次の手順を実行します。

  1. [DataStudio] ページで インポート をクリックします。
  2. 表示される [データインポートウィザード] ダイアログボックスで、3 文字以上を入力してテーブルを検索し、データをインポートするテーブルを選択して、 [次へ] をクリックします。
  3. 表示されるダイアログボックスで、Select Data Import Method パラメーターを Upload Local File に設定し、[ファイルの選択] の横にある [参照] をクリックします。 ローカルファイルを選択し、残りのパラメーターを必要に応じて設定します。
    GUI 要素 説明
    データのインポート方法の選択 データのインポート方法です。 デフォルト値: Upload Local File
    ファイルの選択 アップロードするファイルです。 ファイルをアップロードするには、 [参照] をクリックして、アップロードするローカルファイルを選択します。
    区切り文字の選択 ファイル内のフィールドの区切り文字です。 有効な値: [コンマ (,)] [タブ][セミコロン (;)] [スペース] [|] [#] [&] 。 この例では、[コンマ (,)] を選択します。
    オリジナルキャラクターセット ファイルのキャラクターセットです。 有効な値: [GBK] [UTF-8][CP936][ISO-8859] 。 この例では、[GBK] を選択します。
    最初の行のインポート データをインポートする対象の行。 この例では、[1] を選択します。
    フィールド名に最初の行を使用 最初の行をヘッダー行として使用するかどうかを指定します。 この例では、[フィールド名に最初の行を使用] を選択しないでください。
    プレビュー インポートするデータのプレビューです。
    データ量が多い場合は、最初の 100 行と 50 列のデータのみが表示されます。
  4. [次へ] をクリックします。
  5. ソースファイルとターゲットテーブルのフィールドの一致モードを選択します。 この例では、[ロケーション] を選択します。
  6. [データのインポート] をクリックします。

次のステップ

テーブルを作成してデータをインポートする方法はここまでです。 次のチュートリアルに進んでください。 次のチュートリアルでは、ワークフローを作成、構成、コミットし、データ分析機能を使用して、ワークスペース内のデータをさらに計算および分析する方法について説明します。 詳細については、「ワークフローの作成」をご参照ください。