DataWorks の DataAnalysis 機能は、包括的なデータ分析および共有機能を提供します。さまざまなデータソースに接続し、SQL クエリを実行したり、日常的なデータ抽出および分析ニーズに Workbooks などのツールを利用したりできます。本チュートリアルでは、MaxCompute コンピュートエンジンを使用して公開データセットをクエリおよび分析することで、DataAnalysis の基本操作を説明します。
機能概要
DataAnalysis は、さまざまなビジネスシナリオ向けの公開データセットを提供しています。本チュートリアルでは、Alibaba イーコマースデータセット(commerce_ali_e_commerce テーブル)を使用して、DataAnalysis のコア機能を紹介します。
Alibaba イーコマースデータセットには、異なる期間における淘宝(タオバオ)の注文詳細が含まれています。
このテーブルには、
2017 年 11 月 25 日から2017 年 12 月 3 日の間に約 100 万人のユーザーから収集されたランダムなユーザー動作(クリック、購入、カート追加、お気に入り登録など)が記録されています。このデータセットには、
987,994人のユーザー、4,162,024個のプロダクト、および100,150,807件の動作レコードが含まれています。
DataAnalysis の詳細については、「DataAnalysis」をご参照ください。
公開データセットは、以下のリージョンで利用可能です:中国 (上海)、中国 (北京)、中国 (深セン)、中国 (杭州)、中国 (成都)、中国 (張家口)、および中国 (ウランチャブ)。
権限
DataAnalysis を使用するために必要な権限を保有していることを確認してください。ロールと権限の完全な一覧については、「DataAnalysis のプリセットロールと権限」をご参照ください。
ユーザーに権限を付与する方法については、「ワークスペースメンバーの追加とロール管理」をご参照ください。
前提条件
MaxCompute データソースが必要です。詳細については、「MaxCompute コンピュートエンジンをワークスペースに関連付ける」をご参照ください。
SQL クエリへの移動
DataWorks コンソールにログインします。上部のナビゲーションバーで目的のリージョンを選択します。左側のナビゲーションウィンドウで、 を選択します。表示されたページで、Go to DataAnalysis をクリックします。表示されたページの左側ナビゲーションウィンドウで、SQL Query をクリックします。
ステップ 1:データのクエリ
この例では、Alibaba イーコマースデータセット(commerce_ali_e_commerce)を使用して、SQL Query 機能によるデータのクエリ、ソート、分析、共有の方法を紹介します。
SQL Query ページに移動します。
以下のいずれかの方法でページに移動できます。
Data Analysis ホームページの Shortcuts セクションで、SQL Query をクリックして SQL Query ページを開きます。
Data Analysis モジュールで、左側のメニューバーの SQL Query をクリックして SQL Query ページに移動します。
Temporary File を作成します。
左側のペインで、My Files の横にある
アイコンをクリックし、Create File を選択します。SQL クエリファイルを作成するには、画面の指示に従ってください。SQL クエリファイルを作成する他の方法については、「SQL クエリ (レガシー)」をご参照ください。説明本チュートリアルでは、DataWorks が提供する公開データセットを使用します。初めて SQL Query を開く際は、Welcome Page で MaxCompute の をクリックすると、Alibaba イーコマースデータセット(
commerce_ali_e_commerce)のクエリが自動生成されます。その他の公開データセットを探すには、 に移動し、Public Data ディレクトリを参照してください。
Data Source を選択します。
アドホッククエリファイルのエディターで、右上隅の
アイコンをクリックします。ワークスペース、コンピュートエンジンタイプ、およびクエリ用のデータソースを選択します。この例では、先ほど作成した MaxCompute データソースを使用します。クエリコードを編集して実行します。
アドホッククエリファイルのコードエディタに、次のコードを貼り付けて実行します。

このクエリは、公開データセットから時間帯ごとの注文数を計算し、降順にソートします。
SET odps.namespace.schema = true ; SELECT CASE WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 0 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 3 THEN '00:00-03:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 4 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 7 THEN '04:00-07:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 8 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 11 THEN '08:00-11:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 12 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 15 THEN '12:00-15:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 16 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 19 THEN '16:00-19:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 20 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 23 THEN '20:00-23:00' END AS `Time at which an order is placed` ,COUNT(*) AS `Number of orders` FROM bigdata_public_dataset.commerce.commerce_ali_e_commerce GROUP BY `Time at which an order is placed` ORDER BY COUNT(*) DESC LIMIT 100 ;クエリ結果を表示します。
アイコンをクリックして SQL コードを実行します。
ステップ 2:データの分析
ステップ 1 のクエリ結果ページで、左側ナビゲーションウィンドウの
アイコンをクリックし、続いて
編集アイコンをクリックしてチャートエディターを開きます。必要に応じてチャートを設定できます。
ステップ 3:データの共有
SQL クエリの結果を Workbook として他のユーザーと共有し、オンラインで共同作業できます。
クエリ結果をエクスポートします。
ステップ 1 のクエリ結果ページで、右上隅の
アイコンをクリックし、ドロップダウンメニューから Workbook and Share を選択します。Spreadsheet ページに移動します。
Spreadsheet ページでは、クエリ結果を同期できます。Workbooks の操作方法の詳細については、「Workbook」をご参照ください。
Workbook を共有します。
ページ右上隅の Share をクリックして、特定のユーザーとデータを共有します。受信者は URL またはアクセスコードで Workbook にアクセスできます。編集権限または閲覧専用権限を付与できます。

次のステップ
SQL クエリの詳細については、「SQL Query (Legacy)」をご参照ください。
Workbooks の使用方法の詳細については、「Workbook」をご参照ください。