DataWorks DataAnalysis は、企業向けに包括的なデータ分析とサービス共有機能を提供します。 DataAnalysis が提供する SQL クエリとワークブック機能を使用して、さまざまな種類のデータソースのデータを日常的に取得および分析できます。 このトピックでは、DataAnalysis の使用方法の例を示します。 この例では、MaxCompute コンピュートエンジンで SQL クエリ機能が有効になっており、パブリックデータセットのデータのクエリと分析を行います。
権限要件
DataAnalysis に必要な権限があることを確認してください。 DataAnalysis におけるさまざまなロールの権限の詳細については、「組み込みのワークスペースレベルロールの権限」トピックの「DataAnalysis」セクションをご参照ください。
ユーザーへのロールの割り当て方法の詳細については、「RAM ユーザーをワークスペースにメンバーとして追加し、メンバーにロールを割り当てる」をご参照ください。
背景情報
DataAnalysis は、さまざまなビジネスシナリオでパブリックデータセットを提供します。 パブリックデータセットを使用して、DataAnalysis が提供する機能を体験できます。 このトピックでは、commerce_ali_e_commerce
という名前の Alibaba E コマース データセットを使用します。
このデータセットを使用して、さまざまな期間の淘宝網の注文数をカウントできます。
このデータセットには、
2017 年 11 月 25 日
から2017 年 12 月 3 日
までの期間における約 100 万人のユーザーのランダムな行動に関するデータが含まれています。 これらの行動には、クリック、購入、カートへの追加、お気に入りに追加が含まれます。このデータセットでは、ユーザー数は
987,994
、商品の数は4,162,024
、行動の総数は100,150,807
です。
DataAnalysis の詳細については、「データ分析」をご参照ください。
パブリックデータセットは、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (杭州)、中国 (成都)、中国 (張家口)、中国 (ウランチャブ) の各リージョンで利用できます。
前提条件
MaxCompute データソースが追加されていること。 詳細については、「MaxCompute データソースを追加する」をご参照ください。
手順
[SQL クエリ] 機能を使用して SQL 文を作成し、クエリ権限を持つデータソースのデータをすばやくクエリおよび分析します。
[拡張分析] 機能を使用して、ビジネス要件に基づいてクエリ結果を視覚的に分析します。
クエリと分析結果を他のユーザーと共有して、オンラインデータフローを実装します。
DataAnalysis の [SQL クエリ] ページに移動する
DataWorks コンソール にログオンします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、 を選択します。 表示されたページで、[dataanalysis に移動] をクリックします。 表示されたページの左側のナビゲーションウィンドウで、[SQL クエリ] をクリックします。
手順 1: データのクエリ
このトピックでは、SQL クエリ機能を使用して、Alibaba E コマース データセット commerce_ali_e_commerce
に基づいてさまざまな期間の淘宝網の注文数をカウントし、注文をソートしてから、クエリ結果を分析および共有する方法の例を示します。
[SQL クエリ] ページに移動します。
次のいずれかの方法を使用して、[SQL クエリ] ページに移動できます。
アドホッククエリファイルを作成します。
[SQL クエリ] ページの左側のウィンドウで、
[マイファイル] の右側にある [ファイルの作成]SQL クエリ アイコンにポインターを移動し、 を選択して、プロンプトに従って SQL クエリファイルを作成します。 SQL クエリファイルの作成方法の詳細については、「」をご参照ください。
説明このトピックでは、DataWorks が提供するパブリックデータセットを使用します。 [SQL クエリ] ページに初めてアクセスするときは、[SQL クエリ] ページのウェルカムタブで
を選択できます。commerce_ali_e_commerce
データセットに基づいてさまざまな期間の淘宝網の注文数をカウントするためのアドホッククエリファイルが生成されます。[dataanalysis] の [SQL クエリ] ページの [パブリックテーブル] ディレクトリで、その他のパブリックデータセットを表示できます。
SQL クエリファイルのデータソースを選択します。
アドホッククエリファイルの構成タブで、右上隅にある
アイコンをクリックして、ワークスペース、コンピューティングエンジンの種類、および SQL クエリタスクのデータソースを選択します。 この例では、既存の [maxcompute] データソースが選択されています。
タスクコードを作成して実行します。
アドホッククエリファイルの構成タブのコード編集セクションで、次の図に示すコードを作成して実行します。
Alibaba E コマース データセット commerce_ali_e_commerce に基づいて、さまざまな期間の淘宝網の注文数をカウントし、注文をソートします。
SET odps.namespace.schema = true ; /* 期間別の淘宝網の注文数をカウントし、結果を降順にソートします。 */ SELECT CASE WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 0 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 3 THEN '00:00 to 03:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 4 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 7 THEN '04:00 to 07:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 8 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 11 THEN '08:00 to 11:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 12 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 15 THEN '12:00 to 15:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 16 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 19 THEN '16:00 to 19:00' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 20 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 23 THEN '20:00 to 23:00' END AS Time at which an order is placed /* 注文が行われた時間 */ ,COUNT(*) AS Number of orders /* 注文数 */ FROM bigdata_public_dataset.commerce.commerce_ali_e_commerce GROUP BY Time at which an order is placed /* 注文が行われた時間でグループ化 */ ORDER BY COUNT(*) DESC /* 注文数で降順にソート */ LIMIT 100 ;
クエリ結果を表示します。
手順 2: データの分析
手順 1 を実行した後に表示される [Result1] セクションで、左側のナビゲーションウィンドウの アイコンをクリックし、次に
アイコンをクリックして、チャート編集ページに移動します。 ビジネス要件に基づいてチャート情報を変更できます。
手順 3: データの共有
SQL クエリ結果をワークブックに同期し、特定のユーザーとクエリ結果を共有して、オンラインデータフローを実装できます。
クエリ結果をエクスポートします。
手順 1 を実行した後に表示される [Result1] セクションで、右側にある
アイコンをクリックし、[ワークブックに同期して共有] を選択します。
ワークブック編集ページが表示されます。
ワークブック編集ページで、クエリ結果を同期できます。 ワークブック編集ページでサポートされている操作の詳細については、「ワークブック」をご参照ください。
クエリ結果を共有します。
ワークブック編集ページの右上隅にある [共有] をクリックして、特定のユーザーとクエリ結果を共有します。 クエリ結果を共有したユーザーは、URL またはアクセスコードを使用してクエリ結果を表示できます。 ビジネス要件に基づいて、特定のユーザーにクエリ結果に対するさまざまな権限を付与できます。 たとえば、特定のユーザーに編集権限または読み取り専用権限を付与できます。