すべてのプロダクト
Search
ドキュメントセンター

DataWorks:作業の開始

最終更新日:Apr 03, 2025

DataWorks DataAnalysis は、企業向けに包括的なデータ分析とサービス共有機能を提供します。 DataAnalysis が提供する SQL クエリとワークブック機能を使用して、さまざまな種類のデータソースのデータを日常的に取得および分析できます。 このトピックでは、DataAnalysis の使用方法の例を示します。 この例では、MaxCompute コンピュートエンジンで SQL クエリ機能が有効になっており、パブリックデータセットのデータのクエリと分析を行います。

権限要件

背景情報

DataAnalysis は、さまざまなビジネスシナリオでパブリックデータセットを提供します。 パブリックデータセットを使用して、DataAnalysis が提供する機能を体験できます。 このトピックでは、commerce_ali_e_commerce という名前の Alibaba E コマース データセットを使用します。

  • このデータセットを使用して、さまざまな期間の淘宝網の注文数をカウントできます。

    • このデータセットには、2017 年 11 月 25 日から 2017 年 12 月 3 日までの期間における約 100 万人のユーザーのランダムな行動に関するデータが含まれています。 これらの行動には、クリック、購入、カートへの追加、お気に入りに追加が含まれます。

    • このデータセットでは、ユーザー数は 987,994、商品の数は 4,162,024、行動の総数は 100,150,807 です。

  • DataAnalysis の詳細については、「データ分析」をご参照ください。

  • パブリックデータセットは、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (杭州)、中国 (成都)、中国 (張家口)、中国 (ウランチャブ) の各リージョンで利用できます。

前提条件

MaxCompute データソースが追加されていること。 詳細については、「MaxCompute データソースを追加する」をご参照ください。

手順

  1. 手順 1: データのクエリ

    [SQL クエリ] 機能を使用して SQL 文を作成し、クエリ権限を持つデータソースのデータをすばやくクエリおよび分析します。

  2. 手順 2: データの分析

    [拡張分析] 機能を使用して、ビジネス要件に基づいてクエリ結果を視覚的に分析します。

  3. 手順 3: データの共有

    クエリと分析結果を他のユーザーと共有して、オンラインデータフローを実装します。

DataAnalysis の [SQL クエリ] ページに移動する

DataWorks コンソール にログオンします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、[データ分析とサービス] > [dataanalysis] を選択します。 表示されたページで、[dataanalysis に移動] をクリックします。 表示されたページの左側のナビゲーションウィンドウで、[SQL クエリ] をクリックします。

手順 1: データのクエリ

このトピックでは、SQL クエリ機能を使用して、Alibaba E コマース データセット commerce_ali_e_commerce に基づいてさまざまな期間の淘宝網の注文数をカウントし、注文をソートしてから、クエリ結果を分析および共有する方法の例を示します。

  1. [SQL クエリ] ページに移動します。

    次のいずれかの方法を使用して、[SQL クエリ] ページに移動できます。

    • データ分析 のホームページで、[ショートカット] セクションの [SQL クエリ] カードをクリックします。

    • データ分析 ページの左側のナビゲーションウィンドウで、[SQL クエリ] をクリックします。

  2. アドホッククエリファイルを作成します。

    [SQL クエリ] ページの左側のウィンドウで、添加[マイファイル] の右側にある [ファイルの作成]SQL クエリ アイコンにポインターを移動し、 を選択して、プロンプトに従って SQL クエリファイルを作成します。 SQL クエリファイルの作成方法の詳細については、「」をご参照ください。

    説明
    • このトピックでは、DataWorks が提供するパブリックデータセットを使用します。 [SQL クエリ] ページに初めてアクセスするときは、[SQL クエリ] ページのウェルカムタブで [dataanalysis に移動] > [maxcompute] を選択できます。 commerce_ali_e_commerce データセットに基づいてさまざまな期間の淘宝網の注文数をカウントするためのアドホッククエリファイルが生成されます。

    • [dataanalysis][SQL クエリ] ページの [パブリックテーブル] ディレクトリで、その他のパブリックデータセットを表示できます。

  3. SQL クエリファイルのデータソースを選択します。

    アドホッククエリファイルの構成タブで、右上隅にある image.png アイコンをクリックして、ワークスペース、コンピューティングエンジンの種類、および SQL クエリタスクのデータソースを選択します。 この例では、既存の [maxcompute] データソースが選択されています。

  4. タスクコードを作成して実行します。

    アドホッククエリファイルの構成タブのコード編集セクションで、次の図に示すコードを作成して実行します。 编辑代码

    Alibaba E コマース データセット commerce_ali_e_commerce に基づいて、さまざまな期間の淘宝網の注文数をカウントし、注文をソートします。

    SET odps.namespace.schema = true
    ;
    
    /* 期間別の淘宝網の注文数をカウントし、結果を降順にソートします。 */
    SELECT  CASE    WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 0
                        AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 3 THEN '00:00 to 03:00'
                    WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 4
                        AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 7 THEN '04:00 to 07:00'
                    WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 8
                        AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 11 THEN '08:00 to 11:00'
                    WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 12
                        AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 15 THEN '12:00 to 15:00'
                    WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 16
                        AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 19 THEN '16:00 to 19:00'
                    WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 20
                        AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 23 THEN '20:00 to 23:00'
            END AS Time at which an order is placed /* 注文が行われた時間 */
            ,COUNT(*) AS Number of orders /* 注文数 */
    FROM    bigdata_public_dataset.commerce.commerce_ali_e_commerce
    GROUP BY Time at which an order is placed /* 注文が行われた時間でグループ化 */
    ORDER BY COUNT(*) DESC /* 注文数で降順にソート */
    LIMIT   100
    ;
  5. クエリ結果を表示します。

    结果数据

手順 2: データの分析

手順 1 を実行した後に表示される [Result1] セクションで、左側のナビゲーションウィンドウの 展示 アイコンをクリックし、次に image アイコンをクリックして、チャート編集ページに移動します。 ビジネス要件に基づいてチャート情報を変更できます。

手順 3: データの共有

SQL クエリ結果をワークブックに同期し、特定のユーザーとクエリ結果を共有して、オンラインデータフローを実装できます。

  1. クエリ結果をエクスポートします。

    手順 1 を実行した後に表示される [Result1] セクションで、右側にある image アイコンをクリックし、[ワークブックに同期して共有] を選択します。

  2. ワークブック編集ページが表示されます。

    ワークブック編集ページで、クエリ結果を同期できます。 ワークブック編集ページでサポートされている操作の詳細については、「ワークブック」をご参照ください。

  3. クエリ結果を共有します。

    ワークブック編集ページの右上隅にある [共有] をクリックして、特定のユーザーとクエリ結果を共有します。 クエリ結果を共有したユーザーは、URL またはアクセスコードを使用してクエリ結果を表示できます。 ビジネス要件に基づいて、特定のユーザーにクエリ結果に対するさまざまな権限を付与できます。 たとえば、特定のユーザーに編集権限または読み取り専用権限を付与できます。

分享数据

参照

  • SQL クエリの詳細については、「SQL クエリ」をご参照ください。

  • ワークブックでサポートされている操作の詳細については、「ワークブック」をご参照ください。