DataWorks DataAnalysis のデータインサイトは、データに対する深いインサイトを提供し、高度なデータ探索と可視化をサポートします。データインサイトを使用して、データ分布を理解し、データカードを作成し、それらをデータレポートにまとめることができます。結果は、1 枚の画像レポートとして共有することも可能です。人工知能 (AI) を活用したこの機能は、複雑なデータを解析し、情報に基づいたビジネス上の意思決定を支援します。
前提条件
-
権限:データ分析に必要な権限が必要です。サポートされているワークスペースロールの一覧については、「DataAnalysis のプリセットロール権限」をご参照ください。
ロールに権限を付与する方法の詳細については、「ワークスペースメンバーの追加とメンバーロール権限の管理」をご参照ください。
-
リージョン制限:この機能は、中国 (杭州)、中国 (上海)、中国 (深圳)、中国 (成都)、中国 (張家口)、中国 (北京)、および中国 (ウランチャブ) のリージョンでのみ利用可能です。
データインサイトへのアクセス
DataWorks DataAnalysis にログインし、対象のリージョンに切り替えて、入力 データ分析 をクリックします。左側のナビゲーションウィンドウで、
アイコンをクリックして [データインサイト] ページを開きます。
データインサイトタスクの作成
データインサイトタスクは、データインサイトリストから、SQL クエリのデータカタログ内のテーブルから、または SQL クエリの結果からなど、複数の方法で作成できます。
データインサイトリストから
-
[データインサイト] ページで、Create Data Insight Task をクリックします。Create Data Insight Task ダイアログボックスで、インサイトの対象となるテーブルオブジェクトを設定し、Start Data Insight をクリックします。
データソースとデータ範囲は、最後に使用した設定がデフォルトとなり、最新のパーティションが自動的に選択されます。
設定項目には、ワークスペース、データソースタイプ、データソース名、アクセスIDモード (実行者 ID または データソースのデフォルトアクセスID)、テーブル名、フィールド、データ範囲 (ランダムな 10,000 行 または 全データセット) が含まれます。大規模モデルを計算に使用する を選択することもできます。
-
(任意) 拡張分析を有効にしていない場合は、プロンプトに従って Try Now をクリックします。
SQL クエリのテーブルから
この機能は DataAnalysis のレガシーバージョンでのみ利用可能であり、新バージョンではサポートされていません。
-
左側のナビゲーションウィンドウで、
アイコンをクリックして SQL Query ページを開き、左側のカタログにテーブルを追加します。上部のツールバーで、カタログリストアイコンをクリックして [カタログの追加] パネルを開きます。[推奨カタログ] タブを選択します。対象のテーブル (例: マイ MaxCompute テーブル) の横にある [カタログに追加] をクリックします。
-
左側のデータカタログで、分析するテーブルを見つけます。
-
テーブルの基本情報ページで、Data Insight をクリックします。
-
テーブル名を右クリックし、ショートカットメニューから Data Insight を選択します。
-
-
Create Data Insight Task ダイアログボックスでは、パラメーターが自動的に入力されます。Start Data Insight をクリックします。
-
(任意) 拡張分析を有効にしていない場合は、プロンプトに従って Try Now をクリックします。
SQL クエリ結果から
新バージョン
-
にポインターを合わせ、[
] > [新しい SQL ファイル] をクリックします。 -
SQL コードを記述します。SQL エディターの上部にあるツールバーで、Run をクリックし、結果を待ちます。
-
結果で
アイコンをクリックし、Data Range を選択してから Start Data Insight をクリックします。 -
(任意) 拡張分析を有効にしていない場合は、プロンプトに従って Try Now をクリックします。
レガシーバージョン
-
左側のナビゲーションウィンドウで、
アイコンをクリックして SQL Query ページを開きます。My Files で Create File をクリックし、SQL クエリを実行して結果を待ちます。 -
結果で
アイコンをクリックし、Data Range を選択してから Start Data Insight をクリックします。[データ範囲] で、[クエリ結果エリアに表示されているデータのみ] を選択し、分析するフィールド (rank、cate_id、cate_name、total_sales_amount、order_count、pt など) を選択します。
-
(任意) 拡張分析を有効にしていない場合は、プロンプトに従って Try Now をクリックします。
データインサイトの結果
-
データインサイトタスクが完了するのを待ちます。
説明-
いつでも [分析を停止] をクリックしてタスクを終了できます。
-
全データセットでデータ探索を実行すると、時間がかかる場合があります。後でデータインサイトリストページで結果を確認することを推奨します。現在のページを閉じても、進行中の探索プロセスは中断されません。
[データインサイト] ページには、データ準備 (自動データインジェスト)、データ探索 (統計分布、高頻度データ比率、最大/最小/平均値など)、カードの生成 (探索結論の保存とデータカードの推奨) の 3 ステップのワークフローの進捗が表示されます。これらのステップは順次実行されます。右上隅に [実行を停止] ボタンがあります。
-
-
データインサイト結果の表示:システムはデータ型やその他の特性に基づいて、可視化チャートカードを自動的に生成します。
カードが生成された後、[さらに読み込む] をクリックすると、追加のカードが表示されます。

データインサイト結果ページの上部にある、折りたたみ可能な [統計とフィルターを非表示にする] パネルには、各フィールドの一意の値の数とデータ分布を示すカードが表示されます。たとえば、behavior_type フィールドでは、
pvが 98%、buyが 2% を占めています。フィールドが多い場合は、カードエリアの右側にあるページネーション矢印 (< および >) を使用して、他のフィールド統計カードを閲覧できます。パネルの下には、未加工の詳細データを示すデータテーブルが表示されます。 -
データ範囲 が全データセットに設定されていない場合、チャートの右上隅にポインターを合わせ、必要に応じて [カード] に保存します。
よくある質問
-
Q: インサイトの結果に "No more cards" と表示される原因は何ですか?
A: データセットが小さすぎて、インサイトの結果を生成できません。最適な結果を得るには、500 行を超えるデータセットを使用してください。
-
Q: テーブルベースのデータインサイトタスクが失敗した場合のトラブルシューティング方法を教えてください。
A: データソースに接続し、クエリが正常に実行できることを確認してください。これは、まず SQL クエリでクエリを実行してみることで確認できます。