すべてのプロダクト
Search
ドキュメントセンター

DataWorks:インテリジェント診断

最終更新日:Apr 04, 2025

インテリジェント診断機能を使用すると、タスクインスタンスのエンドツーエンド診断を実行できます。タスクインスタンスが期待どおりに実行されない場合は、この機能を使用して問題を特定できます。

背景情報

インテリジェント診断機能を使用して、次の側面からタスクインスタンスを診断および分析できます。

制限事項

  • DataWorks Professional Edition 以上をご利用のお客様のみが、インテリジェント診断機能をご利用いただけます。他のエディションをご利用の場合は、無料でトライアル利用が可能です。ただし、より多くの機能を使用するには、DataWorks サービスを DataWorks Professional Edition にアップグレードすることをお勧めします。詳細については、「DataWorks エディション間の違い」をご参照ください。

  • インテリジェント診断機能は、中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (深セン)、中国 (香港)、日本 (東京)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、UAE (ドバイ) のリージョンでのみサポートされています。

インテリジェント診断ページに移動する

  1. オペレーションセンターページに移動します。

    DataWorks コンソール にログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、[データ開発と O&M] > [オペレーションセンター] を選択します。表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[オペレーションセンターに移動] をクリックします。

  2. [オペレーションセンター] ページで、次のいずれかの方法を使用して [インテリジェント診断] ページに移動します。

    • 方法 1: インスタンスのインテリジェント診断ページに移動します。

      • 左側のナビゲーションウィンドウで、[自動トリガーノード O&M] > [自動トリガーインスタンス] を選択します。[インスタンスパースペクティブ] タブで、目的のインスタンスを見つけ、[アクション] 列の [診断を実行] をクリックして、インテリジェント診断ページに移動します。

      • 左側のナビゲーションウィンドウで、[自動トリガーノード O&M] > [自動トリガーインスタンス] を選択します。[インスタンスパースペクティブ] タブで、目的のインスタンスを見つけ、[アクション] 列の [DAG] をクリックします。目的のインスタンスの DAG ページで、インスタンスを右クリックし、[インスタンス診断] を選択します。

    • 方法 2: 左側のナビゲーションウィンドウで、[O&M アシスタント] > [インテリジェント診断] を選択します。

      説明

      インテリジェント診断機能では、インスタンス ID でのみインスタンスを検索できます。

現在のインスタンスのステータスを表示する

「実行の詳細」タブで、DataWorks はインスタンスの実行に必要な条件に基づいて、現在のインスタンスの上流インスタンスのステータス、現在のインスタンスに設定されているスケジュール時間、スケジュールリソースの使用状況、現在のインスタンスのステータスを順番に確認します。

  • [上流ノード]

    インテリジェント診断ページの「実行の詳細」タブの [上流ノード] ステップでは、インテリジェント診断機能を使用して上流インスタンスのステータスを表示できます。上流インスタンスの実行に失敗した場合、現在のインスタンスはブロックされます。上流インスタンスの [操作] 列の [インスタンス診断] をクリックして、失敗の理由を特定できます。

    説明

    現在のインスタンスの上流インスタンスが実行されておらず、現在のインスタンスとその上流インスタンス間の依存関係が複雑な場合は、DAG ページの「上流分析」タブの 上流分析 機能を使用して、現在のインスタンスの実行をブロックしている主要な上流インスタンスを特定することをお勧めします。次に、[インテリジェント診断] 機能を使用して、上流インスタンスが実行されない理由を特定できます。これにより、O&M 効率が向上します。

  • [タイミングチェック]

    [タイミングチェック] ステップでは、現在のインスタンスに設定されているスケジュール時間が到来したかどうかを確認できます。チェックは、上流依存関係チェックが成功した場合にのみトリガーされます。

    説明

    DataStudio ページで現在のインスタンスが生成されるタスクのスケジュールプロパティを設定する場合、スケジュールシステムでタスクが実行されるようにスケジュールされている時間を指定する必要があります。ただし、タスクが実際に実行を開始する時間は、現在のタスクの上流タスクの失敗などの問題により、タスクのスケジュール時間よりも遅れる場合があります。

  • [リソース]

    [リソース] ステップでは、リソースの使用状況と、現在のインスタンスがリソースを待機しているときにリソースを占有しているインスタンスのリストを表示できます。現在のインスタンスがリソース使用状況チェックに合格しなかった場合、現在のインスタンスの実行に使用されるスケジュールリソースが不足しています。この場合、現在のインスタンスは、スケジュールリソースが解放された場合にのみ実行を開始できます。「リソース」ステップの情報に基づいて、ピーク時を避けるように現在のインスタンスのスケジュール時間を調整できます。

    セクション

    説明

    [スケジュールリソース情報]

    現在のインスタンスが使用するスケジュール用リソースグループの名前、スケジュール用リソースグループで実行されているインスタンスの数、スケジュール用リソースグループで実行を待機しているインスタンスの数を表示できます。

    説明

    スケジューリングリソースの制約を緩和するために、サーバーレスリソースグループ を使用することをお勧めします。

    DataWorks タスクのピーク時間は、毎日 00:00 から 09:00 です。ピーク時に共有リソースグループを使用すると、リソースグループのリソースが不足し、タスクがリソースを待機する可能性があります。

    [診断結果]

    現在のタスクの実行ステータスを表示できます。

    [リソース使用量のトレンド]

    スケジュール用共有リソースグループを使用している場合、各期間における現在のスケジュール用リソースグループのリソース使用量と、現在のインスタンスがリソースを待機するために消費した時間を表示できます。

  • [実行]

    [実行] ステップでは、現在のインスタンスの実行ログ、関連付けられているデータ品質監視ルールの詳細、現在のインスタンスが生成されたノードのコードの詳細を表示できます。実行に失敗したインスタンスの場合、インテリジェント診断機能はログ情報に基づいて診断結果と提案を提供します。これにより、インスタンスで発生したエラーの原因を特定できます。

    タブ

    説明

    [ログ]

    現在のインスタンスの実行の詳細を表示できます。

    [実行の詳細] タブの [実行] ステップで、[ログ] タブの EMR の Web UI の URL をクリックして EMR の Web ページに移動し、EMR のリソース情報を表示できます。また、右下の [インテリジェント診断] をクリックして「インテリジェント診断」タブに移動し、エラーを分析することもできます。

    [インテリジェント診断]

    LLM を使用して現在のインスタンスのエラーログを分析できます。[通義千問][DeepSeek][DW ナレッジベース] がサポートされています。

    [通義千問][DeepSeek] を使用してエラーログを分析および解析し、分析結果と提案を生成できます。[DW ナレッジベース] で提案を表示することもできます。

    説明

    分析が完了した後、次の操作を実行することもできます。[インスタンスコードを編集する][インスタンスを再実行する][インスタンスのステータスを成功に設定する][スケジューリング用リソースグループと Data Integration 用リソースグループを変更する][チケットを送信する] および[テーブル権限を申請する]

    [DQC]

    データ品質監視ルールの詳細を表示できます。現在のインスタンスが生成されるタスクにデータ品質監視ルールを関連付けた場合、タスクの実行後にデータ品質監視ルールがトリガーされます。

    [コードの詳細]

    現在のインスタンスが生成されるタスクのコードの詳細を表示できます。

基本情報を表示する

[全般] タブで、現在のインスタンスの主要な時点と現在のインスタンスに関する基本情報を表示できます。現在のインスタンスが生成されるノードに設定されているスケジュールプロパティの詳細については、「基本プロパティの設定」をご参照ください。

影響を受けるベースラインを表示する

[影響ベースライン] タブで、監視範囲内で現在のインスタンスが生成されたタスクを含むベースラインと、ベースラインのステータスを表示できます。インテリジェントベースライン機能の詳細については、「概要」をご参照ください。

履歴インスタンスのステータスを表示する

[履歴インスタンス] タブで、次の情報を表示できます。

  • 過去 15 日間に現在のノードで測定された次のメトリックのトレンドをチャートで表示します。[実行時間][実行開始時間][スケジュールリソースの待機時間の消費][完了日時]

  • 履歴インスタンスリストに、過去の一定期間に現在のノードに対して生成されたインスタンスの実行の詳細が表示されます。これには、インスタンスの実行開始時刻、インスタンスの完了時刻、実行時間、リソースの待機時間が含まれます。インスタンスの「操作」列の [インスタンス診断] をクリックして、インスタンスの診断詳細ページに移動できます。