すべてのプロダクト
Search
ドキュメントセンター

DataWorks:O&M ダッシュボードページの統計情報を表示する

最終更新日:Jun 12, 2025

オペレーションセンターの O&M ダッシュボードページには、O&M の安定性評価情報、主要な O&M メトリック、自動トリガーノードのスケジューリングリソース使用量の概要、および手動トリガーノードの実行の詳細が表示されます。 このページには、Data Integration のデータ同期ノードに関する情報も表示されます。 これにより、ワークスペース内のノードに関する全体的な情報をすばやく理解し、例外をできるだけ早く特定して処理し、O&M 効率を向上させることができます。

使用方法に関する注意事項

O&M ダッシュボードページでは、次の観点から、Data Integration の自動トリガーノード、手動トリガーノード、およびデータ同期ノードに関する O&M の全体的な情報を表示できます。 Data Integration の自動トリガーノード、手動トリガーノード、およびデータ同期ノードの O&M の詳細については、「自動トリガーノードに関する O&M 情報を表示する」、「手動トリガーノードに関する O&M 情報を表示する」、および「Data Integration のデータ同期ノードに関する O&M 情報を表示する」をご参照ください。

  • 指定されたワークスペース: 指定されたワークスペースに関する O&M 情報を表示できます。これには、ワークスペース内の自動トリガーノードと手動トリガーノードに関する O&M の全体的な情報、およびワークスペース内のデータ同期ノードに関する O&M 情報が含まれます。

  • すべてのワークスペース: 現在のアカウント内のすべてのワークスペースに関する O&M の全体的な情報を表示できます。 [Data Integration] 内のデータ同期ノードに関する O&M 情報を個別に表示することはできません。

制限

  • 標準モードのワークスペースのオペレーションセンターの開発環境では、O&M ダッシュボード機能はサポートされていません。 標準モードのワークスペースの詳細については、「基本モードのワークスペースと標準モードのワークスペースの違い」をご参照ください。

    説明

    オペレーションセンターページの上部ナビゲーションバーで、[本番] 環境と [開発] 環境を切り替えることができます。

  • 自動トリガーノード: このタブには、自動トリガーノードとインスタンスに関する O&M 情報のみが表示されます。

  • 手動トリガーノード: このタブには、手動トリガーワークフロー、およびワークフロー内の手動トリガーノードとインスタンスに関する O&M 情報のみが表示されます。

  • Data Integration: このタブには、Data Integration のバッチ同期ノードとリアルタイム同期ノードに関する O&M 情報のみが表示されます。

O&M ダッシュボードページに移動する

DataWorks コンソール にログオンします。 上部ナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、[データ開発と O&M] > [オペレーションセンター] を選択します。 表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[オペレーションセンターに移動] をクリックします。

自動トリガーノードに関する O&M 情報を表示する

[自動トリガーノード] タブでは、自動トリガーノードに関する O&M 安定性評価情報、重点を置く必要のある項目、さまざまな O&M 状態における自動トリガーノードの分布、自動トリガーインスタンスの完了ステータス、およびスケジューリングのためのさまざまなリソースグループのリソース使用量を表示できます。

O&M 安定性評価セクションの情報を見る

O&M 安定性評価セクションでは、ワークスペース内のノードの全体的な実行の詳細に基づいて、ワークスペースの O&M 安定性が評価されます。

評価範囲

[単一ワークスペース]

[すべてのワークスペース]

image

image

安定性の説明

O&M 安定性の健全性ステータスは、優良、良好、中間、不良のいずれかになります。 高リスクまたは低リスクの項目が表示されている場合、ワークスペースの健全性ステータスは不良です。 リスクのある項目を処理し、ワークスペースのパフォーマンスをできるだけ早く最適化する必要があります。

  • オペレーションセンターページの上部ナビゲーションバーで [すべてのマイワークスペース] を選択し、アカウントが追加されているすべてのワークスペースの O&M 安定性情報、自動トリガーインスタンスの数、および自動トリガーインスタンスの完了ステータスを表示できます。

  • 目的のワークスペースの [アクション] 列の [詳細の表示] をクリックして、ワークスペースに関する O&M 安定性情報を表示することもできます。

重点セクションの情報を見る

重点セクションには、インテリジェントベースラインと自動トリガーノードの例外統計に基づいて、ワークスペースと個々の観点からの O&M 例外が表示されます。 ワークスペースの全体的な情報を表示したり、自分がオーナーであるノードに関する情報のみを表示したりして、例外をできるだけ早く特定して処理し、ビジネスに影響が出ないようにすることができます。

例外タイプ

説明

参照

時間超過のベースライン

現在の日に時間超過状態になっているベースラインインスタンスの数をカウントします。

ベースラインのコミットされた完了時刻に達したときにベースライン内のノードがまだ実行されている場合、そのノードに対して生成されたインスタンスは時間超過状態になります。

ベースラインインスタンスを管理する

异常问题

アラート状態のベースライン

現在の日にアラート状態になっているベースラインインスタンスの数をカウントします。

ベースライン内のノード間の依存関係が複雑なシナリオでは、アラートマージンしきい値を指定して、重要なデータが期待どおりに生成されるようにすることができます。 アラートマージンしきい値を超えると、ノードが期待どおりに実行を完了できず、例外が発生する可能性があります。

ベースラインに適切なコミットポイントと適切なアラートマージンしきい値を設定する

エラー関連イベント

現在の日に生成されたエラー関連イベントの数をカウントします。

ベースライン内のノードでエラーが発生すると、エラー関連イベントが生成されます。 この場合、そのノードの子孫ノードの実行がブロックされる可能性があります。 そのノードが子孫ノードの実行に影響を与えないように、できるだけ早くエラーを処理する必要があります。

イベントを管理する

減速イベント

現在の日に生成された減速イベントの数をカウントします。

ベースライン内のノードの実行時間が過去の期間におけるノードの平均実行時間よりも大幅に長い場合、減速イベントが生成されます。

孤立ノード

現在の日の孤立ノードの数をカウントします。

自動トリガーノードに先祖ノードがない場合、自動トリガーノードは孤立ノードになります。 この場合、ノードは自動的に実行するようにスケジュールできません。

シナリオ: 孤立ノード

フリーズされたノード

現在の日にフリーズされている自動トリガーノードの数をカウントします。

自動トリガーノードがフリーズされると、そのノードに対して生成されたインスタンスもフリーズされます。 フリーズされたインスタンスは自動的にスケジュールされず、フリーズされたインスタンスの子孫インスタンスの実行はブロックされます。

ノードのフリーズとフリーズ解除

期限切れのノード

スケジューリングの有効期限が切れている自動トリガーノードの数をカウントします。

システムは、自動トリガーノードのインスタンスを生成し、ノードのスケジューリングの有効期限内にインスタンスを実行します。 スケジューリングの有効期限が切れると、システムはノードの自動トリガーインスタンスを生成またはスケジュールしません。

なし

変更されたノード

現在の日に構成が変更された自動トリガーノードの数をカウントします。

  • 変更には、コードの変更、スケジューリング構成の変更、ノードステータスの変更、およびノードの所有権の変更が含まれます。

  • DataStudio ページで構成が変更され、構成変更後に本番環境にデプロイされたノード、および本番環境で構成が変更されたノードの統計が収集されます。

説明

重点セクションの右上隅にある [マイ] を選択すると、自分がオーナーである変更されたノードの数のみがカウントされます。

なし

自動トリガーノードと自動トリガーインスタンスに関する O&M 情報を表示する

次の表に、自動トリガーノードと自動トリガーインスタンスに関する O&M 情報を表示できるセクションを示します。

セクション

説明

[インスタンスステータス]

  • 統計範囲: このセクションには、特定のデータタイムスタンプに基づいて、ステータス別に自動トリガーインスタンスの分布の統計が表示されます。 現在のワークスペース内の自動トリガーインスタンスの分布、または自分がオーナーである自動トリガーインスタンスの分布を表示できます。 このセクションの統計は、ページを読み込むと更新されます。

  • 情報を表示する方法: ドーナツチャートのセクターをクリックすると、特定の状態の自動トリガーインスタンスの数と割合を表示できます。

  • 特定の状態にあり、重点を置く必要があるインスタンス:

    • 失敗: この状態の自動トリガーインスタンスは実行に失敗します。 その結果、その子孫インスタンスの実行がブロックされる可能性があります。

    • フリーズ: フリーズされた自動トリガーインスタンスは自動的にスケジュールされず、その子孫インスタンスの実行はブロックされます。

    • 実行速度が遅い: 自動トリガーインスタンスが実行中で、その実行時間が過去 15 日間における自動トリガーインスタンスの平均実行時間よりも少なくとも 10 分長い場合、その自動トリガーインスタンスは実行速度が遅いインスタンスと見なされます。履歴上の自動トリガーインスタンスの数が four 未満で、自動トリガーインスタンスの実行時間が 30 分を超える場合も、その自動トリガーインスタンスは実行速度が遅いインスタンスと見なされる可能性があります。

説明

通常ノード の統計のみが収集されます。 ドライランノードとフリーズされたノードの統計は収集されません。

实例运行状态分布

[インスタンスの完了ステータス]

  • 統計範囲: このセクションには、現在の日の 00:00 から 23:00 までの自動トリガーインスタンスの完了状況が表示されます。これには、現在の日に正常に実行された、または実行されなかった自動トリガーインスタンスの数、前日に正常に実行された、または実行されなかった自動トリガーインスタンスの数、正常に実行された、または実行されなかった自動トリガーインスタンスの過去の平均数、および数の変動率が含まれます。 このセクションの統計は、このページを読み込むと更新されます。

  • 表示パターン: 統計は折れ線グラフで表示されます。 3 つの線の偏差が大きい場合は、特定の期間中に例外が発生しています。 さらにチェックと分析を行う必要があります。

  • ノードタイプ: ビジネス要件に基づいてノードタイプを選択できます。

  • 過去の平均: このメトリックは、過去 10 日間に正常に実行された自動トリガーインスタンスの完了状況を表します。

周期实例完成情况

[ノードとインスタンスの傾向]

統計範囲: このセクションには、特定の期間内における本番環境での自動トリガーノードと自動トリガーインスタンスの数の変化傾向が表示されます。 このセクションの右上隅で、過去 12 か月以内の期間を指定できます。

説明

周期实例与周期任务趋势

[自動トリガーノードの分布]

  • 統計範囲: このセクションには、ノードタイプとスケジューリングサイクル別にカウントされた自動トリガーノードの数と割合が表示されます。 このセクションの統計は、ページを読み込むと更新されます。

  • 表示パターン: 統計はドーナツチャートで表示されます。 ドーナツチャートに表示できるノードのタイプは制限されています。 表示する必要があるノードのタイプが上限を超える場合は、マージ後に統計が表示されます。

説明

オペレーションセンターページの上部ナビゲーションバーで [すべてのマイワークスペース] を選択すると、このセクションでワークスペース別の自動トリガーノードの分布を表示できます。

任务分布情况

スケジューリングのリソースグループのリソース使用量セクションの情報を見る

このセクションには、スケジューリングのリソースグループのリソース使用量、および特定の期間にわたってリソースグループで実行されるインスタンスの数の変化傾向が表示されます。 このセクションのチャートは、指定されたリソースグループで実行されるインスタンスによって使用されるリソースの割合を示しています。

説明
  • このセクションには、最大 7 日間の統計が表示されます。

  • リソースグループのリソース使用量が 80% を超える場合は、リソース不足がノードの実行に影響を与えないように、リソースグループをスケールアウトすることをお勧めします。

  • リソース使用量とリソースグループで実行されるインスタンスの数は、リソースグループのレベルで収集されます。 たとえば、複数のワークスペースが使用しているスケジューリングの排他的リソースグループを共有している場合、このセクションには、すべてのワークスペースのリソースグループのリソース使用量と、リソースグループで実行されるインスタンスの数の変化傾向が表示されます。

调度资源组使用情况

前日の自動トリガーインスタンスのランキングと、最近 1 か月でエラー率が最も高い自動トリガーインスタンスのランキングを表示する

实例运行及出错排行

  • [前日のインスタンスのランキング]

    このセクションでは、前日の実行時間、リソースの待機時間、および実行速度が遅い時間に基づいて、自動トリガーインスタンスがランク付けされます。 上位 30 の自動トリガーインスタンスのみが表示されます。 ランキングに基づいて時間のかかるノードを特定し、そのノードに対して生成された [インスタンスの ID] をクリックしてインスタンスの詳細ページに移動し、インスタンスの診断を実行してインスタンスの実行状況を表示できます。

    説明

    実行速度が遅い: 前日のインスタンスの実行時間と過去の期間におけるインスタンスの平均実行時間との差が収集されます。 インスタンスは、差の降順にソートされます。

  • [最近 1 か月でエラー率が最も高い自動トリガーノードインスタンスのランキング]

    このセクションでは、最近 1 か月以内にエラーが発生したノードがランク付けされ、上位 30 のノードが表示されます。 最近 1 か月でエラー率の高いノードを特定し、ノードの実行の詳細を表示し、エラーの原因を特定できます。

手動トリガーノードに関する O&M 情報を表示する

[手動トリガーノード] タブでは、手動トリガーワークフローとワークフロー内のインスタンスに関する O&M 情報を表示できます。

概要

このセクションには、指定された日付に実行された手動トリガーワークフローとワークフロー内の手動トリガーノードに対して生成されたインスタンスの数、および正常に実行された自動トリガーインスタンスの割合が表示されます。

image

ビジネスプロセスインスタンスの状態分布セクションとワークフローランキングセクションの情報を見る

セクション

説明

[ビジネスプロセスインスタンスの状態分布]

このセクションでは、ドーナツチャートを使用して、手動トリガーノードに対して生成されたインスタンスと、手動トリガーワークフロー内のさまざまな状態にあるインスタンスの分布が表示されます。

  • セクターをクリックすると、特定の状態のインスタンスの詳細ページに移動できます。 詳細ページでは、インスタンスの詳細を表示し、インスタンスで発生した例外を処理できます。 [失敗した] インスタンスに特に注意を払う必要があります。

  • このセクションには、最大 7 日間の統計が表示されます。

  • このセクションで [マイ] をクリックすると、自分のアカウントに属し、特定の状態にあるインスタンスの分布が表示されます。

image

[ワークフローランキング]

このセクションには、特定の日付における実行時間が最も長く、失敗率が最も高い上位 30 のワークフローのランキングが表示されます。

  • ランキングに基づいて、時間のかかる、または失敗率の高い手動トリガーワークフローをすばやく見つけ、[ワークフロー ID] をクリックして [ワークフロー] の詳細ページに移動できます。 詳細ページでは、ワークフローの有向非巡回グラフ [(DAG)] 内の特定のインスタンスの診断を実行して、ワークフロー内のインスタンスの実行状況を取得できます。

  • 実行時間が最も長く、失敗率が最も高い 上位 30 ワークフローのみが表示されます。

image

内部タスク分布と内部タスクリーダーボードセクションの情報を見る

セクション

説明

[内部タスク分布]

このセクションでは、ドーナツチャートを使用して、オペレーションセンター内のノード数の分布をリアルタイムで表示します。[ノードタイプ] または [所有者] ディメンションから統計情報を表示できます。

image

[内部タスクリーダーボード]

このセクションには、特定の日付で手動トリガーワークフローで実行時間が最も長く、失敗率が最も高い上位 30 ノードのランキングが表示されます。

  • ランキングに基づいて、時間がかかるノードまたは失敗率の高いノードをすばやく見つけ、[ノード ID] をクリックして、ノード用に生成されたインスタンスが属する [手動トリガーワークフロー] の詳細ページに移動できます。詳細ページでは、ワークフローの [DAG] 内のインスタンスで診断を実行して、インスタンスの 実行状況 を取得できます。

  • 実行時間が最も長く、失敗率が最も高い上位 30 個のノードのみが表示されます。

image

Data Integration のデータ同期ノードに関する O&M 情報を表示する

[Data Integration] タブでは、Data Integration のデータ同期ノードの概要情報と、Data Integration のリソースグループのリソース使用量状況を [前日][本日] について表示できます。

概要

「Data Integration のリソースグループの状態」セクションには、現在のワークスペース内のすべてのデータ同期ノードで使用されている Data Integration のリソースグループのリソース使用状況が表示されます。リソース使用状況には、[Data Integration の各リソースグループで実行中およびリソースを待機中のノード数][リソース使用量]、および [各 Data Integration リソースグループの有効期限] が含まれます。 Data Integration のリソースグループで実行中およびリソースを待機中のノード数と、リソースグループのリソース使用量に基づいて、Data Integration のリソースグループをスケールインまたはスケールアウトする必要があるかどうかを判断できます。これにより、適切なリソース割り当てが容易になります。独享数据集成资源组使用情况

説明
  • Data Integration 専用リソースグループで実行できる操作については、「Data Integration 専用リソースグループ」をご参照ください。

  • サーバーレスリソースグループで実行できる操作については、「サーバーレスリソースグループの使用」ディレクトリのトピックをご参照ください。

  • [Data Integration] タブの [O&M ダッシュボード] ページには、Data Integration 専用リソースグループの O&M 統計情報のみが収集されます。

Data Integration で作成されたデータ同期ノードのステータス別分布を表示する

「実行ステータスの分布」セクションには、現在のワークスペースにおけるデータ同期ノードのステータス別分布がドーナツチャートで表示されます。 セクターをクリックすると、特定のステータスのノードの詳細ページに移動できます。 詳細ページでは、ノードの詳細を表示したり、ノードで発生した例外を処理したりできます。 [異常][実行失敗] ステータスのノードに注意する必要があります。 これらのステータスのノードは、子孫ノードの実行をブロックします。运行状态分布

Data Integration のデータ同期ノードとデータ同期インスタンスに関する O&M 情報を表示する

次の表に、バッチ同期ノードの統計情報を表示できるセクションを示します。

セクション

説明

[データ同期進捗]

このセクションには、指定された期間内のバッチ同期に関連するデータに関する情報が表示されます。 メトリックには、データ総量、インターネットトラフィック総量、データレコード総量が含まれます。

数据同步速度

[同期済みデータ量の統計]

このセクションには、指定された期間内にさまざまなデータソースから読み取られた、または書き込まれたデータの曲線が示されます。 このセクションでは、大量のデータを同期するために実行される特定タイプのコンピューティングエンジンのノードを表示できます。 ノードに過剰なリソースを割り当てることができます。

离线数据同步任务数据统计量

[最新のトップ 10 タスク]

このセクションには、実行に[失敗したインスタンス]の最新の 10 件と、正常に実行された[インスタンス]の最新の 10 件が表示されます。 統計情報は、最新のインスタンスステータスの概要を示します。 インスタンスの失敗の原因をすばやく特定し、エラーメッセージに基づいてエラーを修正できます。

离线任务同步榜单

[同期タスクの実行の詳細]

このセクションでは、フィルター条件を指定してノードを検索できます。 フィルター条件には、[コミット日時][タスクステータス][ノード名]が含まれます。 ノードの ID をクリックすると、ノードの詳細を表示できます。

离线同步任务详情

リアルタイム同期ノードの統計情報を表示する

次の表に、リアルタイム同期ノードの統計情報を表示できるセクションを示します。

セクション

説明

概要

このセクションには、現在のワークスペース内のすべてのリアルタイム同期ノードの合計データ転送速度と合計録画速度が表示されます。

同步速度

[レイテンシが最も高い上位 10 タスク]

このセクションには、レイテンシが最も高い上位 10 ノードが表示されます。 このセクションでは、レイテンシの高いノードをすばやく特定し、ノードのパフォーマンスをできるだけ早く最適化できます。

任务延迟

[アラート情報]

このセクションには、最新のアラートに関する情報が表示されます。 このセクションでは、例外をすばやく特定し、できるだけ早く例外を処理できます。

报警信息

[フェールオーバー情報]

このセクションには、指定された期間内のフェールオーバーに関する情報が表示されます。 このセクションでは、フェールオーバーの概要が示されます。 フェールオーバーの詳細については、「リアルタイム同期タスクの管理」をご参照ください。

failover