すべてのプロダクト
Search
ドキュメントセンター

Dataphin:インスタンス実行診断

最終更新日:Feb 06, 2025

時間指定スケジューリングに加えて、定期インスタンスまたはデータバックフィルインスタンスの実行は、上流インスタンスタスクのステータス、リソースの可用性、レート制限ルールの順守などの要因の影響を受けます。 Dataphin は、インスタンスの実行フローと全体的なリンクを分析するインスタンス実行診断機能を提供し、インスタンスが期待どおりに実行されない場合に問題を迅速に特定できるようにします。

制限事項

  • この機能は、スクリプトインスタンス、詳細テーブルインスタンスと集計テーブルインスタンス、抽出インスタンスを含む、オフラインの定期インスタンスとデータバックフィルインスタンスのみをサポートしています。 リアルタイムコンピューティングやリアルタイム統合などのリアルタイムインスタンス、およびワンタイムインスタンスはサポートされていません。

  • 詳細テーブルインスタンスと集計テーブルインスタンスでは、フィールドレベルの分析はサポートされていません。 分析は、マテリアライズノードのみに基づいています。

機能概要

オペレーションセンターでは、インスタンスの実行ステータスはさまざまな色とアイコンで視覚的に表現され、実行フローのステージを示します。 インスタンスが実行されていないステータスのステージまたは理由は、これらの視覚的な手がかりから推測できます。 インスタンスの実行ステータスとフローの詳細は次のとおりです。

実行ステータスアイコン

アイコンの説明

実行フローチャート

test

実行していません

image.png

test

スケジュール時刻を待機しています

test

レート制限

test

スケジューリングリソースを待機しています

test

実行中

test

成功

test

失敗

インスタンスの実行の成功は、上流依存関係、スケジュール時刻、リソース、インスタンス自体の条件など、さまざまな要因の影響を受ける可能性があります。 インスタンスが実行に失敗した場合、または長時間実行ステータスが続いている場合、実行診断機能では、次のフローまたはディメンションに基づいて診断と分析を行うことができます。

チェック項目

説明

上流依存関係

上流インスタンスの実行ステータスを確認します。 上流インスタンスの障害により、現在のインスタンスが実行されないことがあります。 上流依存関係の診断結果は、障害に関する詳細な洞察を提供します。

時間指定スケジューリング

タスクがスケジュールされた実行時間に達したかどうかを確認します。

レート制限ルール

現在のインスタンスがトリガーしたレート制限ルールと、現在のキューに既にあるインスタンスのリストを確認します。

スケジューリングリソース

インスタンスがスケジューリングリソースを待機していた期間、現在のリソースグループのリソースを使用しているインスタンスのリストを評価し、診断の提案に基づいてアクションを実行します。

インスタンスの実行

インスタンスの実行結果と実行ログにアクセスします。

実行診断エントリ

  1. 詳細については、「オペレーションセンターのエントリ」をご参照ください。 [O&M] センターページに移動します。

  2. [O&M] センターページで、以下に示す操作ガイドを使用して、ターゲットインスタンスのノード詳細ページにアクセスします。

    [定期インスタンス] ページを使用した例を以下に示します。 image

  3. ノード詳細ページで、[診断] ボタンをシングルクリックします。

    image

上流依存関係

上流依存関係診断には、インスタンスの最新の実行診断結果と上流インスタンスの現在のステータスが表示されます。 次のチェックを実行する前に、すべての上流インスタンスが正常に実行されている必要があります。 最新の実行結果または上流インスタンスのステータスを更新するには、刷新 更新アイコンをシングルクリックします。

  • インスタンスの最新の実行が [強制再実行なし][成功] した場合、診断結果は [合格] とマークされます。 image

    機能

    説明

    最新の実行

    実行ステータスと正常に実行された時刻が表示されます。

    説明

    現在のインスタンスは、すべての上流インスタンスが正常に実行された場合にのみスケジューリングを開始します。

    現在の診断結果

    診断結果が表示されます。

    • [スケジュールタイプ]: [ドライラン][通常実行][一時停止実行] が含まれます。 インスタンスが [一時停止実行] 状態の場合、実行を開始するには [スケジューリングの再開] を行う必要があります。

    • 開始ブロッキングノード: 現在のノードの開始を妨げている最上位レベルのノードを識別します。 上流診断をクリアしたインスタンスには、開始ブロッキングノードはありません。

    • 直接上流リスト: 直接上流依存関係を一覧表示します。 ノード名、ノード ID、インスタンス ID による検索、および [実行ステータス][所有者] によるフィルタリングをサポートしています。

  • インスタンスが実行を開始しておらず、[スケジューリングが一時停止されていない] 場合、診断結果のスケジュールタイプは [通常実行] です。 開始ブロッキングノードに焦点を当て、ブロッキングノードの実行を調整して、現在のノードの実行を再開します。 現在のインスタンスは、すべての上流インスタンスが正常に実行された場合にのみスケジューリングを開始します。 image

  • インスタンスが現在一時停止実行ステータスの場合、それ以上診断されず、診断結果は [一時停止実行] です。

    image

  • 強制再実行中のインスタンスでは、すべての上流インスタンスが正常に実行されている必要はありません。 インスタンスの最新の実行が [強制再実行] の場合、診断結果は [スキップ] です。 image

時間指定スケジューリング

時間指定スケジューリングの診断結果は、各インスタンスの最新の実行診断結果です。 インスタンスは、スケジューリングを開始するためにスケジュールされた実行時間に到達する必要があります。そうでない場合、スケジュール時刻待機ステータスになります。 診断結果を更新する必要がある場合は、刷新 更新アイコンをシングルクリックします。

  • インスタンスが時間指定スケジューリングのスケジュール時刻にまだ達しておらず、[一時停止されていない] 場合、診断結果は [スケジュール時刻待機中] と表示されます。 ダウンストリームデータの品質への影響を防ぐために、早期スケジューリングが必要な場合は [強制再実行] を開始できます。 image

  • インスタンスが [スケジューリングが一時停止された] 一時停止状態の場合、診断結果は [一時停止] を示します。 実行を開始するには、[スケジューリングの再開] をシングルクリックします。

    image

  • インスタンスの最新の実行がスケジュールされた時間指定スケジューリングを満たし、[強制再実行されていない] 場合、診断結果は [合格] になります。 image

  • 強制再実行は、インスタンスが時間指定スケジューリングに達したかどうかを確認せずにすぐに開始され、診断をバイパスします。 最新のインスタンス実行が [強制再実行] の場合、診断結果は [スキップ] になります。 image

レート制限ルール

インテリジェントな運用とメンテナンスアドオンを使用すると、レート制限ルールを設定できます。 詳細については、「レート制限の構成」をご参照ください。

すべてのインスタンスは、レート制限ルールの診断を受ける必要があります。 上流依存関係と時間指定スケジューリングの診断に合格した後、リソーススケジューリングシステムに発行される前に、すべてのヒットレート制限ルールを満たす必要があります。 診断結果を更新する必要がある場合は、刷新 更新アイコンをシングルクリックします。

  • インスタンスの最新の実行が上流依存関係と時間指定スケジューリングの基準を満たし、すべてのレート制限ルールに準拠している場合、診断は [合格] と表示されます。 image

  • 現在レート制限中で、[スケジューリングが一時停止されていない] インスタンスは、[レート制限] の診断と現在の待機時間を表示します。 image

    シナリオ

    説明

    ブロッキングルール

    インスタンスによってトリガーされたレート制限ルール名が表示されます。 特定のルール名をクリックして詳細を表示します。

    発行済みインスタンスリスト

    現在のインスタンスがトリガーしたレート制限ルールのキューにあるインスタンスを一覧表示します。 これらのインスタンスは、名前または ID で検索またはフィルタリングできます。

  • インスタンスが一時停止状態であり、[スケジューリングが一時停止されている] 場合、診断は [一時停止] になります。 リソーススケジューリングを続行するには、インスタンスを再開する必要があります。

スケジューリングリソース

実行リソースを共有するインスタンスは、一般にスケジューリングリソースの影響を受けにくいです。 排他的な実行リソースを持つインスタンスは、スケジューリングを開始するために、リソースグループに割り当て可能なアイドルリソースが十分にある必要があります。そうでない場合、[スケジューリングリソース待機中] ステータスになります。 診断結果を更新する必要がある場合は、刷新 更新アイコンをシングルクリックします。

  • インスタンスの最新の実行のリソースグループに利用可能なアイドルリソースが十分にあり、スケジューリングが [一時停止されていない] 場合、診断結果は [合格] になります。 image

  • 現在のインスタンスに割り当て可能なアイドルスケジューリングリソースが十分にない場合、診断結果は [スケジューリングリソース待機中] です。 スケジューリングリソース診断ページには、[リソース待機時間]、診断 [提案][リソース占有インスタンス] リストが表示されます。 ページに表示される診断の提案と [リソース占有インスタンス] リストに基づいて処理することで、現在のインスタンスが正常に実行するために十分なリソースを取得できるようにすることができます。 image

インスタンスの実行

インスタンスが実行フェーズに達すると、[インスタンス実行] 診断ページに移動します。このページには、[実行結果][ランタイムログ] が表示されます。 [実行結果] ステータスが [失敗] とマークされている場合、[ランタイムログ] を使用してトラブルシューティングと問題解決を行うことができます。 診断結果を更新するには、刷新 更新アイコンをクリックします。 image