統合およびコンピューティングタスクインスタンスは、自動トリガーされた統合およびコンピューティングタスクがスケジュールどおりに実行されると生成されます。これらのインスタンスに対して運用保守 (O&M) を実行できます。サポートされている操作には、実行ログの表示、現在のインスタンスの再実行、現在のインスタンスの強制再実行、子孫ノードの強制再実行、ノードコードの表示などがあります。このトピックでは、統合およびコンピューティングタスクインスタンスを表示および管理する方法について説明します。
前提条件
IT 運用 (AIOps) 向けの人工知能 (AI) 付加価値サービスを購入し、現在のテナントで AIOps モジュールを有効にしていること。
統合およびコンピューティングタスクインスタンスページへの移動
Dataphin ホームページの上部のメニューバーで、[開発] > [O&M] を選択します。
左側のナビゲーションウィンドウで、[インスタンス O&M] > [定期インスタンス] を選択します。
上部のメニューバーで、本番または開発環境を選択します。
[定期インスタンス] ページで、[統合およびコンピューティングタスク] タブをクリックします。
統合および計算タスクインスタンスリストでサポートされる操作
自動トリガーされた統合およびコンピューティングタスクがインスタンスを生成すると、インスタンスは[統合およびコンピューティングタスク] タブのリストに表示されます。このリストには、インスタンスオブジェクト、インスタンス ID、ステータス、スケジュールサイクル、データタイムスタンプ、スケジュール実行時間、開始時刻、終了時刻、期間、再試行/自動再試行、優先度、オーナー、プロジェクト、関連ベースラインインスタンス、HTTP パス、スケジュールリソースグループ、およびサポートされる操作が表示されます。
インスタンスオブジェクト: 定期インスタンスオブジェクトは、自動トリガーされたタスクが実行されると生成されます。この列には、インスタンスオブジェクトの名前と ID が表示され、タスクのスケジュールタイプが示されます。列名の横にある
アイコンをクリックすると、オブジェクト名で昇順または降順にソートできます。詳細については、「定期インスタンスマーカーの説明」をご参照ください。ステータス: インスタンスの現在のステータス。指定できる値は、成功、失敗、実行中、スケジュール時刻待ち、調整済み、スケジュールリソース待ち、未実行です。ステータスアイコンとその詳細については、「定期インスタンスのステータスの説明」をご参照ください。
実行開始時刻: インスタンスの実行が開始された時刻。列名の横にある
アイコンをクリックすると、開始時刻で昇順または降順にソートできます。説明論理テーブルノードの開始時刻は、インスタンスオブジェクトの最も早い内部マテリアライズノードが実行を開始した時刻です。
実行終了時刻: インスタンスの実行が停止した時刻。列名の横にある
アイコンをクリックすると、終了時刻で昇順または降順にソートできます。説明論理テーブルノードの終了時刻は、インスタンスオブジェクトの最新の内部マテリアライズノードが実行を停止した時刻です。
リトライ/自動リトライ: 手動リトライと自動リトライの回数。
リトライ回数 = 実行回数 - 1。実行時間: インスタンスが実行された合計時間。列名の横にある
アイコンをクリックすると、実行時間で昇順または降順にソートできます。説明論理テーブルノードの実行時間は、最も早い内部マテリアライズノードの開始時刻と最も遅い内部マテリアライズノードの終了時刻の差です。
優先度: インスタンスの優先度レベル。
説明ベースライン機能が有効な場合、ベースラインタスクの優先度は、そのすべてのベースラインの中で最も高い優先度になります。これは、タスクに設定された元の優先度をオーバーライドします。
プロジェクト: タスクが属するプロジェクト。プロジェクトは
プロジェクト英語名 (プロジェクト中国語名)のフォーマットで表示されます。関連ベースラインインスタンス: ノードが保証するベースライン、およびこのノードを先祖ノードとして持つ関連ベースライン。
説明ベースライン機能が無効な場合、この列は表示されません。
HTTP パス: 選択した本番または開発環境に基づいて、この列には DATABRICKS_SQL インスタンスの本番または開発 HTTP パスが表示されます。
説明この列は DATABRICKS_SQL インスタンスに対してのみ表示されます。他のタイプのタスクでは、ハイフン (-) が表示されます。
リソースグループ: インスタンスが実行時に使用するスケジュールリソースグループの名前。
タスクに指定されたカスタムリソースグループがアクティブでない場合、プロジェクトのデフォルトリソースグループが使用されます。プロジェクトのデフォルトリソースグループもアクティブでない場合、テナントのデフォルトリソースグループが使用されます。優先順位は、カスタムリソースグループ > プロジェクトのデフォルトリソースグループ > テナントのデフォルトリソースグループ です。
説明プロジェクトのデフォルトリソースグループを変更した場合、その変更は UI にすぐに反映されないことがあります。ただし、変更されたリソースグループは次の実行で使用されます。
テナントのデフォルトリソースグループ: このリソースグループはどのプロジェクトにも属しません。各 テナント には、デフォルトのリソースグループが 1 つだけあります。テナントのデフォルトリソースグループは、タスクにカスタムリソースグループがなく、そのプロジェクトにデフォルトリソースグループがない場合にスケジューリングに使用されます。これは、SQL や仮想タスクなど、専用リソースを使用するタスクにのみ適用されます。
次の表に、統合およびコンピューティングタスクインスタンスリストでサポートされる操作を示します。
操作 | 説明 |
DAG |
|
実行ログの表示 |
|
再実行 |
ビジネスシナリオで再実行が必要な場合は、強制的に再実行できます。 |
ガントチャートの表示 |
ガントチャートの詳細については、「クリティカルパスのガントチャートを表示する」をご参照ください。 |
ノードコードの表示 |
論理コード: 作成したタスクコード。 物理コード: コンパイル後に生成され、Flink DPI エンジンで実行できるコード。 |
定期タスク |
|
開発ノードの編集 |
説明 Dev-Prod モードのプロジェクトでは、統合およびコンピューティングタスクインスタンスの開発ノードのみを編集できます。 |
本番ノードの表示 |
説明 Dev-Prod モードのプロジェクトでは、統合およびコンピューティングタスクインスタンスの開発ノードのみを表示できます。 |
ノードの編集 |
説明 Basic モードのプロジェクトでは、統合およびコンピューティングタスクインスタンスのノードのみを編集できます。 |
ダウンストリームの再実行 |
依存関係チェーン全体を再実行するには、下流インスタンスの強制再実行をお勧めします。詳細については、「下流インスタンスの強制再実行」をご参照ください。 下流の再実行操作は、次のシナリオでよく使用されます:
|
成功に設定 & 再開 |
|
停止 |
説明 成功、失敗、または未実行状態のインスタンスは停止できません。他の状態のインスタンスは停止できます。 停止操作は、次のシナリオでよく使用されます:
|
強制再実行 |
重要 強制再実行では、すべての上流インスタンスが正常に実行されたかどうか、または現在のインスタンスのスケジュールされた実行時間に達したかどうかはチェックされません。これにより、実行の失敗やデータ品質の問題が発生する可能性があります。続行する前に、操作が下流のデータに影響しないことを確認してください。 |
上流依存関係の削除 |
重要 少なくとも 1 つの上流インスタンスを保持する必要があります。 |
一時停止 |
説明
|
再開 |
|
HTTP パスの変更 | タスクの本番環境 HTTP パスを変更します。本番プロジェクトに対応するクラスターに設定されている任意の HTTP パスを選択できます。 説明 この操作は、本番環境で DATABRICKS_SQL タスクを選択した場合にのみサポートされます。 |
スケジュールリソースグループの変更 |
説明
|
優先度の変更 |
|
統合およびコンピューティングタスクインスタンスの DAG ノードでサポートされる操作
有向非巡回グラフ (DAG) は、インスタンスノードの上流および下流の依存関係を示します。上流および下流のインスタンスノードで O&M を実行することもできます。デフォルトでは、DAG にはメインノード (選択したノード) とその直接の先祖ノードおよび子孫ノードが表示されます。統合またはコンピューティングタスクインスタンスノードを選択して、インスタンスで O&M 操作を実行できます。
Dataphin は、異なるプロジェクト間のインスタンスノードの O&M をサポートしています。クロスプロジェクトインスタンスノードで O&M 操作を実行するには、インスタンスが存在するプロジェクトに対する必要な表示権限と操作権限が必要です。
DAG でサポートされる操作
操作
説明
親ノードの展開
DAG 内のメインノードの異なるレベルの依存ノードを展開します。
子ノードの展開
タスクの表示
現在のインスタンスノードを生成するタスクノードの DAG に移動します。タスクノードの詳細、その上流および下流ノードに関する情報を表示し、タスクノードで O&M を実行できます。詳細については、自動トリガータスクをご参照ください。
操作ログの表示
インスタンスで実行された操作のログを表示します。
DAG ノードでサポートされる操作
DAG ノードにカーソルを合わせると、その名前、タイプ、スケジュールサイクル、オーナー、および説明が表示されます。DAG ノードでサポートされる操作は、インスタンスリストでサポートされる操作と同じです。詳細については、「統合およびコンピューティングタスクインスタンスリストでサポートされる操作」をご参照ください。
統合およびコンピューティングタスクインスタンスのバッチ操作
次の表に、自動トリガーされた統合およびコンピューティングタスクでサポートされるバッチ操作を示します。
操作 | 説明 |
再実行 |
|
停止 |
|
成功に設定 & 再開 | 複数のインスタンスを選択して、失敗または未実行のインスタンスのステータスをバッチで [成功] に手動で設定します。これにより、それらがスケジューリングに参加できるようになります。 |
一時停止 |
|
再開 | 一時停止中の定期インスタンスをバッチで再開します。 |
[HTTP パスの変更] | 複数の DATABRICKS_SQL インスタンスの本番環境 HTTP パスを変更します。選択した DATABRICKS_SQL インスタンスが異なる Databricks クラスターに属している場合は、各クラスターの HTTP パスを指定します。対応するクラスターに設定されている任意の HTTP パスを選択できます。 説明 この操作は、本番環境で DATABRICKS_SQL インスタンスを選択した場合にのみサポートされます。 |
[スケジュールリソースグループの変更] | インスタンスが実行時に使用するスケジュールリソースグループを変更します。 説明
|
[優先度の変更] | 選択したインスタンスの優先度をバッチで変更します。[最高]、[高]、[中]、[低]、または [最低] を選択できます。 |
すべてダウンロード | 統合、コンピューティング、モデリングタスクインスタンスを含む、すべての定期インスタンスのデータをコンピューターにダウンロードします。ダウンロードされたファイルは .xlsx 形式です。ファイル名は テーブルには次の情報が含まれます: インスタンスオブジェクト、インスタンス ID、ステータス、スケジュールサイクル、データタイムスタンプ、優先度、オーナー、プロジェクト (論理集計テーブルが複数のプロジェクトに属する場合、プロジェクト名はカンマ (`, `) で区切られます)、スケジュール実行時間、開始時刻、終了時刻、実行時間、リトライ/自動リトライ、関連ベースラインインスタンス (インスタンスが複数のベースラインに関連付けられている場合、ベースライン名はカンマ (`, `) で区切られます)、およびスケジュールリソースグループ (このパラメーターはモデリングタスクインスタンスでは空です)。 |
ダウンストリームの再実行
[ダウンストリームの再実行] ダイアログボックスで、パラメーターを構成します。
説明待機中または実行中ステータスの子孫ノードは再実行できません。依存関係チェーン全体を再実行するには、下流インスタンスの強制再実行をお勧めします。詳細については、「下流インスタンスの強制再実行」をご参照ください。
パラメーター
説明
開始ノード実行モード
開始ノードの実行モードを定義します。ドライランまたは通常実行を選択できます。
ドライラン: ドライランインスタンスのステータスは [成功 (通常)] です。実行ログは空で、実行時間は記録されず、データは処理されません。
通常実行: インスタンスは通常どおりスケジュールされます。
ダウンストリーム再実行範囲
再実行する子孫ノードの範囲を選択します。
すべての失敗したインスタンス: 子孫ノードのリストは表示されません。システムは、失敗したすべての子孫インスタンスを自動的に選択して再実行します。
カスタム: 再実行する子孫インスタンスを指定する場合は、このオプションを選択します。名前または ID でノードを検索したり、ステータス、オーナー、またはプロジェクトでフィルター処理したりできます。
[OK] をクリックします。
下流ノードを再実行すると、子孫インスタンスのデータが更新されます。
下流インスタンスの強制再実行
[下流の強制再実行] ダイアログボックスで、再実行パラメーターを設定します。
パラメーター
説明
開始ノード実行モード
開始ノードの実行モードを定義します。ドライランまたは通常実行を選択できます。
ドライラン: ドライランインスタンスのステータスは [成功 (通常)] です。実行ログは空で、実行時間は記録されず、データは処理されません。
通常実行: インスタンスは通常どおりスケジュールされます。
ダウンストリーム強制再実行範囲
強制的に再実行する子孫ノードの範囲を選択します。
すべてのインスタンス: 開始ノードのすべての子孫インスタンスノードを選択します。
カスタム: 再実行する子孫インスタンスを指定する場合は、このオプションを選択します。名前または ID でノードを検索したり、ステータス、オーナー、またはプロジェクトでフィルター処理したりできます。
[OK] をクリックします。