すべてのプロダクト
Search
ドキュメントセンター

Managed Service for Prometheus:Flink メトリクス

最終更新日:Dec 27, 2024

このトピックでは、Managed Service for Prometheus が提供する Flink メトリクスについて説明します。

説明

Managed Service for Prometheusは、書き込まれた監視データ量またはデータレポート数に基づいて料金を請求します。メトリックは、基本メトリックとカスタムメトリックの 2 つのタイプに分類されます。カスタムメトリックは、基本メトリック以外のメトリックを指します。基本メトリックは無料です。カスタムメトリックは、2020 年 1 月 6 日から課金対象となります。

メトリクス

メトリック

定義

説明

単位

タイプ

flink_jobmanager_job_numRestarts

ジョブのフェイルオーバーが発生したときのジョブの再起動回数

このメトリクスは、ジョブのフェイルオーバーが発生したときのジョブの再起動回数を示します。JobManager のフェイルオーバーが発生したときのジョブの再起動回数は含まれません。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_currentEmitEventTimeLag

処理レイテンシ

このメトリクスの値が大きい場合、システムがデータを取得または処理するときにジョブで遅延が発生する可能性があります。

ミリ秒

カスタムメトリック

flink_taskmanager_job_task_operator_currentFetchEventTimeLag

転送レイテンシ

このメトリクスの値が大きい場合、システムがデータを取得するときにジョブで遅延が発生する可能性があります。

ミリ秒

カスタムメトリック

flink_taskmanager_job_task_numRecordsIn

すべての演算子の入力データレコードの総数

演算子についてこのメトリクスの値が長期間増加しない場合、ソースからデータが欠落している可能性があります。そのため、データの転送に失敗します。この場合、ソースのデータを確認する必要があります。

該当なし

カスタムメトリック

flink_taskmanager_job_task_numRecordsOut

出力レコードの総数

演算子についてこのメトリクスの値が長期間増加しない場合、ジョブのコードロジックでエラーが発生し、データが欠落している可能性があります。そのため、データの転送に失敗します。この場合、ジョブのコードロジックを確認する必要があります。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numBytesIn

入力バイトの総数

このメトリクスは、ソースの入力データレコードのサイズを測定します。これは、ジョブのスループットを観察するのに役立ちます。

バイト

カスタムメトリック

flink_taskmanager_job_task_operator_numBytesOut

出力バイトの総数

このメトリクスは、ソースの出力データレコードのサイズを測定します。これは、ジョブのスループットを観察するのに役立ちます。

バイト

カスタムメトリック

flink_taskmanager_job_task_operator_numRecordsIn

すべての演算子の入力データレコードの総数

演算子についてこのメトリクスの値が長期間増加しない場合、ソースからデータが欠落している可能性があります。そのため、データの転送に失敗します。この場合、ソースのデータを確認する必要があります。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numRecordsInPerSecond

データストリームの1秒あたりの入力データレコード数

このメトリクスは、データストリームの全体的な処理速度を測定します。

たとえば、このメトリクスの値は、データストリームの全体的な処理速度が予想される要件を満たしているかどうか、およびさまざまな入力データ負荷の下でジョブのパフォーマンスがどのように変化するかを判断するのに役立ちます。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_operator_numRecordsOut

出力レコードの総数

演算子についてこのメトリクスの値が長期間増加しない場合、ジョブのコードロジックでエラーが発生し、データが欠落している可能性があります。そのため、データの転送に失敗します。この場合、ジョブのコードロジックを確認する必要があります。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numRecordsOutPerSecond

データストリームの1秒あたりの出力データレコード数

このメトリクスは、データストリームの全体的な出力速度を測定します。速度は、データストリームの1秒あたりの出力データレコード数を示します。

たとえば、このメトリクスの値は、データストリームの全体的な出力速度が予想される要件を満たしているかどうか、およびさまざまな出力データ負荷の下でジョブのパフォーマンスがどのように変化するかを判断するのに役立ちます。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_operator_source_numRecordsIn

ソース演算子に流れ込むデータレコードの総数

このメトリクスは、ソースに流れ込むデータレコードの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_sink_numRecordsOut

シンクの出力データレコードの総数

このメトリクスは、ソースによってエクスポートされたデータレコードの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_numRecordsInPerSecond

データストリームの1秒あたりの入力データレコード数

このメトリクスは、データストリームの全体的な処理速度を測定します。

たとえば、このメトリクスの値は、データストリームの全体的な処理速度が予想される要件を満たしているかどうか、およびさまざまな入力データ負荷の下でジョブのパフォーマンスがどのように変化するかを判断するのに役立ちます。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_numRecordsOutPerSecond

データストリームの1秒あたりの出力データレコード数

このメトリクスは、データストリームの全体的な出力速度を測定します。速度は、データストリームの1秒あたりの出力データレコード数を示します。

たとえば、このメトリクスの値は、データストリームの全体的な出力速度が予想される要件を満たしているかどうか、およびさまざまな出力データ負荷の下でジョブのパフォーマンスがどのように変化するかを判断するのに役立ちます。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_operator_source_numRecordsInPerSecond

ソースの1秒あたりの入力データレコード数

このメトリクスは、ソースでデータレコードが生成された速度を測定します。速度は、ソースの1秒あたりの入力データレコード数を示します。

たとえば、生成できるデータレコードの数は、データストリームの各ソースのタイプによって異なります。このメトリクスの値は、ソースでデータレコードが生成された速度を判断し、データストリームを調整してパフォーマンスを向上させるのに役立ちます。

このメトリクスは、監視とアラートにも使用されます。このメトリクスの値が0の場合、ソースからデータが欠落している可能性があります。この場合、ソースのデータが消費されなかったためにデータ出力がブロックされたかどうかを確認する必要があります。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_operator_sink_numRecordsOutPerSecond

シンクの1秒あたりの出力データレコード数

このメトリクスは、シンクからデータレコードがエクスポートされた速度を測定します。速度は、シンクの1秒あたりの出力データレコード数を示します。

たとえば、エクスポートできるデータレコードの数は、データストリームの各シンクのタイプによって異なります。 numRecordsOutOfSinkPerSecond メトリクスの値は、シンクからデータレコードがエクスポートされた速度を判断し、データストリームを調整してパフォーマンスを向上させるのに役立ちます。

このメトリクスは、監視とアラートにも使用されます。このメトリクスの値が0の場合、ジョブのコードロジックが無効であり、すべてのデータがフィルタリングされている可能性があります。この場合、ジョブのコードロジックを確認する必要があります。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_numBuffersInLocalPerSecond

ローカルで消費される1秒あたりのデータバッファ数

このメトリクスの値が大きい場合、ローカルノードでのタスク間通信が頻繁に行われています。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_numBuffersInRemotePerSecond

リモート TaskManager から1秒あたりに受信したバッファの数。

このメトリクスは、TaskManager 間の通信の頻度を示します。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_numBuffersOutPerSecond

他のタスクに1秒あたりに送信されたバッファの数

このメトリクスは、タスクの出力圧力とネットワーク帯域幅の使用量を測定します。

カウント/秒

カスタムメトリック

flink_taskmanager_job_task_numBytesInLocalPerSecond

1秒あたりの入力バイトの総数

このメトリクスは、ソースにデータが流れ込んだ速度を測定します。これは、ジョブのスループットを観察するのに役立ちます。

バイト/秒

カスタムメトリック

flink_taskmanager_job_task_operator_numBytesOutPerSecond

1秒あたりの出力バイトの総数

このメトリクスは、ソースによってデータがエクスポートされた速度を測定します。これは、ジョブのスループットを観察するのに役立ちます。

バイト/秒

カスタムメトリック

flink_taskmanager_job_task_operator_pendingRecords

ソースによって読み取られていないデータレコードの数

このメトリクスは、ソースが外部システムからプルしなかったデータレコードの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_sourceIdleTime

ソースでデータが処理されなかった時間

このメトリクスは、ソースがアイドル状態であったかどうかを指定します。このメトリクスの値が大きい場合、データは外部システムで低速で生成されています。

ミリ秒

カスタムメトリック

flink_taskmanager_job_task_operator_numBytesInPerSecond

1秒あたりの入力バイトの総数

なし

バイト/秒

カスタムメトリック

flink_taskmanager_job_task_numBytesOutPerSecond

1秒あたりの出力バイトの総数

なし

バイト/秒

カスタムメトリック

flink_taskmanager_job_task_operator_currentSendTime

最新のレコードの送信に費やされた時間

なし

ミリ秒

カスタムメトリック

flink_jobmanager_job_totalNumberOfCheckpoints

チェックポイントの総数

なし

該当なし

カスタムメトリック

flink_jobmanager_job_numberOfFailedCheckpoints

失敗したチェックポイントの数

なし

該当なし

カスタムメトリック

flink_jobmanager_job_numberOfCompletedCheckpoints

完了したチェックポイントの数

なし

該当なし

カスタムメトリック

flink_jobmanager_job_numberOfInProgressCheckpoints

進行中のチェックポイントの数

なし

該当なし

カスタムメトリック

flink_jobmanager_job_lastCheckpointDuration

最後のチェックポイントが使用された時間。

チェックポイントに時間がかかりすぎる場合、またはタイムアウトする場合、考えられる原因は、状態データによって占有されているストレージスペースが過度に大きかったこと、一時的なネットワークエラーが発生したこと、バリアが調整されていなかったこと、またはデータのバックプレッシャーが存在していたことです。

ミリ秒

カスタムメトリック

flink_jobmanager_job_lastCheckpointSize

最後のチェックポイントのサイズ

このメトリクスは、アップロードされた最後のチェックポイントのサイズを測定します。このメトリクスは、ボトルネックが発生したときのチェックポイントのパフォーマンスを分析するのに役立ちます。

バイト

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_stateClearLatency

状態データに対するクリア操作の最大レイテンシ

このメトリクスは、状態データに対するクリア操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_valueStateGetLatency

ValueState データに対する Get 操作の最大レイテンシ

このメトリクスは、演算子による ValueState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_valueStateUpdateLatency

ValueState データに対する更新操作の最大レイテンシ

このメトリクスは、ValueState データに対する更新操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_aggregatingStateGetLatency

AggregatingState データに対する Get 操作の最大レイテンシ

このメトリクスは、演算子による AggregatingState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_aggregatingStateAddLatency

AggregatingState データに対する Add 操作の最大レイテンシ

このメトリクスは、AggregatingState データに対する Add 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_aggregatingStateMergeNamespacesLatency

AggregatingState データに対する名前空間マージ操作の最大レイテンシ

このメトリクスは、AggregatingState データに対する名前空間マージ操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_reducingStateGetLatency

ReducingState データに対する Get 操作の最大レイテンシ

このメトリクスは、演算子による ReducingState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_reducingStateAddLatency

ReducingState データに対する Add 操作の最大レイテンシ

このメトリクスは、ReducingState データに対する Add 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_reducingStateMergeNamespacesLatency

ReducingState データに対する名前空間マージ操作の最大レイテンシ

このメトリクスは、ReducingState データに対する名前空間マージ操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateGetLatency

MapState データに対する Get 操作の最大レイテンシ

このメトリクスは、演算子による MapState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStatePutLatency

MapState データに対する Put 操作の最大レイテンシ

このメトリクスは、MapState データに対する Put 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStatePutAllLatency

MapState データに対する PutAll 操作の最大レイテンシ

このメトリクスは、MapState データに対する PutAll 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateRemoveLatency

MapState データに対する Remove 操作の最大レイテンシ

このメトリクスは、MapState データに対する Remove 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateContainsLatency

MapState データに対する Contains 操作の最大レイテンシ

このメトリクスは、MapState データに対する Contains 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateEntriesInitLatency

MapState エントリに対する Init 操作の最大レイテンシ

このメトリクスは、MapState エントリに対する Init 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateKeysInitLatency

MapState キーに対する Init 操作の最大レイテンシ

このメトリクスは、MapState キーに対する Init 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateValuesInitLatency

MapState 値に対する Init 操作の最大レイテンシ

このメトリクスは、MapState 値に対する Init 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateIteratorInitLatency

MapState イテレータに対する Init 操作の最大レイテンシ

このメトリクスは、MapState イテレータに対する Init 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateIsEmptyLatency

MapState データに対する Empty 操作の最大レイテンシ

このメトリクスは、MapState データに対する Empty 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateIteratorHasNextLatency

MapState イテレータに対する HasNext 操作の最大レイテンシ

このメトリクスは、MapState イテレータに対する HasNext 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateIteratorNextLatency

MapState イテレータに対する Next 操作の最大レイテンシ

このメトリクスは、MapState イテレータに対する Next 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_mapStateIteratorRemoveLatency

MapState イテレータに対する Remove 操作の最大レイテンシ

このメトリクスは、MapState イテレータに対する Remove 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_listStateGetLatency

ListState データに対する Get 操作の最大レイテンシ

このメトリクスは、演算子による ListState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_listStateAddLatency

ListState データに対する Add 操作の最大レイテンシ

このメトリクスは、ListState データに対する Add 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_listStateAddAllLatency

ListState データに対する AddAll 操作の最大レイテンシ

このメトリクスは、ListState データに対する AddAll 操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_listStateUpdateLatency

ListState データに対する更新操作の最大レイテンシ

このメトリクスは、ListState データに対する更新操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_listStateMergeNamespacesLatency

ListState データに対する名前空間マージ操作の最大レイテンシ

このメトリクスは、ListState データに対する名前空間マージ操作のパフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_sortedMapStateFirstEntryLatency

SortedMapState データの最初のエントリにアクセスする際の最大レイテンシ

このメトリクスは、演算子による SortedMapState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_state_name_sortedMapStateLastEntryLatency

SortedMapState データの最後のエントリにアクセスする際の最大レイテンシ

このメトリクスは、演算子による SortedMapState データへのアクセス パフォーマンスを測定します。

ナノ秒

カスタムメトリック

flink_taskmanager_job_task_operator_geminiDB_total_size

状態データサイズ

このメトリクスは、次の操作を実行するのに役立ちます。

  • 状態データのボトルネックが発生する可能性のあるノードを特定します。

  • 状態データの TTL が有効になっているかどうかを確認します。

バイト

カスタムメトリック

flink_taskmanager_job_task_operator_geminiDB_total_filesize

状態データファイルのサイズ

このメトリクスは、次の操作を実行するのに役立ちます。

  • ローカルディスクの状態データファイルのサイズを確認します。サイズが大きい場合は、事前にアクションを実行できます。

  • 状態データが過度に大きく、ローカルディスク容量が不足しているかどうかを判断します。

バイト

カスタムメトリック

flink_taskmanager_job_task_currentInputWatermark

各タスクが最新のウォーターマークを受信した時刻

このメトリクスは、TaskManager によるデータ受信のレイテンシを測定します。

なし

カスタムメトリック

flink_taskmanager_job_task_operator_watermarkLag

ウォーターマークレイテンシ

このメトリクスは、サブタスクのレイテンシを測定します。

ミリ秒

カスタムメトリック

flink_jobmanager_Status_JVM_CPU_Load

JobManager の CPU 負荷

このメトリクスの値が長期間にわたって 100% を超える場合、CPU はビジー状態で、CPU 負荷が高くなっています。これはシステムのパフォーマンスに影響を与える可能性があります。その結果、システムの吃音や応答の遅延などの問題が発生します。

なし

基本メトリック

flink_jobmanager_Status_JVM_Memory_Heap_Used

JobManager のヒープメモリの量

なし

バイト

基本メトリック

flink_jobmanager_Status_JVM_Memory_Heap_Committed

JobManager によってコミットされたヒープメモリの量

なし

バイト

基本メトリック

flink_jobmanager_Status_JVM_Memory_Heap_Max

JobManager のヒープメモリの最大量

なし

バイト

基本メトリック

flink_jobmanager_Status_JVM_Memory_NonHeap_Used

JobManager の非ヒープメモリの量

なし

バイト

基本メトリック

flink_jobmanager_Status_JVM_Memory_NonHeap_Committed

JobManager によってコミットされた非ヒープメモリの量

なし

バイト

基本メトリック

flink_jobmanager_Status_JVM_Memory_NonHeap_Max

JobManager の非ヒープメモリの最大量

なし

バイト

基本メトリック

flink_jobmanager_Status_JVM_Threads_Count

JobManager のスレッド数

JobManager のスレッド数が多すぎると、過剰なメモリ領域が占有され、ジョブの安定性が低下します。

該当なし

基本メトリック

flink_jobmanager_Status_JVM_GarbageCollector_ParNew_Count

JobManager 内で実行された GC の回数

GC が頻繁に発生すると、過剰なメモリ消費につながり、ジョブのパフォーマンスに悪影響を及ぼします。このメトリックは、ジョブの問題を診断し、ジョブの失敗の原因を特定するのに役立ちます。

該当なし

基本メトリック

flink_jobmanager_Status_JVM_GarbageCollector_G1_Young_Generation_Count

JobManager の Young GC の回数

なし

該当なし

カスタムメトリック

flink_jobmanager_Status_JVM_GarbageCollector_G1_Old_Generation_Count

JobManager の Old GC の回数

なし

該当なし

カスタムメトリック

flink_jobmanager_Status_JVM_GarbageCollector_G1_Young_Generation_Time

JobManager の Young GC の時間

なし

ミリ秒

カスタムメトリック

flink_jobmanager_Status_JVM_GarbageCollector_G1_Old_Generation_Time

JobManager の Old GC の時間

なし

ミリ秒

カスタムメトリック

flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Count

JobManager の Concurrent Mark Sweep (CMS) ガベージコレクターによって実行された GC の回数

なし

該当なし

基本メトリック

flink_jobmanager_Status_JVM_GarbageCollector_ParNew_Time

各 JobManager GC の時間

JobManager GC に時間がかかりすぎる場合、過剰なメモリ領域が占有され、ジョブのパフォーマンスに影響します。このメトリックは、ジョブの問題を診断し、ジョブの失敗の原因を特定するのに役立ちます。

ミリ秒

基本メトリック

flink_jobmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time

JobManager CMS ガベージコレクターの GC 時間。

なし

ミリ秒

基本メトリック

flink_jobmanager_Status_JVM_ClassLoader_ClassesLoaded

JobManager が存在する Java 仮想マシン (JVM) が作成された後にロードされたクラスの総数

JobManager が存在する JVM が作成された後にロードされたクラスの総数が過度に大きい場合、過剰なメモリ領域が占有され、ジョブのパフォーマンスに影響します。

なし

基本メトリック

flink_jobmanager_Status_JVM_ClassLoader_ClassesUnloaded

JobManager が存在する JVM が作成された後にアンロードされたクラスの総数

JobManager が存在する JVM が作成された後にアンロードされたクラスの総数が過度に大きい場合、過剰なメモリ領域が占有され、ジョブのパフォーマンスに影響します。

なし

基本メトリック

flink_taskmanager_Status_JVM_CPU_Load

TaskManager の CPU 負荷

このメトリックは、CPU がデータを計算していたプロセスと、CPU による計算を待機していたプロセスの総数を示します。ほとんどの場合、このメトリックは CPU がどれほどビジー状態かを示します。

このメトリックの値は、使用された CPU コアの数に関連しています。Flink の CPU 負荷は、次の式を使用して計算されます。CPU 負荷 = CPU 使用率 / CPU コア数。 flink_taskmanager_Status_JVM_CPU_Load メトリックの値が Flink の CPU 負荷よりも大きい場合、CPU 処理がブロックされている可能性があります。

なし

基本メトリック

flink_jobmanager_Status_ProcessTree_CPU_Usage

JobManager の CPU 使用率

このメトリックは、Flink によって占有された CPU タイムスライスの使用率を示します。

  • このメトリックの値が 100% の場合、1 つの CPU コアが使用されています。

  • このメトリックの値が 400% の場合、4 つの CPU コアが使用されています。

このメトリックの値が長期間にわたって 100% を超える場合、CPU はビジー状態です。

CPU 負荷は高いが CPU 使用率が低い場合、頻繁な読み取りおよび書き込み操作が原因で、割り込み不可能なスリープ状態のプロセスが多数実行されている可能性があります。

なし

基本メトリック

flink_taskmanager_Status_ProcessTree_CPU_Usage

TaskManager の CPU 使用率

このメトリックは、Flink によって占有された CPU タイムスライスの使用率を示します。

  • このメトリックの値が 100% の場合、1 つの CPU コアが使用されています。

  • このメトリックの値が 400% の場合、4 つの CPU コアが使用されています。

このメトリックの値が長期間にわたって 100% を超える場合、CPU はビジー状態です。

CPU 負荷は高いが CPU 使用率が低い場合、頻繁な読み取りおよび書き込み操作が原因で、割り込み不可能なスリープ状態のプロセスが多数実行されている可能性があります。

なし

基本メトリック

flink_taskmanager_Status_JVM_Memory_Heap_Used

TaskManager のヒープメモリの量

なし

バイト

基本メトリック

flink_taskmanager_Status_JVM_Memory_Heap_Committed

TaskManager によってコミットされたヒープメモリの量

なし

バイト

基本メトリック

flink_taskmanager_Status_JVM_Memory_Heap_Max

TaskManager のヒープメモリの最大量

なし

バイト

基本メトリック

flink_taskmanager_Status_JVM_Memory_NonHeap_Used

TaskManager の非ヒープメモリの量

なし

バイト

基本メトリック

flink_taskmanager_Status_JVM_Memory_NonHeap_Committed

TaskManager によってコミットされた非ヒープメモリの量

なし

バイト

基本メトリック

flink_taskmanager_Status_JVM_Memory_NonHeap_Max

TaskManager の非ヒープメモリの最大量

なし

バイト

基本メトリック

flink_taskmanager_Status_ProcessTree_Memory_RSS

Linux 上のプロセス全体によって消費されるメモリの量

このメトリックは、プロセスのメモリ消費量の変化を追跡します。

バイト

基本メトリック

flink_taskmanager_Status_JVM_Threads_Count

TaskManager のスレッド数

TaskManager のスレッド数が多すぎると、過剰なメモリ領域が占有され、ジョブの安定性が低下します。

該当なし

基本メトリック

flink_taskmanager_Status_JVM_GarbageCollector_ParNew_Count

TaskManager 内で実行された GC の回数

GC が頻繁に発生すると、過剰なメモリ消費につながり、ジョブのパフォーマンスに悪影響を及ぼします。このメトリックは、ジョブの問題を診断し、ジョブの失敗の原因を特定するのに役立ちます。

該当なし

基本メトリック

flink_taskmanager_Status_JVM_GarbageCollector_G1_Young_Generation_Count

TaskManager の Young GC の回数

なし

該当なし

カスタムメトリック

flink_taskmanager_Status_JVM_GarbageCollector_G1_Old_Generation_Count

TaskManager の Old GC の回数

なし

該当なし

カスタムメトリック

flink_taskmanager_Status_JVM_GarbageCollector_G1_Young_Generation_Time

TaskManager の Young GC の時間

なし

ミリ秒

カスタムメトリック

flink_taskmanager_Status_JVM_GarbageCollector_G1_Old_Generation_Time

TaskManager の Old GC の時間

なし

ミリ秒

カスタムメトリック

flink_taskmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Count

TaskManager の CMS ガベージコレクターによって実行された GC の回数

なし

該当なし

基本メトリック

flink_taskmanager_Status_JVM_GarbageCollector_ParNew_Time

各 TaskManager GC の時間

TaskManager GC に時間がかかりすぎる場合、過剰なメモリ領域が占有され、ジョブのパフォーマンスに影響します。このメトリックは、ジョブの問題を診断し、ジョブの失敗の原因を特定するのに役立ちます。

ミリ秒

基本メトリック

flink_taskmanager_Status_JVM_GarbageCollector_ConcurrentMarkSweep_Time

TaskManager CMS ガベージコレクターの GC 時間

なし

ミリ秒

基本メトリック

flink_taskmanager_Status_JVM_ClassLoader_ClassesLoaded

TaskManager が存在する JVM が作成された後にロードされたクラスの総数

TaskManager が存在する JVM が作成された後にロードされたクラスの総数が過度に大きい場合、過剰なメモリ領域が占有され、ジョブのパフォーマンスに影響します。

なし

基本メトリック

flink_taskmanager_Status_JVM_ClassLoader_ClassesUnloaded

TaskManager が存在する JVM が作成された後にアンロードされたクラスの総数

TaskManager が存在する JVM が作成された後にアンロードされたクラスの総数が過度に大きい場合、過剰なメモリ領域が占有され、ジョブのパフォーマンスに影響します。

なし

基本メトリック

flink_jobmanager_job_uptime

ジョブが実行されている期間。

なし

ミリ秒

カスタムメトリック

flink_jobmanager_numRunningJobs

実行中のジョブの数

なし

なし

カスタムメトリック

flink_jobmanager_taskSlotsAvailable

利用可能なタスクスロットの数

なし

なし

カスタムメトリック

flink_jobmanager_taskSlotsTotal

タスクスロットの総数

なし

なし

カスタムメトリック

flink_jobmanager_numRegisteredTaskManagers

登録済み TaskManager の数

なし

なし

カスタムメトリック

flink_taskmanager_job_task_numBytesInRemotePerSecond

リモートソースから 1 秒あたりに読み取られたバイト数

なし

バイト/秒

カスタムメトリック

flink_taskmanager_job_task_operator_numLateRecordsDropped

ウィンドウレイテンシが原因でドロップされたパケットの数

なし

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_lateRecordsDroppedRate

ウィンドウレイテンシ率

なし

なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_isSnapshotting

ジョブがフルデータフェーズであったかどうか

このメトリックは、ジョブの処理フェーズを示します。

なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_isBinlogReading

ジョブが増分フェーズであったかどうか

このメトリックは、ジョブの処理フェーズを示します。

なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_numTablesRemaining

フルデータフェーズで未処理のテーブルの数

このメトリックは、未処理のテーブルの数を測定します。

該当なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_numTablesSnapshotted

フルデータフェーズで処理待ちのテーブルの数

このメトリックは、未処理のテーブルの数を測定します。

該当なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_numSnapshotSplitsProcessed

フルデータフェーズで処理されたテーブルの数

このメトリックは、処理されたテーブルの数を測定します。

該当なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_cdcns_schema_table_numSnapshotSplitsProcessed

フルデータフェーズで処理されたシャードの数

このメトリックは、処理されたシャードの数を測定します。

該当なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_numSnapshotSplitsRemaining

フルデータフェーズで処理待ちのシャードの数

このメトリックは、未処理のシャードの数を測定します。

該当なし

カスタムメトリック

flink_jobmanager_job_operator_coordinator_enumerator_cdcns_schema_table_numSnapshotSplitsRemaining

フルデータフェーズで処理待ちのシャードの数

このメトリックは、未処理のシャードの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_currentReadTimestampMs

最後に読み取られたデータレコードのタイムスタンプ

このメトリックは、最新のバイナリログデータの時刻を測定します。

ミリ秒

カスタムメトリック

flink_taskmanager_job_task_operator_numSnapshotRecords

フルデータフェーズで処理されたデータレコードの数

このメトリックは、フルデータフェーズで処理されたデータレコードの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_cdcns_schema_table_numRecordsIn

各テーブルから読み取られたデータレコードの数

このメトリックは、各テーブルで処理されたデータレコードの総数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_cdcns_schema_table_numSnapshotRecords

フルデータフェーズで各テーブルで処理されたデータレコードの数

このメトリックは、フルデータフェーズで各テーブルで処理されたデータレコードの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_cdcns_schema_table_numInsertDMLRecords

増分フェーズで各テーブルに対して実行された INSERT DML ステートメントの数

このメトリックは、各テーブルに対して実行された INSERT ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_cdcns_schema_table_numUpdateDMLRecords

増分フェーズで各テーブルに対して実行された UPDATE DML ステートメントの数

このメトリックは、各テーブルに対して実行された UPDATE ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_cdcns_schema_table_numDeleteDMLRecords

増分フェーズで各テーブルに対して実行された DELETE DML ステートメントの数

このメトリックは、各テーブルに対して実行された DELETE ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_cdcns_schema_table_numDDLRecords

増分フェーズで各テーブルに対して実行された DDL ステートメントの数

このメトリックは、各テーブルに対して実行された DDL ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numInsertDMLRecords

増分フェーズで実行された INSERT DML ステートメントの数

このメトリックは、実行された INSERT ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numUpdateDMLRecords

増分フェーズで実行された UPDATE DML ステートメントの数

このメトリックは、実行された UPDATE ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numDeleteDMLRecords

増分フェーズで実行された DELETE DML ステートメントの数

このメトリックは、実行された DELETE ステートメントの数を測定します。

該当なし

カスタムメトリック

flink_taskmanager_job_task_operator_numDDLRecords

増分フェーズで実行された DDL ステートメントの数

このメトリックは、実行された DDL ステートメントの数を測定します。

該当なし

カスタムメトリック

共通のメトリックラベル

ラベル

説明

vvpNamespace

名前空間の名前。

deploymentName

デプロイメント名。

deploymentId

デプロイメント ID。

jobId

ジョブ ID。

参照