このトピックでは、Hologres で使用されるメトリックについて説明します。メトリックは、インスタンスのリソース使用量と SQL 文の実行ステータスを反映します。メトリックを参照することで、システムの例外を迅速に特定し、トラブルシューティングを実行できます。
使用上の注意
QE と FixedQE について:
クエリエンジン (QE) は、Hologres QE (HQE) や Seahawks QE (SQE) など、Hologres 用に開発されたベクターコンピューティングエンジンの総称です。スロークエリログに Engine Type={XQE} が含まれるクエリのメトリックは、QE 関連のメトリックです。
FixedQE は、固定プランを使用して実行されるクエリの、実行エンジンを示します。スロークエリログに Engine Type={FixedQE} が含まれるクエリのメトリックは、FixedQE 関連のメトリックです。 Hologres V2.2 より前のバージョンでは、FixedQE は SDK という名前でした。
ステートメントタイプについて:
一般的なタイプ: SQL 文は、キーワードに基づいて分類されます。たとえば、
INSERT xxx文とINSERT xxx ON CONFLICT DO UPDATE/NOTHING文は INSERT タイプとして分類されます。UNKNOWN タイプ: 識別できなかった SQL 文は UNKNOWN タイプとして分類されます。たとえば、構文エラーのある SQL 文は識別できません。
UTILITY タイプ: これらのコマンドは、データ操作 (
INSERT、UPDATE、DELETE) およびデータ取得 (SELECT) コマンドとは異なる、管理、定義、および制御操作を包含します。これらは主に次のように分類されます:データ定義言語 (DDL):
CREATE、ALTER、DROP、TRUNCATE、COMMENTトランザクション制御言語 (TCL):
BEGIN、COMMIT、ROLLBACK、SAVEPOINT管理とメンテナンス:
ANALYZE、VACUUM、EXPLAIN、SET、SHOW、COPY、REFRESH実行とプロシージャ制御:
PREPARE、EXECUTE、DEALLOCATE、CALL、DECLARE CURSORその他のユーティリティコマンド:
LOCK TABLE、LISTEN、NOTIFY
CloudMonitor では、各メトリックに固有の ID があり、特定のメトリックをより簡単に見つけることができます。メトリック ID には、インスタンス タイプに基づいて異なるプレフィックスが付いています。汎用インスタンス、セカンダリ インスタンス、仮想ウェアハウス インスタンス、および Hologres Shared Cluster (Lakehouse Acceleration Edition) インスタンスのプレフィックスは、それぞれ
standard_、follower_、warehouse_、およびshared_です。さまざまなタイプのインスタンスでサポートされているメトリックの詳細については、CloudMonitor コンソールで次のページをご覧ください。メトリックの値が表示されない場合は、特定のバージョンのインスタンスでこのメトリックがサポートされていないか、長期間にわたってメトリックのデータが収集されていません。
メトリックデータは最大 30 日間保持できます。
アクセス制御
Hologres コンソールの監視ページは、CloudMonitor から提供されています。 RAM ユーザーとして監視情報を表示する場合は、ビジネス要件に基づいて RAM ユーザーに関連する権限を付与する必要があります。
AliyunCloudMonitorFullAccess: CloudMonitor を管理するための権限。
AliyunCloudMonitorReadOnlyAccess: CloudMonitor の読み取り専用権限。
RAM ユーザーに権限を付与する方法の詳細については、「RAM ユーザーに権限を付与する」をご参照ください。
メトリック
次の表に、Hologres でサポートされているメトリックを示します。
カテゴリ | メトリック | 説明 | サポートされているインスタンスタイプ | 備考 |
CPU | インスタンスの CPU 使用率。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | なし | |
インスタンス内の各ワーカーノードの CPU 使用率。 | ||||
仮想ウェアハウス内の各クラスターの CPU 使用量。 | 仮想ウェアハウスインスタンス | Hologres V4.0 以降でサポート | ||
メモリ | インスタンスの全体的なメモリ使用率。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | なし | |
インスタンス内の各ワーカーノードのメモリ使用率。 | ||||
システム、メタデータ、キャッシュ、クエリ、およびバックグラウンド別に分類された、インスタンスのメモリ使用量データ。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.0 以降でサポートされています | ||
QE ベースのクエリで使用されるメモリリソースの量。 | Hologres V2.0.44 以降、および V2.1.22 以降でサポートされています | |||
QE ベースのクエリのメモリ使用率。 | ||||
クエリ QPS と RPS | インスタンスで 1 秒あたりに実行されるクエリの総数。 | 汎用インスタンス、セカンダリインスタンス、仮想ウェアハウスインスタンス、および Hologres Shared Cluster インスタンス | クエリ QPS ≥ QE QPS + FixedQE QPS 説明 このメトリックは、UNKNOWN タイプと UTILITY タイプのクエリ、およびスロークエリログに Engine Type={PG} が含まれるクエリを含め、すべてのクエリについて収集されます。 | |
インスタンスで 1 秒あたりに実行される QE ベースのクエリの総数。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.2 以降でサポートされています | ||
インスタンスで 1 秒あたりに実行される FixedQE ベースのクエリの総数。 Hologres V2.2 より前のバージョンでは、FixedQE は SDK という名前でした。 | ||||
インスタンスで 1 秒あたりにデータ操作言語 (DML) クエリが実行されるデータレコードの総数。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | DML RPS = QE RPS + FixedQE RPS | ||
インスタンスで 1 秒あたりに QE ベースの DML クエリが実行されるデータレコードの総数。 | Hologres V2.2 以降でサポートされています | |||
インスタンスで 1 秒あたりに FixedQE ベースの DML クエリが実行されるデータレコードの総数。 | ||||
クエリレイテンシ | インスタンスにおけるクエリの平均レイテンシ。 | 汎用インスタンス、セカンダリインスタンス、仮想ウェアハウスインスタンス、および Hologres Shared Cluster インスタンス | なし | |
インスタンスにおける QE ベースのクエリの平均レイテンシ。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.2 以降でサポートされています | ||
インスタンスにおける FixedQE ベースのクエリの平均レイテンシ。 | ||||
最適化フェーズにおけるクエリの期間。 | 汎用インスタンス、セカンダリインスタンス、仮想ウェアハウスインスタンス、および Hologres Shared Cluster インスタンス | Hologres V2.0.44 以降、および V2.1.22 以降でサポートされています | ||
クエリ開始フェーズにおけるクエリの期間。 | ||||
次取得フェーズにおけるクエリの期間。 | ||||
クエリの 99 パーセンタイルレイテンシ。 | なし | |||
インスタンスで最も長く実行されている進行中のクエリの、実行時間。 | ||||
失敗したクエリ QPS | インスタンスで 1 秒あたりに失敗したクエリの総数。 | 汎用インスタンス、セカンダリインスタンス、仮想ウェアハウスインスタンス、および Hologres Shared Cluster インスタンス | 失敗したクエリ QPS ≥ 失敗した QE QPS + 失敗した FixedQE QPS 説明 このメトリックは、UNKNOWN タイプと UTILITY タイプのステートメントを実行することで発生した失敗したクエリ、およびスロークエリログに Engine Type={PG} が含まれる失敗したクエリを含め、すべての失敗したクエリについて収集されます。 | |
インスタンスで 1 秒あたりに失敗した QE ベースのクエリの総数。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.2 以降でサポートされています | ||
インスタンスで 1 秒あたりに失敗した FixedQE ベースのクエリの総数。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | |||
ロック | データ定義言語 (DDL) ステートメントが FE ロックの解放を待機する最長時間。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.0.44 以降、および V2.1.22 以降でサポートされています | |
FixedQE ベースのクエリがロックの取得に費やす時間。ほとんどの場合、FixedQE ベースのクエリは、HQE ベースのクエリによって取得されたロックが解放されるのを待機する必要があります。 | ||||
HQE ベースのクエリがインスタンスでロックの取得に費やす時間。 FixedQE ベースのクエリが HQE ベースのクエリによって保持されているロックの待機に費やす時間も含まれます。 | ||||
接続 | インスタンスで使用されている接続の総数。 | 汎用インスタンス、セカンダリインスタンス、仮想ウェアハウスインスタンス、および Hologres Shared Cluster インスタンス | なし | |
インスタンス内の各データベースで使用されている接続数。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | |||
インスタンス内の各 FE ノードで使用されている接続数。 | ||||
インスタンス内の FE ノード間の最大接続使用率。 | ||||
クエリキュー | インスタンスで実行待ちのクエリの数。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V3.0 以降でサポートされています | |
インスタンスでシステム処理キューに 1 秒あたりに送信されるクエリの数。 | ||||
1 秒あたりに待機状態から実行状態に変わるクエリの数。 | ||||
クエリが処理を開始した後に、各実行状態で 1 秒あたりに処理されるクエリの数。 | ||||
クエリが処理される前にキューで費やす平均時間。クエリの処理時間は含まれません。 | ||||
クエリ キューの最大同時実行性。 | 仮想ウェアハウス インスタンス | Hologres V3.1 以降でサポートされています | ||
I/O | 標準ストレージ階層からデータを読み取るための I/O スループット。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | なし | |
標準ストレージ階層にデータを書き込むための I/O スループット。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | |||
低頻度アクセス (IA) ストレージ階層からデータを読み取るための I/O スループット。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | |||
IA ストレージ階層にデータを書き込むための I/O スループット。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | |||
ストレージ | 使用されている標準ストレージリソースの量。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | なし | |
使用されている標準ストレージリソースの割合。 | ||||
使用されている IA ストレージリソースの量。 | ||||
使用されている IA ストレージリソースの割合。 | ||||
テーブルのゴミ箱で使用されるストレージ。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | Hologres V3.1 以降でサポート | ||
フレームワーク | FE ノードの再生レイテンシ。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.2 以降でサポートされています | |
シャードレベルのレプリケーション機能が有効になった後の、レプリカ間のデータ同期のレイテンシ。 | なし | |||
プライマリインスタンスからセカンダリインスタンスへのデータ同期のレイテンシ。このメトリックは、セカンダリインスタンスの場合にのみ表示されます。 | ||||
geo ディザスタリカバリインスタンス間のファイル同期のレイテンシ。 | 汎用インスタンス | |||
自動分析 | データベースで統計情報が欠落しているテーブルの数。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | Hologres V2.2 以降でサポートされています | |
サーバーレスコンピューティング | サーバーレスコンピューティング機能が有効になった後、サーバーレスコンピューティングリソースを使用する、最も長く実行されているクエリの、実行時間。 | 汎用インスタンスおよび仮想ウェアハウスインスタンス | Hologres V2.1 以降でサポートされています | |
サーバーレスコンピューティングリソースプールでキューイングされているクエリの数。 | Hologres V2.2 以降でサポートされています | |||
インスタンスで使用されているサーバーレスコンピューティングリソースの量と、申請可能なリソースの最大量の比率。 | ||||
バイナリログ | 1 秒あたりに消費されるバイナリログ内のデータレコードの数。 | 汎用インスタンス、セカンダリインスタンス、および仮想ウェアハウスインスタンス | Hologres V2.2 以降でサポートされています | |
1 秒あたりに消費されるバイナリログ内のバイト数。 | ||||
各 FE ノードで使用されている walsender の数。 | ||||
FE ノード間の最大 walsender 使用率。 | ||||
コンピューティングリソース | スケジュールされたスケーリングによって提供されるエラスティックリソースからの vCPU の数。 | 仮想ウェアハウスインスタンス | Hologres V2.2.21 以降でサポートされています | |
自動スケーリングによって提供されるエラスティックリソースからの vCPU の数。 | Hologres V4.0 以降でサポート | |||
ゲートウェイ | インスタンス内の各ゲートウェイの CPU 使用率。 | 仮想ウェアハウスインスタンス | Hologres V2.0 以降でサポートされています | |
インスタンス内の各ゲートウェイのメモリ使用率。 | Hologres V2.0 以降でサポートされています | |||
システムが 1 秒で受信し正常に確立できる接続の最大数。 | Hologres V2.1.12 以降でサポートされています | |||
ゲートウェイからシステムに 1 秒あたりに入るデータの量。 | Hologres V2.1 以降でサポートされています | |||
ゲートウェイから外部システムに 1 秒あたりに送信されるデータの量。 | Hologres V2.1 以降でサポートされています |
CPU
以下のセクションでは、CPU 関連のメトリックについて説明します。
インスタンス CPU 使用率 (%)
このメトリックは、インスタンスの全体的な CPU 使用率を示し、インスタンスのコンピューティング負荷を反映します。
バックグラウンドで実行されているデーモンプロセス、または非同期に実行されている圧縮タスクがインスタンスの CPU を占有する場合があります。したがって、インスタンスでクエリタスクが実行されていない場合、少量の CPU 使用率は正常です。
Hologres はマルチコア並列計算をサポートしています。ほとんどの場合、単一のクエリ中の CPU 使用率はすぐに 100% に増加する可能性があります。これは、コンピューティングリソースが完全に活用されていることを示しています。
CPU 使用率が 100% に近い状態が続く場合、インスタンスの負荷が高くなっています。たとえば、CPU 使用率が 3 時間連続で 100% のまま、または 12 時間連続で 90% 以上の場合です。この場合、CPU リソースがインスタンスのボトルネックになっています。具体的なビジネスシナリオとクエリを分析して、CPU 使用率が高い原因を特定する必要があります。次の側面を考慮することで原因を特定できます。
INSERT 文を実行して大量のオフラインデータがインポートされているかどうか、およびデータ量がまだ増加しているかどうかを確認します。
CPU リソースを使い果たしてしまうような高いクエリ/秒 (QPS) でデータのクエリまたは書き込みが行われているかどうかを確認します。
前述のシナリオまたはその他のシナリオにハイブリッド負荷が存在するかどうかを確認します。
より複雑なクエリまたはより大きなデータ量に対応するために、インスタンスをスケールアウトします。
インスタンスの CPU 使用率に関するよくある質問の詳細については、「メトリックに関するよくある質問」をご参照ください。
ワーカー CPU 使用率 (%)
このメトリックは、インスタンス内の各ワーカーノードの CPU 使用率を示し、各ワーカーノードのコンピューティング負荷を反映します。 Hologres インスタンスに割り当てられるワーカーノードの数は、インスタンスの仕様によって異なります。インスタンスの仕様の詳細については、「インスタンス管理」をご参照ください。
このメトリックは、Hologres V1.1 以降でのみ表示されます。
すべてのワーカーノードの CPU 使用率が長期間にわたって 100% に近い状態が続く場合、インスタンスの負荷が高くなっています。この場合、特定のビジネスシナリオに基づいて、リソース使用量を最適化するか、インスタンスをスケールアウトする必要があります。
一部のワーカーノードの CPU 使用率が高く、他のワーカーノードの CPU 使用率が低い場合、リソースはワーカーノードに不均等に割り当てられています。リソースの不均等な割り当ての一般的な原因とそのトラブルシューティング方法の詳細については、「メトリックに関するよくある質問」をご参照ください。
warehouse_cpu_usage_by_cluster (%)
仮想ウェアハウス内の各クラスターの CPU 使用量を示します。
メモリ
以下のセクションでは、メモリ関連のメトリックについて説明します。
インスタンスメモリ使用率 (%)
このメトリックは、インスタンスの全体的なメモリ使用率を示します。
Hologres では、メモリリソースはバックエンドプロセスによって予約されています。クエリが進行中でなくても、データテーブルのメタデータ、インデックス、およびデータキャッシュはアーカイブと計算を容易にするためにメモリにロードされます。したがって、メモリ使用量はゼロではありません。クエリが進行中でない場合、30% から 40% のメモリ使用率は正常です。
ただし、メモリ使用量が継続的に増加し、長期間にわたって 80% に近い状態が続く場合、メモリリソースがインスタンスのボトルネックになる可能性があります。これは、インスタンスの安定性またはパフォーマンスに悪影響を与える可能性があります。
メモリ使用量の詳細 (%) メトリックとビジネスの QPS に基づいて、大量のメモリリソースを占有しているコンポーネントまたはプロセスを特定できます。この情報は、最適化できる場所を知るのに役立ちます。詳細については、「OOM に関するよくある質問」をご参照ください。
ワーカーメモリ使用率 (%)
このメトリックは、インスタンス内の各ワーカーノードのメモリ使用率を示し、各ワーカーノードのコンピューティング負荷を反映します。 Hologres インスタンスに割り当てられるワーカーノードの数は、インスタンスの仕様によって異なります。インスタンスの仕様の詳細については、「インスタンス管理」をご参照ください。
このメトリックは、Hologres V1.1 以降でのみ表示されます。
すべてのワーカーノードのメモリ使用率が長期間にわたって 80% に近い状態が続く場合、インスタンスの負荷が高くなっています。この場合、ビジネス要件に基づいて、リソース使用量を最適化するか、インスタンスをスケールアウトする必要があります。
一部のワーカーノードのメモリ使用率が高く、他のワーカーノードのメモリ使用率が低い場合、リソースはワーカーノードに不均等に割り当てられています。リソースの不均等な割り当ての一般的な原因とそのトラブルシューティング方法の詳細については、「メトリックに関するよくある質問」をご参照ください。
メモリ使用量の詳細 (%)
このメトリックは、インスタンス内のシステム、メタデータ、キャッシュ、クエリ、およびバックグラウンドの、各コンポーネントとプロセスのメモリ使用量データを提供します。このメトリックは Hologres V2.0.15 以降でのみ表示されます。このメトリックはインスタンスのメモリ分散を提供し、それに基づいてパフォーマンスの最適化を実行できます。
システム: 実行時にシステムコンポーネントによって占有されているメモリリソースを示します。システムコンポーネントには、HoloHub、ゲートウェイ、および FE ノードが含まれます。 FE ノードには、FE マスターノードと FE クエリノードが含まれます。システムコンポーネントによって占有されているメモリリソースは、クエリの実行時に変動します。
キャッシュ: 次のキャッシュデータによって占有されているメモリリソースを示します。
キャッシュされた SQL 関連データ: キャッシュされた結果とキャッシュされたブロックが含まれます。キャッシュされた SQL 関連データによって占有されているメモリリソースは、クエリの実行ステータスに基づいて変動します。 SQL クエリがキャッシュにヒットすると、クエリのパフォーマンスが向上します。たとえば、EXPLAIN ANALYZE ステートメントを実行して、Physical read bytes フィールドの値を取得できます。このフィールドの値が小さい場合、SQL クエリは大量のキャッシュリソースにヒットします。キャッシュされた SQL 関連データの量は制限されています。
キャッシュされたメタデータ: テーブルスキーマのキャッシュされたメタデータとファイルのキャッシュされたメタデータが含まれます。 Hologres のストレージエンジンは、SQL クエリを実行する前にメタデータをキャッシュにロードします。これにより、ディスクへの直接アクセスが回避され、クエリのパフォーマンスが向上します。
キャッシュデータによって占有されているメモリリソースは固定されています。ほとんどの場合、インスタンスの合計メモリの約 30% がキャッシュデータによって占有されています。インスタンスでクエリが実行されない場合、キャッシュされたメタデータがメモリを占有します。
メタデータ: メタデータとファイルによって占有されているメモリを示します。メタデータの保存には Lazy Open モードが使用されます。このモードでは、頻繁にアクセスされるメタデータはメモリに保存され、アクセスされないメタデータはメモリに保存されません。これにより、メタデータによって占有されるメモリを削減できます。ほとんどの場合、インスタンスの合計メモリの 30% 未満をメタデータが占有することをお勧めします。インスタンス内のメタデータが大量のメモリリソースを占有している場合、インスタンス内の多数のファイルまたはパーティションテーブルにアクセスしています。この場合、テーブル統計に基づいてインスタンスでテーブルガバナンスを実行できます。詳細については、「テーブル統計のクエリと分析」をご参照ください。
クエリ: SQL 文の実行時に消費されるメモリリソースを示します。消費されるメモリリソースの量は、クエリの複雑さと同時実行性と正の相関があります。固定プラン、HQE、または SQE を使用して SQL 文が実行されると、メモリリソースが消費されます。
SQL クエリに使用できるメモリは弾力性があります。ワーカーノードには最低 20 GB のメモリが必要です。ワーカーノードに使用可能な最大メモリは、インスタンスの使用可能な合計メモリによって異なります。他のコンポーネントとプロセスによって大量のメモリが使用されている場合、計算に使用できるメモリは少量です。
インスタンスに対するクエリが大量のメモリを占有している場合、またはインスタンスでメモリ不足 (OOM) の問題が発生している場合は、クエリが複雑であるか、同時実行性が高いことを示しています。メモリ使用量が高くならないように、クエリのパフォーマンスを最適化するか、インスタンスをスケールアウトすることをお勧めします。詳細については、「クエリのパフォーマンスを最適化する」をご参照ください。
バックグラウンド: 圧縮タスクやフラッシュタスクなどのバックグラウンドタスクによって占有されているメモリリソースを示します。ほとんどの場合、バックグラウンドタスクはインスタンスの合計メモリの 5% 未満を占有します。テーブルインデックスが変更された場合、または大量のデータが書き込まれたり更新されたりした場合、タスクが完了するまで、バックグラウンドタスクはより多くのメモリリソースを占有します。
メモリテーブル: メモリテーブルによって占有されているメモリリソースを示します。 Hologres では、メモリテーブルはリアルタイムで書き込まれたり、更新されたり、削除されたりするテーブルデータを保存するために使用されます。ほとんどの場合、メモリテーブルはインスタンスの合計メモリの 5% 未満を占有します。
QE メモリ使用量 (バイト)
このメトリックは、XQE ベースのクエリで使用されるメモリリソースの量を示します。 XQE ベースのクエリとは、HQE や SQE など、Alibaba Cloud が開発したエンジンを使用するクエリのことです。
このメトリックは Hologres V2.0.44 以降、および V2.1.22 以降でのみ表示されます。
クエリで使用されるメモリリソースの量には、このメトリックの値が含まれます。
このメトリックは、インスタンスで実行されているクエリの複雑さを反映します。このメトリックの値が大きい場合、インスタンスで実行されているクエリは複雑であり、大量のメモリリソースが使用されています。
QE メモリ使用率 (%)
このメトリックはインスタンスの負荷を反映します。このメトリックの値が高い場合、メモリ不足が原因で OOM の問題が発生する可能性があります。この場合、クエリガバナンスを実行するか、インスタンスをスケールアウトする必要があります。
このメトリックは Hologres V2.0.44 以降、および V2.1.22 以降でのみ表示されます。
warehouse_memory_usage_by_cluster(%)
このメトリックは、仮想ウェアハウス内の各クラスターのメモリ使用量を追跡します。
クエリ QPS と RPS
クエリ QPS (countS)
このメトリックは、インスタンスで SQL 文を使用して 1 秒あたりに実行されるクエリの総数を示します。 SQL 文には、SELECT、INSERT、UPDATE、DELETE、UTILITY、および UNKNOWN タイプの文が含まれます。
クエリ QPS ≥ QE QPS + FixedQE QPS
QE QPS (countS)
このメトリックは、インスタンスで SQL 文を使用して 1 秒あたりに実行される QE ベースのクエリの数を示します。 SQL 文には、SELECT、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
FixedQE QPS (countS)
このメトリックは、インスタンスで SQL 文を使用して 1 秒あたりに実行される FixedQE ベースのクエリの数を示します。 Hologres V2.2 より前のバージョンでは、FixedQE は SDK という名前でした。 SQL 文には、SELECT、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
DML RPS (countS)
このメトリックは、インスタンスで DML 文を使用して実行されるクエリで 1 秒あたりにインポートまたは更新されるデータレコードの総数を示します。 DML 文には、INSERT、UPDATE、および DELETE タイプの文が含まれます。
DML RPS = QE DML RPS + Fixed QE DML RPS
QE DML RPS (countS)
このメトリックは、インスタンスで DML 文を使用して実行される QE ベースのクエリで 1 秒あたりにインポートまたは更新されるデータレコードの数を示します。 DML 文には、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
QE は通常、次のシナリオでデータのインポートまたは更新に使用されます。
MaxCompute または OSS テーブルのデータのバッチインポートまたは更新
バッチコピーモードでのデータの書き込みまたは更新
Hologres テーブル間のバッチインポート
Fixed QE DML RPS (countS)
このメトリックは、インスタンスで DML 文を使用して実行される FixedQE ベースのクエリで 1 秒あたりにインポートまたは更新されるデータレコードの数を示します。 DML 文には、INSERT、UPDATE、および DELETE タイプの文が含まれます。 Hologres V2.2 より前のバージョンでは、FixedQE は SDK という名前でした。
このメトリックは Hologres V2.2 以降でのみ表示されます。
FixedQE は通常、次のシナリオで使用されます。
Data Integration の DataX を使用したバッチデータ書き込み
PostgreSQL クライアントまたは JDBC クライアントで
INSERT INTO VALUES ()文を実行することによるデータ書き込み
クエリレイテンシ
クエリレイテンシ (ミリ秒)
このメトリックは、インスタンスで SQL 文を使用して実行されるすべてのクエリの平均レイテンシを示します。 SQL 文には、SELECT、INSERT、UPDATE、DELETE、UTILITY、および UNKNOWN タイプの文が含まれます。
クエリレイテンシ ≥ MAX (QE レイテンシ、FixedQE レイテンシ)
QE レイテンシ (ミリ秒)
このメトリックは、インスタンスで SQL 文を使用して実行される QE ベースのクエリの平均レイテンシを示します。 SQL 文には、SELECT、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
QE レイテンシ (ミリ秒) メトリックは、最適化コストレイテンシ (ミリ秒)、クエリ開始コストレイテンシ (ミリ秒)、次取得コストレイテンシ (ミリ秒)、および QE QPS (countS) メトリックと組み合わせて使用できます。
FixedQE レイテンシ (ミリ秒)
このメトリックは、インスタンスで SQL 文を使用して実行される FixedQE ベースのクエリの平均レイテンシを示します。 SQL 文には、SELECT、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
このメトリックの値が高い場合は、次の原因が考えられます。
一時的に高い: HQE ベースのクエリが存在し、ロックを取得している可能性があります。 FixedQE ロックレイテンシメトリックの値も増加している場合、HQE ベースのクエリがロックを取得しています。この場合、「クエリインサイト」の手順に従って、ロックを取得しているクエリを特定します。
常に高い: テーブルの構成が不適切であるか、他の複雑なクエリが存在する可能性があります。「Blink と Flink の問題に関するよくある質問」の手順に従って、障害のトラブルシューティングを行います。
最適化コストレイテンシ (ミリ秒)
このメトリックは、インスタンス内のクエリの最適化フェーズでの期間を示します。最適化フェーズでは、クエリ オプテマイザー (QO) が SQL 文を解析し、実行エンジンがデータを処理するのに役立つ物理プランを生成します。
このメトリックは Hologres V2.0.44 以降、および V2.1.22 以降でのみ表示されます。
このメトリックの値が高い場合、インスタンス内のクエリは複雑であり、クエリの解析に時間がかかります。インスタンス内のクエリが入力パラメーターのみが異なる場合、プリペアドステートメントを使用して最適化フェーズを短縮することをお勧めします。詳細については、「JDBC」をご参照ください。
クエリ開始コストレイテンシ (ミリ秒)
このメトリックは、インスタンス内のクエリのクエリ開始フェーズでの期間を示します。このフェーズでは、ロックの取得やスキーマバージョンの調整など、クエリ前の初期化が実行されます。
このメトリックは Hologres V2.0.44 以降、および V2.1.22 以降でのみ表示されます。
このメトリックの値が高い場合、SQL 文がロックの解放を待機している時間、または CPU 負荷が高いためにリソースを待機している時間が長くなっています。実行計画に基づいてトラブルシューティングを行うことができます。
次取得コストレイテンシ (ミリ秒)
このメトリックは、クエリ開始フェーズの終了からすべての結果が返されるまでの期間を示します。このフェーズでは、システムはデータを処理し、結果を返します。
このメトリックは Hologres V2.0.44 以降、および V2.1.22 以降でのみ表示されます。
このメトリックの値が高い場合、クエリは複雑です。 QE メモリ使用率 (%) と QE QPS (countS) メトリックの値を確認できます。メトリックの値が正常な場合、このメトリックの値が高いのは、クライアントがデータの返却を待機している時間が長いためである可能性があります。
クエリレイテンシ P99 (ミリ秒)
このメトリックは、インスタンス内のすべてのクエリの 99 パーセンタイルレイテンシを示します。クエリには、システムクエリと、SELECT、INSERT、UPDATE、および UTILITY タイプの文を使用して実行されるクエリが含まれます。
最長アクティブクエリ時間 (ミリ秒)
このメトリックは、現在の時点でインスタンスで最も長く実行されている進行中のクエリの、実行時間を示します。クエリ文には、SELECT、INSERT、UPDATE、DELETE、UTILITY、および UNKNOWN タイプの文が含まれます。
このメトリックは Hologres V1.1 以降でのみ表示されます。
インスタンスに構成されているワーカーノードの数は、インスタンスタイプによって異なります。クエリはワーカーノードにランダムに分散されます。 Hologres は各ワーカーノードで進行中のクエリの期間を収集し、現在の時点で最も長く進行中のクエリの期間を表示します。たとえば、現在の時点で 3 つのクエリが異なるワーカーノードで実行されており、これらのクエリの期間が 10 分、5 分、30 秒の場合、このメトリックは 10 分を表示します。
アクティブなクエリまたはスロークエリのログに基づいて、クエリの期間が正常かどうかを確認できます。詳細については、「クエリを管理する」および「スロークエリログのクエリと分析」をご参照ください。スロークエリをトラブルシューティングし、デッドロックまたはスタックの問題をできるだけ早く解決します。
Hologres コンソールのメトリックデータは 1 分ごとに更新されます。したがって、このメトリックの X 軸上のクエリの開始時刻は、正確なクエリの開始時刻ではない場合があります。このメトリックは、例外のトラブルシューティングの参考としてのみ使用することを目的としています。これにより、インスタンス内のスロークエリを簡単に見つけることができます。セルフ O&M の補助メトリックとして、このメトリックは進行中のクエリの正確な期間を提供しません。
失敗したクエリ QPS
失敗したクエリ QPS (countS)
このメトリックは、インスタンスで SQL 文を使用して 1 秒あたりに失敗したクエリの平均数を示します。 SQL 文には、SELECT、INSERT、UPDATE、DELETE、UTILITY、および UNKNOWN タイプの文が含まれます。
失敗したクエリ QPS ≥ 失敗した QE QPS + 失敗した FixedQE QPS
スロークエリログで失敗したクエリを表示し、障害のトラブルシューティングを行って、Hologres インスタンスの可用性を向上させることができます。詳細については、「スロークエリログのクエリと分析」をご参照ください。
失敗した QE QPS (countS)
このメトリックは、インスタンスで SQL 文を使用して 1 秒あたりに失敗した QE ベースのクエリの平均数を示します。 SQL 文には、SELECT、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
失敗した FixedQE QPS (countS)
このメトリックは、インスタンスで SQL 文を使用して 1 秒あたりに失敗した FixedQE ベースのクエリの平均数を示します。 SQL 文には、SELECT、INSERT、UPDATE、および DELETE タイプの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
ロック
FE 待機ロックレイテンシ (ミリ秒)
Hologres は分散システムです。 Hologres インスタンスには、アクセスレイヤーで SQL 文を解析、分散、およびルーティングする複数の FE ノードがあります。同じテーブルに対する DDL 操作のために複数の接続リクエストが FE ノードにルーティングされると、FE ノードはロックされます。これらの DDL 操作には、CREATE 操作と DROP 操作が含まれます。このメトリックは、DDL 文が FE ロックの解放を待機する最長時間を示します。
このメトリックは Hologres V2.2 以降でのみ表示されます。
ほとんどの場合、DDL 文は実行時にロックを取得し、他の文はそのロックが解放されるのを待機する必要があります。このメトリックの値が 5 分を超え、FE 再生実行時間 (ミリ秒) メトリックの値が大きい場合、特定の DDL 文の実行がスタックしている可能性があります。「クエリを管理する」の手順に従って、時間のかかるクエリを特定して終了できます。
FixedQE ロックレイテンシ (ミリ秒)
HQE を使用する INSERT、DELETE、および UPDATE タイプの SQL 文はテーブルロックを取得し、FixedQE を使用する INSERT、DELETE、および UPDATE タイプの SQL 文は行ロックを取得します。その結果、FixedQE ベースの SQL 文は HQE ベースの SQL 文によって取得されたロックが解放されるのを待機する必要があり、このメトリックの値が増加します。
このメトリックは Hologres V2.2 以降でのみ表示されます。
このメトリックの値が大きい場合は、スロークエリログに基づいて時間のかかる FixedQE ベースのクエリを特定し、「クエリインサイト」機能を使用して、ロックを取得している HQE ベースの SQL 文を確認します。
BE ロックレイテンシ (ミリ秒)
このメトリックは、INSERT、DELETE、および UPDATE タイプの SQL 文がロックの取得に費やす合計時間を示します。 SQL 文には、FixedQE ベースの文と HQE ベースの文が含まれます。
このメトリックは Hologres V2.2 以降でのみ表示されます。
このメトリックの値が大きい場合は、スロークエリログに基づいて時間のかかる INSERT、DELETE、および UPDATE タイプの SQL 文を特定し、「クエリインサイト」機能を使用して、ロックを取得している HQE ベースの文を確認します。
接続
接続数 (カウント)
Hologres インスタンスでサポートされるデフォルトの最大接続数は、インスタンスの仕様によって異なります。インスタンスの仕様の詳細については、「インスタンス管理」をご参照ください。このメトリックは、インスタンスで使用されている接続の総数を示します。接続は、アクティブ状態、アイドル状態、またはトランザクション内アイドル状態のいずれかになります。トランザクション内アイドル状態とは、接続が失敗したトランザクション内でアイドル状態であることを示します。「クエリを管理する」の手順に従って、接続の使用状況を表示できます。接続が不足している場合は、できるだけ早くアイドル状態の接続を閉じます。
DB 別の接続数 (カウント)
このメトリックは、インスタンス内の各データベースで使用されている接続数を示します。このメトリックを使用する場合は、次の点に注意してください。
デフォルトでは、データベースは最大 128 の接続をサポートします。詳細については、「インスタンス管理」をご参照ください。
インスタンス内の各データベースで使用されている接続数が長期間にわたって最大数に近い状態が続く場合、インスタンスには多数の接続が存在します。ビジネスシナリオに基づいて、接続がアイドル状態かアクティブ状態かを確認できます。詳細については、「接続を管理する」をご参照ください。次に、ビジネスシナリオに基づいて、できるだけ早くアイドル状態の接続を解放するか、インスタンスをスケールアウトします。
特定のワーカーノードで使用されている接続数が多く、他のワーカーノードで使用されている接続数が少ない場合、インスタンスの接続は不均等に分散されています。不均等な接続負荷を軽減するために、できるだけ早くアイドル状態の接続を見つけて解放できます。詳細については、「接続を管理する」をご参照ください。
FE 別の接続数 (カウント)
このメトリックは、インスタンス内の各 FE ノードで使用されている接続数を示します。このメトリックを使用する場合は、次の点に注意してください。
デフォルトでは、FE ノードは最大 128 の接続をサポートします。詳細については、「インスタンス管理」をご参照ください。
インスタンス内の各 FE ノードで使用されている接続数が長期間にわたって最大数に近い状態が続く場合、インスタンスには多数の接続が存在します。ビジネスシナリオに基づいて、接続がアイドル状態かアクティブ状態かを確認できます。詳細については、「接続を管理する」をご参照ください。次に、ビジネスシナリオに基づいて、できるだけ早くアイドル状態の接続を解放するか、インスタンスをスケールアウトします。
特定のワーカーノードで使用されている接続数が多く、他のワーカーノードで使用されている接続数が少ない場合、インスタンスの接続は不均等に分散されています。不均等な接続負荷を軽減するために、できるだけ早くアイドル状態の接続を見つけて解放できます。詳細については、「接続を管理する」をご参照ください。
最大接続使用率 (%)
このメトリックは、FE ノード間の最大の接続使用率を示します。Hologres は、各 FE ノードの接続使用率を収集し、Max(frontend_connection_used_rate) 関数を使用して最大の接続使用率を表示します。これにより、接続数が FE ノードでサポートされている最大数を超えているかどうかを確認して、接続の失敗を防ぐことができます。複数の FE ノード間ではラウンドロビンポリシーが採用されており、これらの FE ノードへの物理接続が順番に確立されます。クエリの管理の手順に従って、接続使用率を表示できます。接続が不十分な場合は、できるだけ早くアイドル状態の接続を閉じてください。
クエリキュー
Standard_query_queue_size (カウント)
このメトリックは、インスタンスで実行待ちのクエリ数を示します。
このメトリックは、Hologres V3.0 以降でのみ表示されます。
Standard_query_queue_enqueue_qps (カウント/秒)
このメトリックは、インスタンスでシステム処理キューに 1 秒あたりに送信されるクエリ数を示します。システム負荷とクエリ頻度を測定するために使用できます。
このメトリックは、Hologres V3.0 以降でのみ表示されます。
Standard_query_queue_dequeue_qps (countS)
このメトリックは、1 秒あたりに待機状態から実行状態に変わるクエリ数を示します。
このメトリックは、Hologres V3.0 以降でのみ表示されます。
Standard_query_queue_acquire_result_qps (countS)
このメトリックは、クエリキューの各実行状態で 1 秒あたりに処理されるクエリ数を示します。次の状態が含まれます。
kReadyToRun: クエリは実行準備ができています。
kQueueTimeout: クエリがタイムアウトし、実行できないため、エラーが発生します。
kCanceled: クエリはキャンセルされました。
kExceedConcurrencyLimit: クエリが同時実行性制限を超えているため、実行できないため、エラーが発生します。
このメトリックは、Hologres V3.0 以降でのみ表示されます。
Standard_queue_time_latency (ミリ秒)
このメトリックは、クエリが処理される前にキューで費やす平均時間を示します。クエリの処理時間は含まれません。時間はミリ秒単位で測定されます。
このメトリックは、Hologres V3.0 以降でのみ表示されます。
warehouse_query_queue_adaptive_concurrency_limiting (count)
クエリ キューの最大同時実行数をクエリします。
このメトリックは、Hologres V3.1 以降でサポートされています。
I/O
I/O スループットは、インスタンスから読み取られる、またはインスタンスに書き込まれるデータ量を示し、読み取り操作または書き込み操作が実行される頻度を反映します。 I/O スループットに基づいてインスタンスのワークロードを取得し、関連する問題をできるだけ早くトラブルシューティングできます。
1 GiB = 1,024 MiB = 1,024 × 1,024 KiB
標準ストレージ (ホットストレージ): I/O スループットの上限は固定されておらず、主に CPU 負荷の影響を受けます。
低頻度アクセスストレージ(コールドストレージ):I/O スループットの上限は
80 MB/s × (コア数/16)です。
標準 I/O 読み取りスループット(バイト/秒)
このメトリックは、クエリで標準ストレージ階層から 1 秒あたりに読み取られるデータ量を示します。
標準 I/O 書き込みスループット (バイト/秒)
このメトリックは、クエリで標準ストレージ階層に 1 秒あたりに書き込まれるデータ量を示します。
低頻度 I/O 読み取りスループット (バイト/秒)
このメトリックは、クエリで IA ストレージ階層から 1 秒あたりに読み取られるデータ量を示します。
低頻度 I/O 書き込みスループット (バイト/秒)
このメトリックは、クエリで IA ストレージ階層に 1 秒あたりに書き込まれるデータ量を示します。
ストレージ
ストレージとは、インスタンス内のすべてのデータベースのデータを保存するために使用される論理ディスクのサイズを示します。 1 GiB = 1,024 MiB = 1,024 × 1,024 KiB です。 Hologres インスタンスのストレージ使用量は、制限なく継続的に増加できます。
サブスクリプションインスタンスのストレージクォータが使い果たされた後、超過したストレージは従量課金制で課金されます。ストレージ使用量の超過は、Hologres インスタンスの安定性や使用に悪影響を与えません。
ストレージクォータが使い果たされた後、できるだけ早くストレージ構成を更新するか、不要なデータをクリーンアップすることをお勧めします。これにより、不要でより高額なストレージコストを防ぐことができます。ストレージ費用の節約分をコンピューティングリソースの支払いに使用できます。
pg_relation_size 関数を使用して、テーブルとデータベースのストレージ使用量と詳細をクエリできます。また、hologres.hg_table_info テーブルに基づいて、インスタンス内のテーブルをきめ細かく管理することもできます。詳細については、「テーブル統計のクエリと分析」をご参照ください。
標準ストレージ使用量 (バイト)
このメトリックは、データの保存に使用される標準ストレージリソースの量を示します。購入したストレージクォータが使い果たされた場合は、ストレージ容量を拡張できます。
標準ストレージ使用率 (%)
このメトリックは、使用されている標準ストレージリソースの割合を示します。購入したストレージクォータが使い果たされた場合は、ストレージ容量を拡張できます。
低頻度ストレージ使用量 (バイト)
このメトリックは、データの保存に使用される IA ストレージリソースの量を示します。購入したストレージクォータが使い果たされた場合は、ストレージ容量を拡張できます。
低頻度ストレージ使用率 (%)
このメトリックは、使用されている IA ストレージリソースの割合を示します。購入したストレージクォータが使い果たされた場合は、ストレージ容量を拡張できます。
ゴミ箱のストレージ使用量 (バイト)
Hologres は V3.1 以降、テーブルのゴミ箱をサポートしています。DROP TABLE コマンドを使用して削除されたテーブルはゴミ箱に移動され、一定期間保持されます。この機能により、誤って削除されたテーブルを回復できます。テーブルのゴミ箱内のテーブルは依然としてストレージリソースを消費することに注意してください。このメトリックを使用して各データベースのゴミ箱のストレージ使用量を監視し、選択したテーブルのゴミ箱を無効にしてコストを削減します。
フレームワーク
FE 再生実行時間 (ミリ秒)
Hologres は分散システムです。 Hologres インスタンスには、アクセスレイヤーで SQL 文を解析、分散、およびルーティングする複数の FE ノードがあります。 Hologres では、DDL 文は 1 つの FE ノードで実行され、他の FE ノードで再生されます。このメトリックを使用する場合は、次の点に注意してください。
このメトリックの値がミリ秒または秒単位の場合は正常です。
このメトリックの値が分単位の場合、多数の DDL 文が存在する可能性があります。このメトリックの値が継続的に増加する場合、クエリがスタックしている可能性があります。 hg_stat_activity ビューに基づいて、時間のかかるクエリを特定してキャンセルできます。詳細については、「クエリを管理する」をご参照ください。
このメトリックは Hologres V2.2 以降でのみサポートされています。
レプリカ同期ラグ (ミリ秒)
このメトリックは、シャードレベルレプリケーション機能が有効になった後の、リーダーシャードとフォロワーシャード間のデータ同期のレイテンシを示します。
ほとんどの場合、このメトリックの値はミリ秒単位です。
大量のデータが書き込まれたり更新されたりする場合、または DDL 文が頻繁に実行される場合、このメトリックの値が増加する可能性があります。
インスタンス同期ラグ (ミリ秒)
このメトリックは、プライマリインスタンスからセカンダリインスタンスへのデータ同期のレイテンシを示します。レイテンシはミリ秒単位で表示されます。このメトリックを使用する場合は、次の点に注意してください。
デフォルトでは、このメトリックはプライマリインスタンスには表示されず、セカンダリインスタンスの場合にのみ表示されます。
このメトリックは、セカンダリインスタンスがプライマリインスタンスに関連付けられた後、最初は 0 ミリ秒として表示されます。プライマリインスタンスにデータが書き込まれると、このメトリックの値は変動します。
ほとんどの場合、プライマリインスタンスとセカンダリインスタンス間の同期レイテンシはミリ秒単位です。レイテンシジッターが時折発生するのは、通常、プライマリインスタンスで実行される DDL 操作などのメタデータ変更操作が原因です。これらのレイテンシジッターは無視できます。レイテンシが長期間にわたって 1 秒を超える場合、これはリソース使用率が高いことを示している可能性があります。 CPU 使用率やメモリ使用量などのリソース使用量を確認し、必要に応じてインスタンスをスケールアウトしてレイテンシを削減できます。
インスタンスが再起動または更新中の場合、同期レイテンシが数分に増加する可能性がありますが、再起動または更新が完了すると自動的に回復します。
ファイル同期ラグ (ミリ秒)
このメトリックは、geo ディザスタリカバリインスタンス間のファイル同期のレイテンシを示します。このメトリックは、読み取り専用のセカンダリインスタンスの場合にのみ表示されます。
自動分析
DB 別の統計情報欠落テーブル数 (countS)
このメトリックは、データベースで統計情報が収集されていないテーブルの数を示します。
このメトリックは Hologres V2.2 以降でのみ表示されます。
Hologres V2.0 以降では、自動分析機能がデフォルトで有効になっています。テーブルが新しく作成された場合、または大量のデータが書き込まれたり更新されたりした場合、自動分析機能はテーブルの統計情報をリアルタイムで更新しない場合があります。この場合、しばらくしてからテーブル統計を確認できます。
データベース内の特定のテーブルの統計情報が数時間または数日間収集されない場合、自動分析機能をトリガーするためのしきい値に達していない可能性があります。この場合、HG_STATS_MISSING ビューをクエリしてテーブルを特定し、ANALYZE 文を手動で実行します。
データベース内の特定のテーブルの統計情報が数時間または数日間収集されない場合、自動分析機能をトリガーするためのしきい値に達していない可能性があります。この場合、テーブル統計情報を確認し、ANALYZE 文を手動で実行します。詳細については、「ANALYZE と自動分析」をご参照ください。
サーバーレスコンピューティング
サーバーレスコンピューティング最長アクティブクエリ時間 (ミリ秒)
Hologres はサーバーレスコンピューティング機能をサポートしています。サーバーレスコンピューティングリソースプールでクエリを実行できます。これにより、インスタンスリソースが分離され、クエリの迅速な実行が保証されます。
このメトリックは Hologres V2.1 以降でのみ表示されます。
このメトリックは、サーバーレスコンピューティングリソースを使用する、最も長く実行されているクエリの、実行時間を示します。このメトリックを hg_stat_activity テーブルと組み合わせて使用すると、サーバーレスコンピューティングリソースプール内のクエリの実行ステータスを取得できます。
サーバーレスコンピューティングキューサイズ(カウント)
このメトリックは、インスタンスのサーバーレスコンピューティングリソースプールでキューイングされているクエリ数を示します。
このメトリックは Hologres V2.2 以降でのみ表示されます。
サーバーレスコンピューティングクォータ使用率 (%)
このメトリックは、インスタンスで使用されているサーバーレスコンピューティングリソースの量と、特定の期間内に申請可能なリソースの最大量の比率を示します。
このメトリックは Hologres V2.2 以降でのみ表示されます。
バイナリログ
1 秒あたりに消費されるバイナリログ内のデータレコード数またはバイト数
Hologres では、Hologres バイナリログをサブスクライブすることができます。バイナリログを使用して、リアルタイムでデータレイヤリングを実行し、データ転送を高速化できます。
バイナリログ RPS 取得 (countS)
このメトリックは、1 秒あたりに消費されるバイナリログ内のデータレコードの数を示します。このメトリックは Hologres V2.2 以降でのみ表示されます。
バイナリログ BPS 取得 (バイト/秒)
このメトリックは、1 秒あたりに消費されるバイナリログ内のバイト数を示します。大きなフィールドが存在する場合、またはデータ量が増加すると、このメトリックの値が増加します。このメトリックは Hologres V2.2 以降でのみ表示されます。
使用されている walsender の数と walsender の使用率
JDBC を使用して Hologres バイナリログを消費する場合、walsender はテーブルの各シャードに接続するために使用されます。これは通常の接続に似ています。 walsender を介した接続は、通常の接続とは独立しています。インスタンス内の walsender の数には、デフォルトの上限が構成されています。
FE 別のバイナリログ WAL 送信者数 (カウント)
このメトリックは、各 FE ノードで使用されている walsender の数を示します。
バイナリログ WAL 送信者使用率 (%)
このメトリックは、FE ノードの最大 walsender 使用率を示します。
上記の 2 つのメトリックを使用して、インスタンスの walsender 使用率を取得できます。 walsender の数の上限に達した場合は、「JDBC を使用して Hologres バイナリログを消費する」の手順に従ってトラブルシューティングを行います。
コンピューティングリソース
warehouse_timed_elastic_cores(Count)
仮想ウェアハウスインスタンスは、スケジュールされたスケーリングをサポートしています。このメトリックは、スケジュールされたスケーリングによって提供されるエラスティックリソースからの vCPU の数を示します。詳細については、「スケジュールされたスケーリング (ベータ)」をご参照ください。
warehouse_auto_elastic_cores(Count)
仮想ウェアハウスインスタンスは Auto Scaling をサポートしています。このメトリックは、自動スケーリングによって提供されるエラスティックリソースからの vCPU の数を追跡します。詳細については、「マルチクラスターと Auto Scaling (ベータ)」をご参照ください。
ゲートウェイ
ゲートウェイ CPU 使用率 (%)
このメトリックは、インスタンス内の各ゲートウェイの CPU 使用率を示します。
このメトリックは Hologres V2.0 以降でのみ表示されます。
ゲートウェイはラウンドロビン方式でトラフィックを転送します。したがって、接続リクエストが開始されていない場合でも、CPU リソースが消費されます。
Hologres V2.2.22 以降では、ゲートウェイはデフォルトで増加した数のワーカースレッドを起動して、新しい接続を処理する機能を強化できます。また、それに応じて CPU 使用率も増加します。
ゲートウェイメモリの使用率(%)
このメトリックは、インスタンス内の各ゲートウェイのメモリ使用率を示します。
このメトリックは Hologres V2.0 以降でのみ表示されます。
1 秒あたりのゲートウェイの新規接続数(countS)
このメトリックは、システムが 1 秒で受信し正常に確立できる接続の最大数を示します。
このメトリックは Hologres V2.1.12 以降でのみ表示されます。
ゲートウェイは 1 秒あたりに最大 100 の接続を転送できます。
長期間にわたり、新規接続リクエストの数が次の数式
100 × ゲートウェイの数で算出される値に近い場合、ゲートウェイリソースがシステムの新規接続リクエスト処理のボトルネックになります。この場合、アプリケーションに適切な接続プールメカニズムを設定するか、ゲートウェイの数を増やす必要があります。
ゲートウェイ入力トラフィック BPS(B/秒)
このメトリックは、ゲートウェイからシステムに 1 秒あたりに入るデータ量を示します。
このメトリックは Hologres V2.1 以降でのみ表示されます。
ゲートウェイのインバウンドトラフィックレートが、次の数式を使用して計算された値に長時間近いままの場合:
200 MiB/s × Number of gateways、ゲートウェイのネットワーク処理能力がシステムのボトルネックになります。この場合、ゲートウェイの数を増やす必要があります。
ゲートウェイ出力トラフィック BPS (B/秒)
このメトリックは、ゲートウェイから外部システムに 1 秒あたりに送信されるデータ量を示します。
このメトリックは Hologres V2.1 以降でのみ表示されます。
ゲートウェイのアウトバウンドトラフィックレートが、次の数式を使用して計算された値に長時間近いままの場合:
200 MiB/s × Number of gateways、ゲートウェイのネットワーク処理能力がシステムのボトルネックになります。この場合、ゲートウェイの数を増やす必要があります。
メトリックに関するよくある質問
メトリックに関するよくある質問 トピックでは、Hologres で使用されるメトリックに関するよくある質問への回答を提供し、問題の診断とトラブルシューティングに役立てています。これにより、O&M 機能が向上します。
メトリックアラート
CloudMonitor を使用して、メトリックに基づいてアラートを構成できます。これにより、例外をできるだけ早く検出してトラブルシューティングし、例外がビジネスに及ぼす悪影響を最小限に抑えることができます。詳細については、「CloudMonitor」をご参照ください。