EMR Serverless StarRocks は、EMR Serverless StarRocks インスタンスのステータスと主要なパフォーマンスメトリックをリアルタイムで表示できるモニタリングおよびアラート機能を提供します。これにより、問題を効率的に特定できます。
制限
過去 30 日間のモニタリングデータのみが利用可能です。
注意事項
Query メトリックなど、一部のメトリックは root アカウントに関連しています。root アカウントは、StarRocks インスタンスの管理に使用される専用のアカウントです。ユーザーは root アカウントを表示したり使用したりすることはできません。
手順
EMR Serverless StarRocks インスタンスリストページに移動します。
E-MapReduce コンソールにログインします。
左側のナビゲーションウィンドウで、 を選択します。
トップメニューバーで、必要なリージョンを選択します。
インスタンスの ID をクリックします。
[モニタリングとアラート] タブをクリックします。
[モニタリングとアラート] タブで、[リソースグループ] と [時間を選択] パラメーターを設定して、特定のメトリックを表示します。
[リソースグループ] パラメーターの有効な値:
default_wg: クエリタスクで使用されるデフォルトのリソースグループです。
default_mv_wg: マテリアライズドビューで使用されるデフォルトのリソースグループです。
メトリック
インスタンス
概要
メトリック
説明
FE の可用性
フロントエンドノード (FE) の可用性。
BE/CN の可用性
バックエンドノード (BE) または計算ノード (CN) の可用性。
FE 数
FE の数。
BE または CN 数
BE または CN の数。
ディスク使用率 (平均)
StarRocks インスタンス内のすべての BE の平均ディスク使用率。
ストレージ
StarRocks で使用される実際のストレージ領域。このメトリックは、計算とストレージの分離シナリオでのみ使用できます。メトリックの値は約 1 時間の遅延で更新されます。
Compaction Score (最大)
各 FE の最高の Compaction Score。このパラメーターは、StarRocks の shared-nothing インスタンスでのみ使用できます。
FE 検出
FE の検出ステータス。EMR Serverless StarRocks は、HTTP リクエストを送信して FE のステータスを検出します。値 On は検出結果が正常であることを示し、値 Off は検出が失敗したことを示します。
BE/CN ノードステータス
FE によって報告される BE/CN ノードのステータス。Alive ノードの数が異常な場合は、SHOW COMPUTE NODES コマンドを使用してノードの詳細を表示できます。
クエリ
メトリック
説明
1 分あたりのクエリ数
1 分あたりのクエリタスク数。
1 分あたりのクエリエラー数
1 分あたりのクエリエラー数。
クエリレイテンシー p99
クエリのレイテンシー。
低速クエリ
1 分あたりの低速クエリ数。
FE
メトリック
説明
FE トランザクション解決統計
1 分あたりの各 FE またはすべての FE のトランザクションステータスに関する統計。
FE ディスク使用率
各 FE またはすべての FE で使用されるデータディスク。メトリックの値は 1 時間ごとに更新されます。
FE CPU
メトリック
説明
CPU 使用率
各 FE の CPU 使用率。
FE CPU 負荷 1 分
過去 1 分間の各 FE の平均 CPU 負荷。
FE Mem
メトリック
説明
JVM ヒープ使用量
JVM ヒープにおける使用済みメモリと最大メモリの比率。
JVM Young GC
新世代領域でガベージコレクション (GC) が実行された回数と時間。
JVM ヒープ
JVM ヒープメモリの使用量。
JVM Old GC
Java 仮想マシン (JVM) の旧世代領域でガベージコレクション (GC) が実行された回数と時間。
FE Net
メトリック
説明
ネットワーク受信レート
1 秒あたりに受信されるデータ量。
Net Out
1 秒あたりに送信されるデータ量。
FE 接続数
各 FE へのアクティブな接続数。
リソースグループ
メトリック
説明
クエリ
選択したリソースグループで 1 分あたりに実行されるクエリタスクの数。
クエリレイテンシー p99
クエリのレイテンシー。
クエリ (リソースグループ)
すべてのリソースグループで 1 分あたりに実行されるクエリタスクの数。
マテリアライズドビュー
メトリック
説明
MV ステータス
マテリアライズドビューのステータス。有効な値: 0 および 1。値 0 はマテリアライズドビューがアクティブであることを示し、値 1 はマテリアライズドビューが非アクティブであることを示します。
MV リフレッシュ期間 p99
マテリアライズドビューのリフレッシュに必要な時間。
MV ジョブ (合計)
リフレッシュタスクの総数。
MV ジョブ (成功)
成功したリフレッシュタスクの数。
パージジョブ失敗
失敗したリフレッシュタスクの数。
パージジョブ空
新しいデータが利用できないためにキャンセルされたリフレッシュタスクの数。
MV ジョブ (実行中)
進行中のリフレッシュタスクの数。
パージジョブ保留中
実行を待機しているリフレッシュタスクの数。
MV ヒット数
各マテリアライズドビューで書き換えられたクエリの数。マテリアライズドビューで直接実行されたクエリは除きます。
MV クエリ数
各マテリアライズドビューで書き換えられたクエリの数。マテリアライズドビューで直接実行されたクエリを含みます。
テーブル
メトリック
説明
データベーステーブル
インスタンス内のデータベース間でのテーブルの分布。
テーブル数
インスタンス内のテーブル数。
タブレット数
インスタンス内のタブレット数。
テーブルスキャンバイト
非システムテーブルからスキャンされたデータの総量。単位: バイト。
テーブルロードバイト
非システムテーブルにインポートされたデータの総量。単位: バイト。
その他
メトリック
説明
転送の進捗
テーブル移行の進捗状況。このメトリックは、クラスター移行シナリオにのみ適用されます。
計算グループ
概要
メトリック
説明
CPU 使用率 (平均)
すべての BE または CN の平均 CPU 使用率。
メモリ使用率 (平均)
すべての BE または CN の平均メモリ使用量。
ディスク使用率 (最大)
すべての BE または CN の複数のデータディスクの最大使用率。
BE/CN ノードステータス
BE または CN の検出ステータス。EMR Serverless StarRocks は、HTTP リクエストを送信して BE または CN のステータスを検出します。値 On は検出結果が正常であることを示し、値 Off は検出が失敗したことを示します。
コンパクション
メトリック
説明
最大コンパクションスコア
FE の最高のコンパクションスコア。
メモリ (コンパクション)
コンパクションタスクによって使用されるメモリ。
コンパクションバイト
ベースコンパクションおよび累積コンパクションプロセス中に 1 分あたりに圧縮されるデータ量。
コンパクション行セット
ベースコンパクションおよび累積コンパクションプロセス中に 1 分あたりに圧縮される行セットの数。
BE/CN
メトリック
説明
クエリスキャンバイト
各 BE でのクエリ中にスキャンされたデータ量。
クエリスキャン行
各 BE でのクエリ中にスキャンされた行数。
リクエスト統計
テーブルの作成、バージョンの公開、テーブルのクローンなどの特定ノードでのリクエストの総数。
エンジンリクエスト (失敗)
テーブルの作成、バージョンの公開、テーブルのクローンなど、BE での失敗したリクエストの数。
トランザクションリクエスト
1 分あたりのトランザクションフェーズの統計。
BE/CN CPU
メトリック
説明
CPU 使用率
CPU 使用率。
BE/CN CPU 負荷 1 分
過去 1 分間の特定ノードの平均 CPU 負荷。
BE/CN Mem
メトリック
説明
メモリ使用率
ノードのメモリ使用率には、BE/CN プロセスのメモリ、UDF で使用されるメモリ、BE/CN 用の予約済みメモリなどが含まれます。
プロセスメモリ (BE/CN)
BE/CN プロセスのメモリ使用量。
プロセスメモリ
プロセスのメモリは、カーネルによって収集されたメモリ項目に依存します。完全に収集されず、収集範囲外のメモリ項目は「その他」としてラベル付けされます。メモリに関する詳細については、「Memory_management」をご参照ください。
ノードメモリ
3 つのコンポーネントに分かれています: Pod の利用可能メモリ (Pod Avail Mem)、プロセスメモリ (Process Mem)、非プロセスメモリ (Non Process Mem)。
ノードメモリ (BE/CN)
BE/CN ノードのメモリには、ノードの合計メモリ、81% のノードメモリしきい値、ノードのメモリ使用量、プロセスのメモリ使用量が含まれます。BE/CN の利用可能なメモリの上限は、StarRocks コードの 0.9 係数と mem_limit 構成パラメーター (デフォルト: 0.9) によって共同で制限されます。デフォルトでは、BE/CN で実際に利用可能なメモリは、ノードの合計メモリの 81% です。
BE/CN ディスク
メトリック
説明
ディスク使用率
Data、Trash などを含む、使用済みディスク領域と総容量の比率。
使用済みディスク領域
使用済みディスク領域の絶対容量。
ディスク使用率 (データ)
特定ノードのデータファイルが占有するディスク領域。
ディスク使用率 (データ)
特定ノードのデータファイルのディスク使用率。
BE/CN ディスク IO
メトリック
説明
読み取りトラフィック (SUM)
特定ノード上のすべてのディスクの 1 秒あたりの読み取りトラフィック。
ディスク IO (書き込み)
特定ノード上のすべてのディスクの 1 秒あたりの書き込みトラフィック。
ディスク IOPS (読み取り)
特定ノード上のすべてのディスクでの 1 秒あたりの読み取り操作数。
ディスク IOPS (書き込み)
特定ノード上のすべてのディスクでの 1 秒あたりの書き込み操作数。
ディスク IO レイテンシー (読み取り)
すべてのディスクの平均読み取りレイテンシー。
ディスク IO レイテンシー (書き込み)
すべてのディスクの平均書き込みレイテンシー。
IO 使用率 (最大)
ディスクやネットワークインターフェースなどの I/O デバイスが一定期間にわたってビジー状態であった時間の割合。
BE/CN Net
メトリック
説明
Net (In)
1 秒あたりに受信されるデータ量。
Net (Out)
1 秒あたりに送信されるデータ量。
TCP 接続数
TCP 接続数。
キャッシュ
説明次の表で説明するメトリックは、計算とストレージの分離シナリオでのみ使用できます。
メトリック
説明
FSLIB キャッシュヒット率
1 分あたりのキャッシュヒット率。
FSLIB キャッシュヒット/ミス
1 分あたりのキャッシュヒット数。
ストレージ
説明次の表で説明するメトリックは、StarRocks shared-data インスタンスでのみ使用できます。
メトリック
説明
ストレージ
完全に管理されたデータの量。単位: GiB。
ストレージ IO
完全に管理されたデータの読み取りおよび書き込みトラフィック。
リソースグループ
メトリック
説明
リソースグループ使用 CPU コア
特定のリソースグループによって使用される CPU コアの数。値は、2 つの連続するサンプリング期間内の推定平均値です。このメトリックは、V3.1.4 以降の StarRocks インスタンスで使用できます。
リソースグループ CPU 使用率 (v2.x)
特定のリソースグループによって消費された CPU 時間と合計 CPU 時間の比率。
リソースグループメモリ使用量
特定のリソースグループによって使用されるメモリ。
実行中のタスク
特定のリソースグループで実行されているクエリタスクの数。
リソースグループの同時実行オーバーフロー
特定のリソースグループで同時実行制限に達したクエリの数。
large クエリ制限がトリガーされた回数
特定のリソースグループで large クエリ制限に達した回数。
その他
メトリック
説明
ページキャッシュヒット率
ページキャッシュにヒットしたリクエストの数。
バージョン公開レイテンシー P99
データが StarRocks に書き込まれるときにバージョンを公開するために消費される時間。
ストレージ
データストレージ
メトリック
説明
ストレージ
完全に管理されたデータの量。単位: GiB。このメトリックは、StarRocks shared-data インスタンスでのみ使用できます。メトリックの値は約 1 時間の遅延で更新されます。
ストレージ IO
完全に管理されたデータの読み取りおよび書き込みトラフィック。このメトリックは、StarRocks shared-data インスタンスでのみ使用できます。
ディスク使用率
計算とストレージの分離
メトリック
説明
ディスク使用率
ディスク使用率。
使用済みディスク領域
使用されているディスク領域の量。
インメモリコンピューティング
メトリック
説明
空き領域の割合
特定ノードの利用可能な領域の割合。
ディスク使用率 (Avail)
特定ノードの利用可能なディスク領域。
ディスク使用率 (データ)
特定ノードのデータファイルが占有するディスク領域。
ディスク使用率 (データ)
特定ノードのデータファイルのディスク使用率。
ディスク使用率 (Sum)
ディスク上の利用可能ファイル、キャッシュファイル、データファイルの使用状況。
ディスク使用率 (Sum)
ディスク IO
メトリック
説明
ディスク IO (読み取り)
特定ノード上のすべてのディスクの 1 秒あたりの読み取りトラフィック。
ディスク IO (書き込み)
特定ノード上のすべてのディスクの 1 秒あたりの書き込みトラフィック。
ディスク IOPS (読み取り)
特定ノード上のすべてのディスクでの 1 秒あたりの読み取り操作数。
ディスク IOPS (書き込み)
特定ノード上のすべてのディスクでの 1 秒あたりの書き込み操作数。
ディスク IO レイテンシー (読み取り)
すべてのディスクの平均読み取りレイテンシー。
ディスク IO レイテンシー (書き込み)
すべてのディスクの平均書き込みレイテンシー。
IO 使用率 (最大)
ディスクやネットワークインターフェースなどの I/O デバイスが一定期間にわたってビジー状態であった時間の割合。