CPFS for Lingjun ファイルシステムの容量とパフォーマンス情報を表示して、ストレージ使用量、読み取り/書き込みスループット、読み取り/書き込み IOPS を把握できます。重要なメトリックにアラートルールを設定することで、例外に関する通知を迅速に受け取り、迅速に処理できます。このトピックでは、CPFS for Lingjun がサポートするメトリックと、それらのアラートルールの構成方法について説明します。
背景情報
CloudMonitor は、Alibaba Cloud リソースとインターネットアプリケーションをモニターするサービスです。CloudMonitor を使用して、さまざまなクラウドリソースのメトリックをモニターし、特定のメトリックにアラートを設定できます。これにより、Alibaba Cloud 上のリソース使用量とアプリケーションステータスの全体像を把握し、エラーを迅速に処理して、サービスがスムーズに実行されるようにすることができます。詳細については、「CloudMonitor とは」をご参照ください。
モニタリングデータの保持ポリシー
モニタリングデータは 90 日間保持されます。保持期間が過ぎると、モニタリングデータは自動的にクリアされます。保持期間は、データが生成された時点から開始されます。
モニタリングメトリック
CPFS for Lingjun は、CloudMonitor を通じて、ファイルシステムの容量、インスタンスのパフォーマンス、クライアントのパフォーマンスを包括的にモニタリングすることをサポートします。モニタリングメトリックには、新バージョン (推奨) と旧バージョンの 2 つのセットがあります。新しいメトリックは、命名の不整合や不明確な構造など、旧バージョンの問題に対処し、使いやすさと保守性を向上させます。
新規のお客様: 新しいメトリックを直接使用できます。
既存のお客様: 業務継続性を確保するために、古いメトリックを引き続き使用できます。ただし、新しいバージョンに徐々に移行することをお勧めします。
既存のお客様が新しいメトリックに切り替える場合は、まずテスト環境でテストする必要があります。
新バージョンメトリック (推奨)
新しいモニタリングメトリックは現在、次のリージョンで利用可能です: 中国 (北京)。
容量モニタリング
タイプ | メトリック | メトリック名 | 単位 | 説明 |
ファイルシステム - 標準 | BmStdCapacity | インテリジェントコンピューティングエディション (標準仕様) のファイルシステムストレージ容量合計 | バイト (B) | ファイルシステムの合計ストレージ容量。 |
BmStdCapacityUsed | 標準 CPFS for Lingjun ファイルシステムのデータ使用量 | バイト (B) | ファイルシステムで現在使用されているデータ量。 | |
BmStdInodeLimit | 標準 AI コンピューティングエディションファイルシステムの最大ファイル数 | 単位 | ファイルシステムが保持できるファイルとディレクトリの最大合計数。 | |
BmStdInodeAlloc | 標準 CPFS for Lingjun ファイルシステムで割り当てられたファイル数 | 単位 | ファイルシステムで現在割り当てられている (作成されている) ファイルとディレクトリの合計数。 | |
BmStdInodeUsed | 標準 CPFS for Lingjun ファイルシステムで使用されているファイル数 | 項目 | ファイルシステムで現在使用されているファイルとディレクトリの合計数。 | |
ファイルシステム - Large Large 仕様のファイルシステムは、特定のユーザーのみが利用できます。Large 仕様のファイルシステムのユーザーでない場合は、関連するメトリックを無視してください。 | BmLargeCapacity | インテリジェントコンピューティングエディションの Large 仕様ファイルシステムの合計ストレージ容量 | バイト (B) | ファイルシステムの合計ストレージ容量。 |
BmLargeCapacityUsed | 大規模 AI コンピューティング用ファイルシステムのデータ量 | バイト (B) | ファイルシステムで現在使用されているデータ量。 | |
BmLargeInodeLimit | Large CPFS for Lingjun ファイルシステムの最大ファイル数 | 単位 | ファイルシステムが保持できるファイルとディレクトリの最大合計数。 | |
BmLargeInodeAlloc | Large CPFS for Lingjun ファイルシステムで割り当てられたファイル数 | 項目 | ファイルシステムで現在割り当てられている (作成されている) ファイルとディレクトリの合計数。 | |
BmLargeInodeUsed | 大規模 AI コンピューティングエディションファイルシステムのファイル数 | 単位 | ファイルシステムで現在使用されているファイルとディレクトリの合計数。 | |
Fileset - 標準 | BmStdFsetCapacityLimit | 標準 CPFS for Lingjun fileset の容量クォータ | バイト (B) | 単一の fileset に設定された最大容量クォータ。 |
BmStdFsetCapacityUsed | AI コンピューティングエディションの標準仕様 fileset の現在の容量 | バイト (B) | 単一の fileset で現在使用されている容量。 | |
BmStdFsetInodeLimit | インテリジェントコンピューティングエディションの標準仕様: fileset あたりのファイル数のクォータ | 単位 | 単一の fileset に設定されたファイルとディレクトリの数の最大クォータ。 | |
BmStdFsetInodeAlloc | 標準 CPFS for Lingjun fileset で事前割り当てされたファイル数 | 単位 | 単一の fileset に対して現在事前割り当てされているファイルとディレクトリの合計数。 | |
BmStdFsetInodeUsed | インテリジェントコンピューティングエディションの標準 fileset のファイル数 | 単位 | 単一の fileset で現在使用されているファイルとディレクトリの数。 | |
Fileset - Large Large 仕様のファイルシステムは、特定のユーザーのみが利用できます。Large 仕様のファイルシステムのユーザーでない場合は、関連するメトリックを無視してください。 | BmLargeFsetCapacityLimit | インテリジェントコンピューティングエディションの Large Fileset の容量クォータ | バイト (B) | 単一の fileset に設定された最大利用可能容量。 |
BmLargeFsetCapacityUsed | インテリジェントコンピューティングエディションの Large 仕様 fileset の現在の容量 | バイト (B) | 単一の fileset で現在使用されているデータ量。 | |
BmLargeFsetInodeLimit | Large CPFS for Lingjun fileset のファイル数クォータ | 単位 | 単一の fileset に保持できるファイルとディレクトリの最大合計数。 | |
BmLargeFsetInodeAlloc | Large CPFS for Lingjun fileset で事前割り当てされたファイル数 | 単位 | 単一の fileset に対して現在割り当てられている (作成されている) ファイルとディレクトリの合計数。 | |
BmLargeFsetInodeUsed | AI コンピューティングエディションの Large 仕様 fileset の現在のファイル数 | 単位 | 単一の fileset で現在使用されているファイルとディレクトリの合計数。 |
パフォーマンスモニタリング
タイプ | メトリック | メトリック名 | 単位 | 説明 |
ファイルシステム - 標準 | BmStdReadThroughput | 標準 CPFS for Lingjun ファイルシステムの読み取りスループット | Bytes/s | 統計期間中のファイルシステムの平均読み取りスループット (バイト/秒)。 |
BmStdWriteThroughput | インテリジェントコンピューティングエディションの標準仕様のファイルシステムの書き込みスループット | Bytes/s | 統計期間中のファイルシステムの平均書き込みスループット (バイト/秒)。 | |
BmStdReadIops | インテリジェントコンピューティングエディションの標準ティアのファイルシステム読み取り IOPS | Count/s (IOPS) | 統計期間中のファイルシステムの 1 秒あたりの平均読み取り IOPS 数。 | |
BmStdWriteIops | インテリジェントコンピューティングエディション (標準仕様) のファイルシステム書き込み IOPS | Count/s (IOPS) | 統計期間中のファイルシステムの 1 秒あたりの平均書き込み IOPS 数。 | |
BmStdReadLatency | インテリジェントコンピューティングエディション標準仕様のファイルシステムの読み取りレイテンシ | ms | 統計期間中のファイルシステムの平均読み取りレイテンシ。 | |
BmStdWriteLatency | 標準ティアのインテリジェントコンピューティングエディションファイルシステムの書き込みレイテンシ | ms | 統計期間中のファイルシステムの平均書き込みレイテンシ。 | |
BmStdMetaQps | 標準 CPFS for Lingjun ファイルシステムのメタデータ QPS | Count/s (IOPS) | 統計期間中のファイルシステムの 1 秒あたりの平均メタデータリクエスト数。 | |
BmStdMetaLatency | 標準 CPFS for Lingjun ファイルシステムのメタデータレイテンシ | ms | 統計期間中のファイルシステムのメタデータ操作の平均レイテンシ。 | |
ファイルシステム - Large Large 仕様のファイルシステムは、特定のユーザーのみが利用できます。Large 仕様のファイルシステムのユーザーでない場合は、関連するメトリックを無視してください。 | BmLargeReadThroughput | Large CPFS for Lingjun ファイルシステムの読み取りスループット | Bytes/s | 統計期間中のファイルシステムの平均読み取りスループット (バイト/秒)。 |
BmLargeWriteThroughput | 高仕様ファイルシステムの書き込みスループット (インテリジェントコンピューティングエディション) | Bytes/s | 統計期間中のファイルシステムの平均書き込みスループット (バイト/秒)。 | |
BmLargeReadIops | Large CPFS for Lingjun ファイルシステムの読み取り IOPS | Count/s (IOPS) | 統計期間中のファイルシステムの 1 秒あたりの平均読み取り IOPS 数。 | |
BmLargeWriteIops | Large CPFS for Lingjun ファイルシステムの書き込み IOPS | Count/s (IOPS) | 統計期間中のファイルシステムの 1 秒あたりの平均書き込み IOPS 数。 | |
BmLargeReadLatency | 大規模ファイルシステムの読み取りレイテンシ (AI コンピューティングエディション) | ms | 統計期間中のファイルシステムの平均読み取りレイテンシ。 | |
BmLargeWriteLatency | 大規模 AI コンピューティングエディションファイルシステムの書き込みレイテンシ | ms | 統計期間中のファイルシステムの平均書き込みレイテンシ。 | |
BmLargeMetaQps | Large CPFS for Lingjun ファイルシステムのメタデータ操作 QPS | Count/s (IOPS) | 統計期間中のファイルシステムの 1 秒あたりの平均メタデータリクエスト数。 | |
BmLargeMetaLatency | Large CPFS for Lingjun ファイルシステムのメタデータ操作レイテンシ | マイクロ秒 (μs) | 統計期間中のファイルシステムのメタデータ操作の平均レイテンシ。 | |
クライアント | ClientReadThroughput | インテリジェントコンピューティングエディションのクライアント読み取りスループット | Bytes/s | 統計期間中のクライアントの 1 秒あたりの平均読み取りスループット (バイト)。 |
ClientWriteThroughput | AI コンピューティングエディションのクライアント書き込みスループット | Bytes/s | 統計期間中のクライアントの 1 秒あたりの平均書き込みスループット (バイト)。 | |
ClientReadIops | インテリジェントコンピューティングエディションのクライアント読み取り IOPS | Count/s (IOPS) | 統計期間中のクライアントの 1 秒あたりの平均読み取り IOPS 数。 | |
ClientWriteIops | インテリジェントコンピューティングエディションのクライアント書き込み IOPS | Count/s (IOPS) | 統計期間中のクライアントの 1 秒あたりの平均書き込み IOPS 数。 | |
ClientReadLatency | インテリジェントコンピューティングエディションの平均クライアント読み取りレイテンシ | マイクロ秒 (μs) | 統計期間中のクライアントの平均読み取りレイテンシ。 | |
ClientWriteLatency | インテリジェントコンピューティングエディションの平均クライアント書き込みレイテンシ | us | 統計期間中のクライアントの平均書き込みレイテンシ。 | |
ClientMetaLatency | インテリジェントコンピューティングエディション: クライアントメタデータレイテンシ | ms | クライアントが単一のメタデータ操作を完了するための平均レイテンシ。 | |
ClientMetaQps | インテリジェントコンピューティングエディション: クライアントメタデータ QPS | Count/s (IOPS) | 統計期間中のクライアントの 1 秒あたりの平均メタデータリクエスト数。 | |
接続数 | VpcClientCount | インテリジェントコンピューティングエディション VPC あたりのクライアント数 | 単位 | VPC を介してファイルシステムに接続されているクライアントの総数。 |
RdmaClientCount | インテリジェントコンピューティングエディションの RDMA クライアント数 | 単位 | RDMA を介してファイルシステムに接続されているクライアントの総数。 |
Elastic File Client は、CPFS チームによって計算ノードにインストールされるクライアントです。計算ノードを CPFS for Lingjun ファイルシステムに接続します。
クライアントのパフォーマンスは、CloudMonitor コンソールで表示するか、CloudMonitor API 操作を呼び出すことによってのみ表示できます。詳細については、「CPFS パフォーマンスモニタリングの表示」または「CPFS パフォーマンスモニタリングの表示」をご参照ください。
ECS または PAI Lingjun AI Computing Service (シングルテナント) リソースで CPFS for Lingjun ファイルシステムを使用する場合、ホスト名はノードのホスト名です。
PAI 一般計算リソースまたは Lingjun リソースで CPFS for Lingjun ファイルシステムを使用する場合、ホスト名はタスクの Pod ID です。
新しいモニタリングメトリックの詳細については、「CloudMonitor メトリッククエリ」をご参照ください。
旧バージョンメトリック
容量モニタリング
タイプ | メトリック | メトリック名 | 単位 | 説明 |
ファイルシステム | CPFSCapacity | 合計ストレージ容量 | バイト | 統計期間中のファイルシステムの合計ストレージ容量。 |
CPFSCapacityUsed | データ量 | バイト | 統計期間中にファイルシステムが実際に使用したデータ量。 | |
CPFSInode Limit | 最大ファイル数 | 単位 | 統計期間中にファイルシステムが使用できる最大ファイル数。 | |
CPFSInode Alloc | 割り当てられたファイル数 | 単位 | 統計期間中にファイルシステムによって割り当てられたファイル数。 | |
CPFSInode Used | 使用済みファイル数 | 単位 | 統計期間中にファイルシステムが使用したファイル数。 | |
Fileset | BMCPFSFsetCapacityLimit | Fileset 割り当て容量 | バイト | fileset がデータの書き込みに使用できる最大ストレージ容量。クォータに達すると、それ以上データを書き込むことはできません。 |
BMCPFSFsetCapacityUsed | Fileset 使用容量 | バイト | fileset が実際に使用しているストレージ容量。 | |
BMCPFSFsetInodeLimit | fileset によって割り当てられたファイル数 | 項目 | fileset がデータの書き込みに使用できるファイルとディレクトリの最大数。クォータに達すると、それ以上データを書き込むことはできません。 | |
BMCPFSFsetInodeUsed | fileset が使用するファイル数 | 単位 | fileset が実際に使用しているファイル数。 |
パフォーマンスモニタリング
タイプ | メトリック | メトリック名 | 単位 | 説明 |
ファイルシステム | ThruputRead | 読み取りスループット | Bytes/s | 統計期間中のファイルシステムの平均読み取りスループット (バイト/秒)。 |
ThruputWrite | 書き込みスループット | Bytes/s | 統計期間中のファイルシステムの平均書き込みスループット (バイト/秒)。 | |
IopsRead | 読み取り IOPS | Count/s | 統計期間中のファイルシステムの 1 秒あたりの平均読み取り IOPS 数。 | |
IopsWrite | 書き込み IOPS | Count/s | 統計期間中のファイルシステムの 1 秒あたりの平均書き込み IOPS 数。 | |
データフロー | ThroughputImport | インポートスループット | Bytes/s | 統計期間中のデータフローインポートタスクの 1 秒あたりの平均スループット (バイト)。 |
ThroughputExport | エクスポートスループット | Bytes/s | 統計期間中のデータフローエクスポートタスクの 1 秒あたりの平均スループット (バイト)。 | |
QPSImportMeta | インポートメタデータ QPS | Count/s | 統計期間中のデータフローインポートタスクの 1 秒あたりの平均メタデータリクエスト数。 | |
QPSExportMeta | エクスポートメタデータ QPS | Count/s | 統計期間中のデータフローエクスポートタスクの 1 秒あたりの平均メタデータリクエスト数。 | |
IOPSImport | インポート IOPS | Count/s | 統計期間中のデータフローインポートタスクの 1 秒あたりの平均 IOPS 数。 | |
IOPSEXport | エクスポート IOPS | Count/s | 統計期間中のデータフローエクスポートタスクの 1 秒あたりの平均 IOPS 数。 | |
LatencyImport | インポートレイテンシ | us | 統計期間中のデータフローインポートタスクの平均レイテンシ。 | |
LatencyExport | エクスポートレイテンシ | us | 統計期間中のデータフローエクスポートタスクの平均レイテンシ。 | |
クライアント | ClientReadIops | クライアント読み取り IOPS | Count/s | 統計期間中のクライアントの 1 秒あたりの平均読み取り IOPS 数。 |
ClientWriteIops | クライアント書き込み IOPS | Count/s | 統計期間中のクライアントの 1 秒あたりの平均書き込み IOPS 数。 | |
ClientReadLatency | クライアントの平均読み取りレイテンシ | us | 統計期間中のクライアントの平均読み取りレイテンシ。 | |
ClientWriteLatency | クライアントの平均書き込みレイテンシ | us | 統計期間中のクライアントの平均書き込みレイテンシ。 | |
ClientReadThroughput | クライアント読み取りスループット | Bytes/s | 統計期間中のクライアントの 1 秒あたりの平均読み取りスループット (バイト)。 | |
ClientWriteThroughput | クライアント書き込みスループット | Bytes/s | 統計期間中のクライアントの 1 秒あたりの平均書き込みスループット (バイト)。 |
Elastic File Client は、CPFS チームによって計算ノードにインストールされるクライアントです。計算ノードを CPFS for Lingjun ファイルシステムに接続します。
クライアントのパフォーマンスは、CloudMonitor コンソールで表示するか、CloudMonitor API 操作を呼び出すことによってのみ表示できます。詳細については、「CPFS パフォーマンスモニタリングの表示」または「CPFS パフォーマンスモニタリングの表示」をご参照ください。
ECS または PAI Lingjun AI Computing Service (シングルテナント) リソースで CPFS for Lingjun ファイルシステムを使用する場合、ホスト名はノードのホスト名です。
PAI 一般計算リソースまたは Lingjun リソースで CPFS for Lingjun ファイルシステムを使用する場合、ホスト名はタスクの Pod ID です。
古いモニタリングメトリックの詳細については、「CloudMonitor メトリッククエリ」をご参照ください。
アラートルールの説明
CloudMonitor コンソールでは、さまざまなメトリックに対してアラートルールを設定できます。リソースのメトリックが指定されたアラート条件を満たすと、CloudMonitor は自動的にアラート通知を送信します。次の表に、アラートレベル、通知メカニズム、およびアラート条件を示します。
アラートレベル | 通知メカニズム | アラート条件 |
緊急 | 電話、ショートメッセージ、メール、DingTalk ロボット | メトリックの平均値が、N 回連続した統計期間で指定された判断条件を満たしています。アラートレベルに基づいて N の値を設定します。 説明 アラート条件は、選択したメトリックタイプによって異なります。インターフェイスに表示される条件が優先されます。 |
警告 | ショートメッセージ、メール、DingTalk ロボット | |
情報 | メール、DingTalk ロボット |