Alibaba Cloud の Prometheus モニタリングを使用して、クラスター内のすべての内部および外部ストレージリソースをモニターできます。内部ストレージリソースには、RootFS とエフェメラルストレージが含まれます。外部ストレージリソースには、ディスク、NAS、および OSS 永続ボリューム (PV) が含まれます。コンテナーのストレージモニタリングは、多次元の基本的なストレージメトリックも無料で提供します。
クラスター内部ストレージリソースのモニタリング
クラスター内部ストレージリソースには、RootFS とエフェメラルストレージが含まれます。
RootFS: コンテナーランタイムの環境です。コンテナーランタイムに必要なすべてのデータと構成が含まれます。使用量、使用率、スペースの分布など、RootFS の使用状況をモニターできます。
エフェメラルストレージ: コンテナーランタイムの一時データを格納します。主にコンテナーランタイムによって生成された一時ファイルとキャッシュを格納します。使用量、使用率、スペースの分布など、エフェメラルストレージの使用状況をモニターできます。
RootFS メトリック
クラスターが Kubernetes 1.22 以降を実行している場合は、Container Storage Interface (CSI) プラグインを v1.28.3-eb95171-aliyun 以降にアップグレードする必要があります。コンポーネントの変更履歴については、「csi-plugin」をご参照ください。アップグレードするには、「CSI コンポーネントをアップグレードする」をご参照ください。
メトリック | タイプ | 説明 |
container_fs_limit_bytes | Gauge | RootFS の合計スペース。単位: バイト。 |
container_fs_usage_bytes | Gauge | 使用済み RootFS スペース。単位: バイト。 |
container_fs_available_bytes | Gauge | 利用可能な RootFS スペース。単位: バイト。 |
container_fs_inodes_total | Gauge | RootFS 内の inode の総数。 |
container_fs_inodes_used | Gauge | RootFS 内の使用済み inode の数。 |
container_fs_inodes_free | Gauge | RootFS 内の利用可能な inode の数。 |
container_fs_reads_bytes_total | Gauge | RootFS から読み取られた合計バイト数。 |
container_fs_writes_bytes_total | Gauge | RootFS に書き込まれた合計バイト数。 |
エフェメラルストレージメトリック
次のメトリックは csi-plugin コンポーネントに依存します。CSI コンポーネントは v1.28.3-eb95171-aliyun 以降である必要があります。コンポーネントの変更履歴については、「csi-plugin」をご参照ください。コンポーネントをアップグレードするには、「CSI コンポーネントをアップグレードする」をご参照ください。
メトリック | タイプ | 説明 |
ephemeral_storage_pod_limit_bytes | Gauge | Pod のエフェメラルストレージの合計スペース。単位: バイト。 |
ephemeral_storage_pod_usage_bytes | Gauge | Pod の使用済みエフェメラルストレージスペース。単位: バイト。 |
ephemeral_storage_pod_available_bytes | Gauge | Pod の利用可能なエフェメラルストレージスペース。単位: バイト。 |
ephemeral_storage_pod_inodes_total | Gauge | Pod のエフェメラルストレージ内の inode の総数。 |
ephemeral_storage_pod_inodes_used | Gauge | Pod のエフェメラルストレージ内の使用済み inode の数。 |
ephemeral_storage_pod_inodes_free | Gauge | Pod のエフェメラルストレージ内の利用可能な inode の数。 |
クラスター外部ストレージリソースのモニタリング
ディスク永続ボリュームメトリック
次のメトリックは csi-plugin コンポーネントに依存します。CSI コンポーネントは v1.18.8.46-afb19e46-aliyun 以降である必要があります。コンポーネントの変更履歴については、「csi-plugin」をご参照ください。コンポーネントをアップグレードするには、「CSI コンポーネントをアップグレードする」をご参照ください。
メトリック | タイプ | 説明 |
node_volume_capacity_bytes_total | Counter | 合計ディスク領域。単位: バイト。 |
node_volume_capacity_bytes_used | Counter | 使用済みディスク領域。単位: バイト。 |
node_volume_capacity_bytes_available | Counter | 利用可能なディスク領域。単位: バイト。 |
node_volume_inodes_total | Counter | ディスク上の inode の総数。 |
node_volume_inodes_used | Counter | ディスク上の使用済み inode の数。 |
node_volume_inodes_available | Counter | ディスク上の利用可能な inode の数。 |
node_volume_read_bytes_total | Counter | 正常に読み取られた合計バイト数。 |
node_volume_read_completed_total | Counter | 成功した読み取り操作の総数。 |
node_volume_read_merged_total | Counter | カーネルによってマージされた読み取り操作の数。 |
node_volume_read_time_milliseconds_total | Counter | 読み取り操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_write_bytes_total | Counter | 正常に書き込まれた合計バイト数。 |
node_volume_write_completed_total | Counter | 成功した書き込み操作の総数。 |
node_volume_write_merged_total | Counter | カーネルによってマージされた書き込み操作の数。 |
node_volume_write_time_milliseconds_total | Counter | 書き込み操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_io_now | Gauge | 進行中の I/O 操作の数。 |
node_volume_io_time_seconds_total | Counter | I/O 操作に費やされた合計時間。単位: 秒。 |
NAS 永続ボリュームメトリック
次のメトリックは csi-plugin コンポーネントに依存します。CSI コンポーネントは v1.18.8.46-afb19e46-aliyun 以降である必要があります。コンポーネントの変更履歴については、「csi-plugin」をご参照ください。コンポーネントをアップグレードするには、「CSI コンポーネントをアップグレードする」をご参照ください。
メトリック | タイプ | 説明 |
node_volume_capacity_bytes_total | Counter | NAS PV の合計スペース。単位: バイト。 |
node_volume_capacity_bytes_used | Counter | NAS PV の使用済みスペース。単位: バイト。 |
node_volume_capacity_bytes_available | Counter | NAS PV の利用可能なスペース。単位: バイト。 |
node_volume_read_bytes_total | Counter | 正常に読み取られた合計バイト数。 |
node_volume_read_sent_bytes_total | Counter | 読み取り操作中にネットワークリクエストで送信された合計バイト数。 |
node_volume_read_completed_total | Counter | 成功した読み取り操作の総数。 |
node_volume_read_transmissions_total | Counter | 読み取り操作のネットワークリクエストの総数。 |
node_volume_read_timeouts_total | Counter | 読み取り操作のタイムアウトの総数。 |
node_volume_read_time_milliseconds_total | Counter | 読み取り操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_read_queue_time_milliseconds_total | Counter | ネットワーク伝送前の読み取り操作の合計キュー時間。単位: ミリ秒。 |
node_volume_read_rtt_time_milliseconds_total | Counter | 読み取り操作中にサーバーの応答を待機した合計時間。単位: ミリ秒。 |
node_volume_write_bytes_total | Counter | 正常に書き込まれた合計バイト数。 |
node_volume_write_recv_bytes_total | Counter | 書き込み操作中にネットワークリクエストから受信した合計バイト数。 |
node_volume_write_completed_total | Counter | 成功した書き込み操作の総数。 |
node_volume_write_transmissions_total | Counter | 書き込み操作のネットワークリクエストの総数。 |
node_volume_write_timeouts_total | Counter | 書き込み操作のタイムアウトの総数。 |
node_volume_write_time_milliseconds_total | Counter | 書き込み操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_write_queue_time_milliseconds_total | Counter | ネットワーク伝送前の書き込み操作の合計キュー時間。単位: ミリ秒。 |
node_volume_write_rtt_time_milliseconds_total | Counter | 書き込み操作中にサーバーの応答を待機した合計時間。単位: ミリ秒。 |
OSS 永続ボリュームメトリック
次のメトリックは csi-plugin コンポーネントに依存します。CSI コンポーネントは v1.22.14-820d8870-aliyun 以降である必要があります。コンポーネントの変更履歴については、「csi-plugin」をご参照ください。コンポーネントをアップグレードするには、「CSI コンポーネントをアップグレードする」をご参照ください。
メトリック | タイプ | 説明 |
node_volume_inode_bytes_total_counter | Counter | OSS PV 内の |
node_volume_inode_bytes_used_counter | Counter | OSS PV 内の使用済み |
node_volume_inode_bytes_available_counter | Counter | OSS PV 内の利用可能な |
node_volume_read_bytes_total_counter | Counter | 正常に読み取られた合計バイト数。 |
node_volume_read_completed_total_counter | Counter | 成功した読み取り操作の総数。 |
node_volume_read_time_milliseconds_total_counter | Counter | 読み取り操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_write_bytes_total_counter | Counter | 正常に書き込まれた合計バイト数。 |
node_volume_write_completed_total_counter | Counter | 成功した書き込み操作の総数。 |
node_volume_write_time_milliseconds_total_counter | Counter | 書き込み操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_posix_mkdir_total_counter | Counter | POSIX |
node_volume_posix_rmdir_total_counter | Counter | POSIX |
node_volume_posix_opendir_total_counter | Counter | POSIX |
node_volume_posix_readdir_total_counter | Counter | POSIX |
node_volume_posix_read_total_counter | Counter | POSIX |
node_volume_posix_write_total_counter | Counter | POSIX |
node_volume_posix_flush_total_counter | Counter | POSIX |
node_volume_posix_fsync_total_counter | Counter | POSIX |
node_volume_posix_release_total_counter | Counter | POSIX |
node_volume_posix_create_total_counter | Counter | POSIX |
node_volume_posix_open_total_counter | Counter | POSIX |
node_volume_posix_access_total_counter | Counter | POSIX |
node_volume_posix_rename_total_counter | Counter | POSIX |
node_volume_posix_chown_total_counter | Counter | POSIX |
node_volume_posix_chmod_total_counter | Counter | POSIX |
node_volume_posix_truncate_total_counter | Counter | POSIX |
node_volume_oss_put_object_total_counter | Counter | OSS |
node_volume_oss_get_object_total_counter | Counter | OSS |
node_volume_oss_head_object_total_counter | Counter | OSS |
node_volume_oss_delete_object_total_counter | Counter | OSS |
node_volume_oss_post_object_total_counter | Counter | OSS |
node_volume_hot_spot_read_file_top | Gauge |
|
node_volume_hot_spot_write_file_top | Gauge |
|
node_volume_hot_spot_head_file_top | Gauge |
|
node_volume_backend_read_bytes_total_counter | Counter | OSS バックエンドから正常に読み取られた合計バイト数。 |
node_volume_backend_write_bytes_total_counter | Counter | OSS バックエンドに正常に書き込まれた合計バイト数。 |
node_volume_backend_read_completed_total_counter | Counter | OSS バックエンドでの成功した読み取り操作の総数。 |
node_volume_backend_write_completed_total_counter | Counter | OSS バックエンドでの成功した書き込み操作の総数。 |
node_volume_backend_read_time_milliseconds_total_counter | Counter | OSS バックエンドでの読み取り操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_backend_write_time_milliseconds_total_counter | Counter | OSS バックエンドでの書き込み操作に費やされた合計時間。単位: ミリ秒。 |
node_volume_backend_posix_getattr_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_getmode_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_access_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_lookup_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_mknod_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_remove_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_setattr_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_link_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_readlink_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_statfs_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_rename_total_counter | Counter | OSS バックエンドでの POSIX |
node_volume_backend_posix_readdir_total_counter | Counter | OSS バックエンドでの POSIX |
FUSE マウントポイントメトリック
次のメトリックは段階的リリースであり、csi-plugin コンポーネントに依存します。コンポーネントは v1.32.2 以降である必要があります。コンポーネントの変更履歴については、「csi-plugin」をご参照ください。コンポーネントをアップグレードするには、「CSI コンポーネントをアップグレードする」をご参照ください。
メトリック | タイプ | 説明 |
node_volume_mount_retry_count | Counter | マウントのタイムアウトまたは実行エラーが原因で、CSI が Filesystem in Userspace (FUSE) マウントポイントを作成するときにトリガーされるリトライの数。 値が継続的に増加する場合は、通常、マウントの問題を示しており、関連するアプリケーション Pod が |
node_volume_mount_point_failover_count | Counter | クライアントプロセスのクラッシュなどのイベントによって切断された後、FUSE マウントポイントが正常にフェールオーバーを実行し、正常な状態に回復した合計回数。 このメトリックは一部のクライアントタイプでのみサポートされています。サポートされていないクライアントの場合、この値は常に |
node_volume_mount_point_status | Gauge | マウントポイントのリアルタイムのヘルスステータス。
|
node_volume_last_fuse_client_exit_reason | Gauge | FUSE クライアントプロセスが最後に予期せず終了したときのタイムスタンプと理由。たとえば、 |