Anda dapat menggunakan Prometheus Monitoring untuk Alibaba Cloud guna memantau semua resource storage internal dan eksternal di kluster Anda. Resource storage internal mencakup RootFS dan storage ephemeral, sedangkan resource storage eksternal meliputi volume persisten (PV) berbasis disk, NAS, dan OSS. Pemantauan storage kontainer juga menyediakan metrik dasar multidimensi terkait storage secara gratis.
Pemantauan resource storage internal kluster
Resource storage internal kluster mencakup RootFS dan storage ephemeral.
RootFS: Lingkungan untuk runtime kontainer yang mencakup semua data dan konfigurasi yang diperlukan oleh runtime tersebut. Anda dapat memantau penggunaan RootFS, seperti jumlah ruang yang digunakan, laju penggunaan, dan distribusi ruang.
Storage ephemeral: Menyimpan data sementara untuk runtime kontainer, terutama berupa file sementara dan cache yang dihasilkan selama runtime. Anda dapat memantau penggunaan storage ephemeral, seperti jumlah ruang yang digunakan, laju penggunaan, dan distribusi ruang.
Metrik RootFS
Jika kluster Anda menjalankan Kubernetes 1.22 atau lebih baru, Anda harus melakukan upgrade plug-in Container Storage Interface (CSI) ke versi v1.28.3-eb95171-aliyun atau lebih baru. Untuk catatan perubahan komponen, lihat csi-plugin. Untuk melakukan upgrade, lihat Upgrade the CSI component.
Metric | Type | Description |
container_fs_limit_bytes | Gauge | Total ruang RootFS. Satuan: byte. |
container_fs_usage_bytes | Gauge | Ruang RootFS yang digunakan. Satuan: byte. |
container_fs_available_bytes | Gauge | Ruang RootFS yang tersedia. Satuan: byte. |
container_fs_inodes_total | Gauge | Jumlah total inode di RootFS. |
container_fs_inodes_used | Gauge | Jumlah inode yang digunakan di RootFS. |
container_fs_inodes_free | Gauge | Jumlah inode yang tersedia di RootFS. |
container_fs_reads_bytes_total | Gauge | Total byte yang dibaca dari RootFS. |
container_fs_writes_bytes_total | Gauge | Total byte yang ditulis ke RootFS. |
Metrik storage ephemeral
Metrik berikut bergantung pada komponen csi-plugin. Komponen CSI harus versi v1.28.3-eb95171-aliyun atau lebih baru. Untuk catatan perubahan komponen, lihat csi-plugin. Untuk melakukan upgrade komponen, lihat Upgrade the CSI component.
Metric | Type | Description |
ephemeral_storage_pod_limit_bytes | Gauge | Total ruang storage ephemeral untuk pod. Satuan: byte. |
ephemeral_storage_pod_usage_bytes | Gauge | Ruang storage ephemeral yang digunakan oleh pod. Satuan: byte. |
ephemeral_storage_pod_available_bytes | Gauge | Ruang storage ephemeral yang tersedia untuk pod. Satuan: byte. |
ephemeral_storage_pod_inodes_total | Gauge | Jumlah total inode di storage ephemeral pod. |
ephemeral_storage_pod_inodes_used | Gauge | Jumlah inode yang digunakan di storage ephemeral pod. |
ephemeral_storage_pod_inodes_free | Gauge | Jumlah inode yang tersedia di storage ephemeral pod. |
Pemantauan resource storage eksternal kluster
Metrik volume persisten berbasis disk
Metrik berikut bergantung pada komponen csi-plugin. Komponen CSI harus versi v1.18.8.46-afb19e46-aliyun atau lebih baru. Untuk catatan perubahan komponen, lihat csi-plugin. Untuk melakukan upgrade komponen, lihat Upgrade the CSI component.
Metric | Type | Description |
node_volume_capacity_bytes_total | Counter | Total ruang disk. Satuan: byte. |
node_volume_capacity_bytes_used | Counter | Ruang disk yang digunakan. Satuan: byte. |
node_volume_capacity_bytes_available | Counter | Ruang disk yang tersedia. Satuan: byte. |
node_volume_inodes_total | Counter | Jumlah total inode pada disk. |
node_volume_inodes_used | Counter | Jumlah inode yang digunakan pada disk. |
node_volume_inodes_available | Counter | Jumlah inode yang tersedia pada disk. |
node_volume_read_bytes_total | Counter | Total byte yang berhasil dibaca. |
node_volume_read_completed_total | Counter | Jumlah total operasi baca yang berhasil. |
node_volume_read_merged_total | Counter | Jumlah operasi baca yang digabungkan oleh kernel. |
node_volume_read_time_milliseconds_total | Counter | Total waktu yang dihabiskan untuk operasi baca. Satuan: milidetik. |
node_volume_write_bytes_total | Counter | Total byte yang berhasil ditulis. |
node_volume_write_completed_total | Counter | Jumlah total operasi tulis yang berhasil. |
node_volume_write_merged_total | Counter | Jumlah operasi tulis yang digabungkan oleh kernel. |
node_volume_write_time_milliseconds_total | Counter | Total waktu yang dihabiskan untuk operasi tulis. Satuan: milidetik. |
node_volume_io_now | Gauge | Jumlah operasi I/O yang sedang berlangsung. |
node_volume_io_time_seconds_total | Counter | Total waktu yang dihabiskan untuk operasi I/O. Satuan: detik. |
Metrik volume persisten NAS
Metrik berikut bergantung pada komponen csi-plugin. Komponen CSI harus versi v1.18.8.46-afb19e46-aliyun atau lebih baru. Untuk catatan perubahan komponen, lihat csi-plugin. Untuk melakukan upgrade komponen, lihat Upgrade the CSI component.
Metric | Type | Description |
node_volume_capacity_bytes_total | Counter | Total ruang PV NAS. Satuan: byte. |
node_volume_capacity_bytes_used | Counter | Ruang PV NAS yang digunakan. Satuan: byte. |
node_volume_capacity_bytes_available | Counter | Ruang PV NAS yang tersedia. Satuan: byte. |
node_volume_read_bytes_total | Counter | Total byte yang berhasil dibaca. |
node_volume_read_sent_bytes_total | Counter | Total byte yang dikirim untuk permintaan jaringan selama operasi baca. |
node_volume_read_completed_total | Counter | Jumlah total operasi baca yang berhasil. |
node_volume_read_transmissions_total | Counter | Jumlah total permintaan jaringan untuk operasi baca. |
node_volume_read_timeouts_total | Counter | Jumlah total timeout untuk operasi baca. |
node_volume_read_time_milliseconds_total | Counter | Total waktu yang dihabiskan untuk operasi baca. Satuan: milidetik. |
node_volume_read_queue_time_milliseconds_total | Counter | Total waktu antrean untuk operasi baca sebelum transmisi jaringan. Satuan: milidetik. |
node_volume_read_rtt_time_milliseconds_total | Counter | Total waktu menunggu tanggapan server selama operasi baca. Satuan: milidetik. |
node_volume_write_bytes_total | Counter | Total byte yang berhasil ditulis. |
node_volume_write_recv_bytes_total | Counter | Total byte yang diterima dari permintaan jaringan selama operasi tulis. |
node_volume_write_completed_total | Counter | Jumlah total operasi tulis yang berhasil. |
node_volume_write_transmissions_total | Counter | Jumlah total permintaan jaringan untuk operasi tulis. |
node_volume_write_timeouts_total | Counter | Jumlah total timeout untuk operasi tulis. |
node_volume_write_time_milliseconds_total | Counter | Total waktu yang dihabiskan untuk operasi tulis. Satuan: milidetik. |
node_volume_write_queue_time_milliseconds_total | Counter | Total waktu antrean untuk operasi tulis sebelum transmisi jaringan. Satuan: milidetik. |
node_volume_write_rtt_time_milliseconds_total | Counter | Total waktu menunggu tanggapan server selama operasi tulis. Satuan: milidetik. |
Metrik volume persisten OSS
Metrik berikut bergantung pada komponen csi-plugin. Komponen CSI harus versi v1.22.14-820d8870-aliyun atau lebih baru. Untuk catatan perubahan komponen, lihat csi-plugin. Untuk melakukan upgrade komponen, lihat Upgrade the CSI component.
Metric | Type | Description |
node_volume_inode_bytes_total_counter | Counter | Jumlah total |
node_volume_inode_bytes_used_counter | Counter | Jumlah |
node_volume_inode_bytes_available_counter | Counter | Jumlah |
node_volume_read_bytes_total_counter | Counter | Total byte yang berhasil dibaca. |
node_volume_read_completed_total_counter | Counter | Jumlah total operasi baca yang berhasil. |
node_volume_read_time_milliseconds_total_counter | Counter | Total waktu yang dihabiskan untuk operasi baca. Satuan: milidetik. |
node_volume_write_bytes_total_counter | Counter | Total byte yang berhasil ditulis. |
node_volume_write_completed_total_counter | Counter | Jumlah total operasi tulis yang berhasil. |
node_volume_write_time_milliseconds_total_counter | Counter | Total waktu yang dihabiskan untuk operasi tulis. Satuan: milidetik. |
node_volume_posix_mkdir_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_rmdir_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_opendir_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_readdir_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_read_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_write_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_flush_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_fsync_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_release_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_create_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_open_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_access_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_rename_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_chown_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_chmod_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_posix_truncate_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_oss_put_object_total_counter | Counter | Jumlah total operasi OSS |
node_volume_oss_get_object_total_counter | Counter | Jumlah total operasi OSS |
node_volume_oss_head_object_total_counter | Counter | Jumlah total operasi OSS |
node_volume_oss_delete_object_total_counter | Counter | Jumlah total operasi OSS |
node_volume_oss_post_object_total_counter | Counter | Jumlah total operasi OSS |
node_volume_hot_spot_read_file_top | Gauge | File hot spot untuk operasi |
node_volume_hot_spot_write_file_top | Gauge | File hot spot untuk operasi |
node_volume_hot_spot_head_file_top | Gauge | File hot spot untuk operasi |
node_volume_backend_read_bytes_total_counter | Counter | Total byte yang berhasil dibaca dari backend OSS. |
node_volume_backend_write_bytes_total_counter | Counter | Total byte yang berhasil ditulis ke backend OSS. |
node_volume_backend_read_completed_total_counter | Counter | Jumlah total operasi baca yang berhasil di backend OSS. |
node_volume_backend_write_completed_total_counter | Counter | Jumlah total operasi tulis yang berhasil di backend OSS. |
node_volume_backend_read_time_milliseconds_total_counter | Counter | Total waktu yang dihabiskan untuk operasi baca di backend OSS. Satuan: milidetik. |
node_volume_backend_write_time_milliseconds_total_counter | Counter | Total waktu yang dihabiskan untuk operasi tulis di backend OSS. Satuan: milidetik. |
node_volume_backend_posix_getattr_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_getmode_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_access_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_lookup_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_mknod_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_remove_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_setattr_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_link_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_readlink_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_statfs_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_rename_total_counter | Counter | Jumlah total operasi POSIX |
node_volume_backend_posix_readdir_total_counter | Counter | Jumlah total operasi POSIX |
Metrik titik pemasangan FUSE
Metrik berikut sedang dalam rilis bertahap dan bergantung pada komponen csi-plugin. Komponen tersebut harus versi v1.32.2 atau lebih baru. Untuk catatan perubahan komponen, lihat csi-plugin. Untuk melakukan upgrade komponen, lihat Upgrade the CSI component.
Metric | Type | Description |
node_volume_mount_retry_count | Counter | Jumlah retry yang dipicu ketika CSI membuat titik pemasangan Filesystem in Userspace (FUSE) karena timeout pemasangan atau kesalahan eksekusi. Nilai yang terus meningkat biasanya mengindikasikan adanya masalah pemasangan, yang menyebabkan Pod aplikasi terkait tetap berada dalam status |
node_volume_mount_point_failover_count | Counter | Jumlah total kali titik pemasangan FUSE berhasil melakukan failover dan pulih ke kondisi sehat setelah terputus akibat event seperti crash proses klien. Metrik ini hanya didukung oleh beberapa jenis klien. Untuk klien yang tidak didukung, nilai ini selalu |
node_volume_mount_point_status | Gauge | Status kesehatan real-time dari titik pemasangan.
|
node_volume_last_fuse_client_exit_reason | Gauge | Timestamp dan alasan keluar tak terduga terakhir dari proses klien FUSE. Misalnya, |