Anda dapat melihat informasi kapasitas dan kinerja sistem file CPFS for Lingjun untuk memahami penggunaan penyimpanan, throughput baca/tulis, serta IOPS baca/tulis. Dengan menetapkan aturan peringatan untuk metrik penting, Anda dapat menerima notifikasi segera saat terjadi pengecualian dan menanganinya secara cepat. Topik ini menjelaskan metrik yang didukung oleh CPFS for Lingjun dan cara mengonfigurasi aturan peringatan untuknya.
Informasi latar belakang
CloudMonitor adalah layanan yang memantau sumber daya Alibaba Cloud dan aplikasi internet. Anda dapat menggunakan CloudMonitor untuk memantau metrik berbagai sumber daya cloud dan menetapkan peringatan untuk metrik tertentu. Layanan ini memberikan gambaran menyeluruh tentang penggunaan sumber daya dan status aplikasi Anda di Alibaba Cloud serta memungkinkan Anda menangani titik kegagalan secara tepat waktu guna memastikan kelancaran layanan. Untuk informasi selengkapnya, lihat Apa itu CloudMonitor?.
Kebijakan retensi data pemantauan
Data pemantauan disimpan selama 90 hari. Setelah periode retensi berakhir, data pemantauan akan dihapus secara otomatis. Periode retensi dimulai sejak data dihasilkan.
Metrik pemantauan
CPFS for Lingjun mendukung pemantauan komprehensif terhadap kapasitas sistem file, kinerja instans, dan kinerja klien melalui CloudMonitor. Tersedia dua set metrik pemantauan: versi baru (direkomendasikan) dan versi lama. Metrik baru mengatasi masalah pada versi lama, seperti penamaan yang tidak konsisten dan struktur yang kurang jelas, serta menawarkan peningkatan dalam hal kegunaan dan kemudahan pemeliharaan.
Pelanggan baru: Anda dapat langsung menggunakan metrik baru.
Pelanggan yang sudah ada: Anda dapat terus menggunakan metrik lama untuk memastikan kelangsungan bisnis. Namun, kami menyarankan agar Anda secara bertahap bermigrasi ke versi baru.
Jika Anda merupakan pelanggan yang sudah ada dan ingin beralih ke metrik baru, Anda harus terlebih dahulu mengujinya di lingkungan pengujian.
Metrik versi baru (direkomendasikan)
Metrik pemantauan baru saat ini tersedia di wilayah berikut: Tiongkok (Beijing).
Pemantauan kapasitas
Tipe | Metrik | Nama metrik | Unit | Deskripsi |
Sistem file - Standard | BmStdCapacity | Kapasitas total penyimpanan sistem file untuk Edisi Komputasi Cerdas (Spesifikasi Standar) | Byte (B) | Ruang penyimpanan total sistem file. |
BmStdCapacityUsed | Penggunaan data sistem file CPFS for Lingjun standar | Byte (B) | Jumlah data yang sedang digunakan oleh sistem file. | |
BmStdInodeLimit | Jumlah maksimum file untuk sistem file Edisi Komputasi AI standar | Unit | Jumlah total maksimum file dan direktori yang dapat ditampung oleh sistem file. | |
BmStdInodeAlloc | Jumlah file yang dialokasikan dalam sistem file CPFS for Lingjun standar | Unit | Jumlah total file dan direktori yang saat ini dialokasikan (dibuat) dalam sistem file. | |
BmStdInodeUsed | Jumlah file yang digunakan dalam sistem file CPFS for Lingjun standar | Item | Jumlah total file dan direktori yang saat ini digunakan dalam sistem file. | |
Sistem file - Large Sistem file spesifikasi besar hanya tersedia untuk pengguna tertentu. Jika Anda bukan pengguna sistem file spesifikasi besar, abaikan metrik terkait. | BmLargeCapacity | Ruang penyimpanan total untuk sistem file spesifikasi besar dalam Edisi Komputasi Cerdas | Byte (B) | Ruang penyimpanan total sistem file. |
BmLargeCapacityUsed | Volume data sistem file untuk komputasi AI skala besar | Byte (B) | Jumlah data yang sedang digunakan oleh sistem file. | |
BmLargeInodeLimit | Jumlah maksimum file dalam sistem file CPFS for Lingjun besar | Unit | Jumlah total maksimum file dan direktori yang dapat ditampung oleh sistem file. | |
BmLargeInodeAlloc | Jumlah file yang dialokasikan dalam sistem file CPFS for Lingjun besar | Item | Jumlah total file dan direktori yang saat ini dialokasikan (dibuat) dalam sistem file. | |
BmLargeInodeUsed | Jumlah file dalam sistem file Edisi Komputasi AI skala besar | Unit | Jumlah total file dan direktori yang saat ini digunakan dalam sistem file. | |
Fileset - Standard | BmStdFsetCapacityLimit | Kuota kapasitas fileset CPFS for Lingjun standar | Byte (B) | Kuota kapasitas maksimum yang ditetapkan untuk satu fileset. |
BmStdFsetCapacityUsed | Kapasitas saat ini dari fileset spesifikasi standar untuk Edisi Komputasi AI | Byte (B) | Kapasitas yang sedang digunakan oleh satu fileset. | |
BmStdFsetInodeLimit | Spesifikasi standar untuk Edisi Komputasi Cerdas: Kuota jumlah file per fileset | Unit | Kuota maksimum jumlah file dan direktori yang ditetapkan untuk satu fileset. | |
BmStdFsetInodeAlloc | Jumlah file yang telah dialokasikan sebelumnya dalam fileset CPFS for Lingjun standar | Unit | Jumlah total file dan direktori yang saat ini telah dialokasikan sebelumnya untuk satu fileset. | |
BmStdFsetInodeUsed | Jumlah file dalam fileset standar untuk Edisi Komputasi Cerdas | Unit | Jumlah file dan direktori yang saat ini digunakan oleh satu fileset. | |
Fileset - Large Sistem file spesifikasi besar hanya tersedia untuk pengguna tertentu. Jika Anda bukan pengguna sistem file spesifikasi besar, abaikan metrik terkait. | BmLargeFsetCapacityLimit | Kuota Kapasitas untuk Fileset Besar dalam Edisi Komputasi Cerdas | Byte (B) | Kapasitas maksimum yang tersedia yang ditetapkan untuk satu fileset. |
BmLargeFsetCapacityUsed | Kapasitas saat ini dari fileset spesifikasi besar dalam Edisi Komputasi Cerdas | Byte (B) | Jumlah data yang sedang digunakan oleh satu fileset. | |
BmLargeFsetInodeLimit | Kuota jumlah file dari fileset CPFS for Lingjun besar | Unit | Jumlah total maksimum file dan direktori yang dapat ditampung dalam satu fileset. | |
BmLargeFsetInodeAlloc | Jumlah file yang telah dialokasikan sebelumnya dalam fileset CPFS for Lingjun besar | Unit | Jumlah total file dan direktori yang saat ini dialokasikan (dibuat) untuk satu fileset. | |
BmLargeFsetInodeUsed | Jumlah file saat ini dalam fileset spesifikasi besar untuk Edisi Komputasi AI | Unit | Jumlah total file dan direktori yang saat ini digunakan oleh satu fileset. |
Pemantauan kinerja
Tipe | Metrik | Nama metrik | Unit | Deskripsi |
Sistem file - Standard | BmStdReadThroughput | Throughput baca sistem file CPFS for Lingjun standar | Byte/detik | Throughput baca rata-rata sistem file dalam byte per detik selama periode statistik. |
BmStdWriteThroughput | Throughput tulis sistem file untuk spesifikasi Standar Edisi Komputasi Cerdas | Byte/detik | Throughput tulis rata-rata sistem file dalam byte per detik selama periode statistik. | |
BmStdReadIops | IOPS baca sistem file untuk Tier Standar Edisi Komputasi Cerdas | Jumlah/detik (IOPS) | Jumlah rata-rata IOPS baca per detik untuk sistem file selama periode statistik. | |
BmStdWriteIops | IOPS Tulis Sistem File untuk Edisi Komputasi Cerdas (Spesifikasi Standar) | Jumlah/detik (IOPS) | Jumlah rata-rata IOPS tulis per detik untuk sistem file selama periode statistik. | |
BmStdReadLatency | Latensi baca sistem file untuk Spesifikasi Standar Edisi Komputasi Cerdas | ms | Latensi baca rata-rata sistem file selama periode statistik. | |
BmStdWriteLatency | Latensi tulis sistem file Edisi Komputasi Cerdas tier standar | ms | Latensi tulis rata-rata sistem file selama periode statistik. | |
BmStdMetaQps | QPS metadata sistem file CPFS for Lingjun standar | Jumlah/detik (IOPS) | Jumlah rata-rata permintaan metadata per detik untuk sistem file selama periode statistik. | |
BmStdMetaLatency | Latensi metadata sistem file CPFS for Lingjun standar | ms | Latensi rata-rata operasi metadata untuk sistem file selama periode statistik. | |
Sistem file - Large Sistem file spesifikasi besar hanya tersedia untuk pengguna tertentu. Jika Anda bukan pengguna sistem file spesifikasi besar, abaikan metrik terkait. | BmLargeReadThroughput | Throughput baca sistem file CPFS for Lingjun besar | Byte/detik | Throughput baca rata-rata sistem file dalam byte per detik selama periode statistik. |
BmLargeWriteThroughput | Throughput tulis sistem file spesifikasi tinggi (Edisi Komputasi Cerdas) | Byte/detik | Throughput tulis rata-rata sistem file dalam byte per detik selama periode statistik. | |
BmLargeReadIops | IOPS baca sistem file CPFS for Lingjun besar | Jumlah/detik (IOPS) | Jumlah rata-rata IOPS baca per detik untuk sistem file selama periode statistik. | |
BmLargeWriteIops | IOPS tulis sistem file CPFS for Lingjun besar | Jumlah/detik (IOPS) | Jumlah rata-rata IOPS tulis per detik untuk sistem file selama periode statistik. | |
BmLargeReadLatency | Latensi baca dalam sistem file skala besar (Edisi Komputasi AI) | ms | Latensi baca rata-rata sistem file selama periode statistik. | |
BmLargeWriteLatency | Latensi tulis sistem file Edisi Komputasi AI skala besar | ms | Latensi tulis rata-rata sistem file selama periode statistik. | |
BmLargeMetaQps | QPS operasi metadata sistem file CPFS for Lingjun besar | Jumlah/detik (IOPS) | Jumlah rata-rata permintaan metadata per detik untuk sistem file selama periode statistik. | |
BmLargeMetaLatency | Latensi operasi metadata sistem file CPFS for Lingjun besar | Mikrodetik (μs) | Latensi rata-rata operasi metadata untuk sistem file selama periode statistik. | |
Klien | ClientReadThroughput | Throughput baca klien untuk Edisi Komputasi Cerdas | Byte/detik | Throughput baca rata-rata dalam byte per detik untuk klien selama periode statistik. |
ClientWriteThroughput | Throughput tulis klien untuk Edisi Komputasi AI | Byte/detik | Throughput tulis rata-rata dalam byte per detik untuk klien selama periode statistik. | |
ClientReadIops | IOPS baca klien pada Edisi Komputasi Cerdas | Jumlah/detik (IOPS) | Jumlah rata-rata IOPS baca per detik untuk klien selama periode statistik. | |
ClientWriteIops | IOPS Tulis Klien untuk Edisi Komputasi Cerdas | Jumlah/detik (IOPS) | Jumlah rata-rata IOPS tulis per detik untuk klien selama periode statistik. | |
ClientReadLatency | Latensi Baca Rata-Rata Klien untuk Edisi Komputasi Cerdas | Mikrodetik (μs) | Latensi baca rata-rata untuk klien selama periode statistik. | |
ClientWriteLatency | Latensi Tulis Rata-Rata Klien Edisi Komputasi Cerdas | us | Latensi tulis rata-rata untuk klien selama periode statistik. | |
ClientMetaLatency | Edisi Komputasi Cerdas: Latensi metadata klien | ms | Latensi rata-rata bagi klien untuk menyelesaikan satu operasi metadata. | |
ClientMetaQps | Edisi Komputasi Cerdas: QPS metadata klien | Jumlah/detik (IOPS) | Jumlah rata-rata permintaan metadata per detik untuk klien selama periode statistik. | |
Koneksi | VpcClientCount | Jumlah klien per VPC Edisi Komputasi Cerdas | Unit | Jumlah total klien yang terhubung ke sistem file melalui VPC. |
RdmaClientCount | Jumlah klien RDMA untuk Edisi Komputasi Cerdas | Unit | Jumlah total klien yang terhubung ke sistem file melalui RDMA. |
Klien file elastis adalah klien yang dipasang oleh tim CPFS pada node komputasi. Klien ini menghubungkan node komputasi ke sistem file CPFS for Lingjun.
Anda hanya dapat melihat kinerja klien di konsol CloudMonitor atau dengan memanggil operasi API CloudMonitor. Untuk informasi selengkapnya, lihat Lihat pemantauan kinerja CPFS atau Lihat pemantauan kinerja CPFS.
Saat menggunakan sistem file CPFS for Lingjun pada sumber daya ECS atau Layanan Komputasi AI Lingjun PAI (penyewa tunggal), hostname adalah hostname node tersebut.
Saat menggunakan sistem file CPFS for Lingjun pada sumber daya komputasi umum PAI atau sumber daya Lingjun, hostname adalah ID Pod dari tugas tersebut.
Untuk informasi selengkapnya mengenai metrik pemantauan baru, lihat Kueri Metrik CloudMonitor.
Metrik versi lama
Pemantauan kapasitas
Tipe | Metrik | Nama metrik | Unit | Deskripsi |
Sistem file | CPFSCapacity | Ruang penyimpanan total | Byte | Ruang penyimpanan total sistem file selama periode statistik. |
CPFSCapacityUsed | Volume data | Byte | Jumlah data yang benar-benar digunakan oleh sistem file selama periode statistik. | |
CPFSInode Limit | Jumlah maksimum file | Unit | Jumlah maksimum file yang dapat digunakan oleh sistem file selama periode statistik. | |
CPFSInode Alloc | Jumlah file yang dialokasikan | Unit | Jumlah file yang dialokasikan oleh sistem file selama periode statistik. | |
CPFSInode Used | Jumlah file yang digunakan | Unit | Jumlah file yang digunakan oleh sistem file selama periode statistik. | |
Fileset | BMCPFSFsetCapacityLimit | Kapasitas yang dialokasikan fileset | Byte | Ruang penyimpanan maksimum yang dapat digunakan fileset untuk menulis data. Setelah kuota tercapai, tidak ada lagi data yang dapat ditulis. |
BMCPFSFsetCapacityUsed | Kapasitas yang digunakan fileset | Byte | Ruang penyimpanan yang benar-benar digunakan oleh fileset. | |
BMCPFSFsetInodeLimit | Jumlah file yang dialokasikan oleh fileset | Item | Jumlah maksimum file dan direktori yang dapat digunakan fileset untuk menulis data. Setelah kuota tercapai, tidak ada lagi data yang dapat ditulis. | |
BMCPFSFsetInodeUsed | Jumlah file yang digunakan oleh fileset | Unit | Jumlah file yang benar-benar digunakan oleh fileset. |
Pemantauan kinerja
Tipe | Metrik | Nama metrik | Unit | Deskripsi |
Sistem file | ThruputRead | Throughput baca | Byte/detik | Throughput baca rata-rata sistem file dalam byte per detik selama periode statistik. |
ThruputWrite | Throughput tulis | Byte/detik | Throughput tulis rata-rata sistem file dalam byte per detik selama periode statistik. | |
IopsRead | IOPS baca | Jumlah/detik | Jumlah rata-rata IOPS baca per detik untuk sistem file selama periode statistik. | |
IopsWrite | IOPS tulis | Hitungan per detik | Jumlah rata-rata IOPS tulis per detik untuk sistem file selama periode statistik. | |
Dataflow | ThroughputImport | Throughput impor | Byte/detik | Throughput rata-rata dalam byte per detik untuk tugas impor dataflow selama periode statistik. |
ThroughputExport | Throughput ekspor | Byte/detik | Throughput rata-rata dalam byte per detik untuk tugas ekspor dataflow selama periode statistik. | |
QPSImportMeta | QPS metadata impor | Jumlah/detik | Jumlah rata-rata permintaan metadata per detik untuk tugas impor dataflow selama periode statistik. | |
QPSExportMeta | QPS metadata ekspor | Jumlah/detik | Jumlah rata-rata permintaan metadata per detik untuk tugas ekspor dataflow selama periode statistik. | |
IOPSImport | IOPS impor | Jumlah/detik | Jumlah rata-rata IOPS per detik untuk tugas impor dataflow selama periode statistik. | |
IOPSEXport | IOPS ekspor | Jumlah/detik | Jumlah rata-rata IOPS per detik untuk tugas ekspor dataflow selama periode statistik. | |
LatencyImport | Latensi impor | AS | Latensi rata-rata tugas impor dataflow selama periode statistik. | |
LatencyExport | Latensi ekspor | AS | Latensi rata-rata tugas ekspor dataflow selama periode statistik. | |
Klien | ClientReadIops | IOPS baca klien | Jumlah/detik | Jumlah rata-rata IOPS baca per detik untuk klien selama periode statistik. |
ClientWriteIops | IOPS tulis klien | Jumlah/detik | Jumlah rata-rata IOPS tulis per detik untuk klien selama periode statistik. | |
ClientReadLatency | Latensi baca rata-rata klien | us | Latensi baca rata-rata untuk klien selama periode statistik. | |
ClientWriteLatency | Latensi tulis rata-rata klien | Kami | Latensi tulis rata-rata untuk klien selama periode statistik. | |
ClientReadThroughput | Throughput baca klien | Byte/detik | Throughput baca rata-rata dalam byte per detik untuk klien selama periode statistik. | |
ClientWriteThroughput | Throughput tulis klien | Byte/detik | Throughput tulis rata-rata dalam byte per detik untuk klien selama periode statistik. |
Klien file elastis adalah klien yang dipasang oleh tim CPFS pada node komputasi. Klien ini menghubungkan node komputasi ke sistem file CPFS for Lingjun.
Anda hanya dapat melihat kinerja klien di konsol CloudMonitor atau dengan memanggil operasi API CloudMonitor. Untuk informasi selengkapnya, lihat Lihat pemantauan kinerja CPFS atau Lihat pemantauan kinerja CPFS.
Saat menggunakan sistem file CPFS for Lingjun pada sumber daya ECS atau Layanan Komputasi AI Lingjun PAI (penyewa tunggal), hostname adalah hostname node tersebut.
Saat menggunakan sistem file CPFS for Lingjun pada sumber daya komputasi umum PAI atau sumber daya Lingjun, hostname adalah ID Pod dari tugas tersebut.
Untuk informasi selengkapnya mengenai metrik pemantauan lama, lihat Kueri Metrik CloudMonitor.
Deskripsi aturan peringatan
Di konsol CloudMonitor, Anda dapat menetapkan aturan peringatan untuk berbagai metrik. Jika suatu metrik untuk sumber daya memenuhi kondisi peringatan yang ditentukan, CloudMonitor akan secara otomatis mengirimkan pemberitahuan peringatan. Tabel berikut menjelaskan tingkat peringatan, mekanisme notifikasi, dan kondisi peringatan.
Tingkat peringatan | Mekanisme notifikasi | Kondisi peringatan |
Critical | Panggilan telepon, pesan teks, email, dan Robot DingTalk | Nilai rata-rata metrik memenuhi kondisi penilaian yang ditentukan selama N periode statistik berturut-turut. Tetapkan nilai N berdasarkan tingkat peringatan. Catatan Kondisi peringatan bervariasi berdasarkan jenis metrik yang dipilih. Kondisi yang ditampilkan pada antarmuka berlaku. |
Warning | Pesan teks, email, dan Robot DingTalk | |
Info | Email dan Robot DingTalk |