AnalyticDB for MySQL Data Warehouse Edition (V3.0) menyediakan fitur diagnostik yang memungkinkan Anda mendiagnosis status operasi kluster dalam periode waktu tertentu. AnalyticDB for MySQL melakukan analisis berdasarkan data pemantauan, log, serta status basis data dan tabel untuk mengevaluasi kesehatan kluster dari berbagai aspek seperti penggunaan sumber daya, beban kerja, kueri SQL, operator, dan penyimpanan, membantu Anda mengidentifikasi dan menyelesaikan masalah secara efisien.
Prosedur
Masuk ke Konsol AnalyticDB for MySQL. Di pojok kiri atas, pilih wilayah. Di panel navigasi sebelah kiri, klik Clusters. Pada halaman Kluster, temukan kluster yang ingin dikelola dan klik ID kluster.
Di panel navigasi sebelah kiri, klik Monitoring Information.
Geser penunjuk di atas kurva metrik atau pilih rentang waktu dari daftar drop-down, lalu klik Diagnose.
PentingFitur ini mendukung diagnosis data dalam rentang hingga 1 jam hanya untuk 14 hari terakhir.
Pada halaman yang muncul, Anda dapat melihat hasil diagnosis kluster.
Interpretasi laporan diagnosis
Hasil diagnosis mencakup informasi tentang deteksi SQL buruk, deteksi pola abnormal, deteksi metrik bisnis, deteksi lapisan komputasi, dan deteksi lapisan penyimpanan. Gunakan hasil ini untuk mengidentifikasi dan menyelesaikan masalah.
Deteksi SQL buruk
Deteksi SQL buruk mencakup metrik berikut: Top Stages SQL, SQL Paling Banyak Menggunakan Memori, SQL Paling Banyak Menggunakan CPU, Top Data Read SQL, Top Data Output SQL, dan SQL Paling Lama Waktu Eksekusi. Hingga 10 kueri SQL ditampilkan dalam urutan menurun untuk setiap metrik. Sistem melakukan diagnosis mandiri untuk setiap kueri SQL dari metrik SQL Paling Lama Waktu Eksekusi. Untuk melihat hasil diagnosis setiap kueri SQL, klik ikon
di kolom Tindakan. Untuk menganalisis kueri SQL saat ini, klik Diagnose di kolom Tindakan untuk melihat rencana eksekusi detail.
Deteksi pola abnormal
Deteksi pola abnormal menampilkan pola abnormal dalam periode waktu tertentu, seperti peningkatan dramatis pada jumlah pengiriman atau memori puncak suatu pola. Deteksi pola abnormal mencakup metrik berikut: Memori Puncak, Durasi Kueri, Biaya Operator, Jumlah Data Keluaran, dan Pengiriman Kueri. Setiap metrik mencakup bidang-bidang berikut: Pola SQL, Detail Hasil Deteksi, dan Metrik Terkait Lainnya.
Pola SQL: Membantu Anda menentukan pernyataan SQL dari pola abnormal.
Detail Hasil Deteksi: Menampilkan alasan pola abnormal, seperti hasil perbandingan dengan data hari-hari sebelumnya.
Metrik Terkait Lainnya: Menampilkan metrik terkait lainnya, seperti memori puncak, biaya operator, dan durasi kueri, untuk memfasilitasi analisis data.
Deteksi metrik bisnis
Deteksi metrik bisnis mencakup deteksi koneksi kluster dan deteksi waktu respons kueri.
Deteksi koneksi kluster
Deteksi ini membandingkan data dalam periode waktu tertentu hingga 1 jam antara hari saat ini dan tiga hari terakhir. Jika jumlah koneksi pada hari saat ini meningkat lebih dari 20% untuk 80% titik data dibandingkan dengan tiga hari terakhir, jumlah koneksi dianggap bertumbuh. Periksa adanya lalu lintas bisnis baru atau koneksi abnormal.
Deteksi waktu respons kueri
Deteksi ini menggunakan logika yang sama dengan deteksi koneksi kluster. Jika waktu respons kueri meningkat lebih dari 20% untuk 80% titik data dibandingkan dengan tiga hari terakhir, waktu respons kueri dianggap bertumbuh. Periksa peningkatan lalu lintas atau kueri lambat.
Tingkat pertumbuhan dihitung menggunakan rumus berikut: (Nilai metrik saat ini - Nilai metrik sebelumnya)/Nilai metrik sebelumnya × 100%.
Deteksi lapisan komputasi
Deteksi lapisan komputasi mencakup deteksi operator abnormal, deteksi status node, deteksi ketidakseimbangan utilisasi CPU, deteksi rata-rata utilisasi CPU untuk grup sumber daya, deteksi ketidakseimbangan utilisasi CPU antar grup sumber daya, dan analisis korelasi metrik deret waktu.
Deteksi operator abnormal
Detail Operator
Deteksi operator abnormal membantu Anda mengidentifikasi operator abnormal seperti Join, Aggregation, Sort, dan Window operators, serta mengurutkannya berdasarkan metrik. Analisis operator abnormal dapat dilakukan berdasarkan bidang-bidang seperti konsumsi memori, sumber daya CPU, jumlah data masukan, dan jumlah data keluaran. Untuk melihat rencana eksekusi operator, klik Diagnose di kolom Tindakan.
Ringkasan Operator
Dalam beberapa kasus, operator abnormal dapat menyebabkan konsumsi sumber daya yang signifikan. Deteksi operator abnormal menggabungkan metrik berikut: operator dengan penggunaan CPU tertinggi dan operator dengan penggunaan memori tertinggi. Anda dapat menggunakan hasil agregat untuk memeriksa nilai metrik maksimum dan mengidentifikasi operator abnormal.
Deteksi status node
Jika node executor menangani sejumlah besar data atau mengalami kesalahan internal, node tersebut mungkin menjadi tidak sehat dan gagal menjalankan kueri atau merespons dengan cepat. Deteksi status node menampilkan pengecualian tentang node executor yang tidak sehat berdasarkan status node dalam periode waktu tertentu untuk membantu Anda mengidentifikasi penyebab pengecualian.
Deteksi ketidakseimbangan utilisasi CPU
Deteksi ini memeriksa apakah utilisasi CPU di antara node executor seimbang. Jika utilisasi CPU maksimum tetap lebih dari dua kali rata-rata utilisasi CPU selama 80% dari periode waktu tertentu, utilisasi CPU dianggap miring. Kami merekomendasikan agar Anda memeriksa ketidakseimbangan data. Untuk informasi lebih lanjut, lihat Diagnostik Penyimpanan.
Hasil deteksi ditampilkan pada tingkat berikut: NORMAL, PERINGATAN, dan KRITIS. Untuk memastikan bisnis Anda berjalan sesuai harapan, perhatikan dengan cermat hasil deteksi pada tingkat KRITIS.
Deteksi rata-rata utilisasi CPU untuk grup sumber daya
Deteksi ini memeriksa rata-rata utilisasi CPU grup sumber daya dalam periode waktu tertentu. Jika utilisasi CPU tetap lebih dari 80% selama 80% dari periode waktu tertentu, utilisasi CPU dianggap tinggi. Evaluasi apakah akan mengubah jumlah sumber daya dalam grup sumber daya. Untuk informasi lebih lanjut, lihat bagian "Ubah grup sumber daya" dari topik Buat grup sumber daya.
Hasil deteksi ditampilkan pada tingkat berikut: NORMAL, PERINGATAN, dan KRITIS. Untuk memastikan bisnis Anda berjalan sesuai harapan, perhatikan dengan cermat hasil deteksi pada tingkat KRITIS.
Deteksi ketidakseimbangan utilisasi CPU antar grup sumber daya
Deteksi ini memeriksa apakah utilisasi CPU antar grup sumber daya seimbang. Jika utilisasi CPU maksimum tetap lebih dari 2,5 kali rata-rata utilisasi CPU selama 80% dari periode waktu tertentu, utilisasi CPU dianggap miring. Evaluasi apakah akan mengubah jumlah sumber daya dalam grup sumber daya. Untuk informasi lebih lanjut, lihat bagian "Ubah grup sumber daya" dari topik Buat grup sumber daya.
Hasil deteksi ditampilkan pada tingkat berikut: NORMAL, PERINGATAN, dan KRITIS. Untuk memastikan bisnis Anda berjalan sesuai harapan, perhatikan dengan cermat hasil deteksi pada tingkat KRITIS.
Analisis korelasi metrik deret waktu
Jika metrik Rata-rata Utilisasi CPU Node Komputasi dan Utilisasi CPU Maksimum Node Komputasi abnormal, sistem menggunakan analisis korelasi metrik deret waktu untuk mendeteksi metrik terkait yang menyebabkan anomali. Metrik terkait mencakup QPS, BUILD Jobs, Update TPS, Delete TPS, dan Write TPS. Gunakan metrik terkait untuk mengidentifikasi kemungkinan penyebab tingginya utilisasi CPU.
Sebagai contoh, jika QPS terdeteksi sebagai metrik terkait dengan perubahan dalam metrik Rata-rata Utilisasi CPU Node Komputasi, peningkatan dalam rata-rata utilisasi CPU mungkin disebabkan oleh sejumlah besar kueri.
Saat menggunakan analisis korelasi metrik deret waktu dalam diagnosis, tentukan rentang waktu yang mencakup periode pemantauan anomali metrik utama untuk membantu mengidentifikasi penyebab anomali pada kesempatan pertama.
Deteksi lapisan penyimpanan
Deteksi lapisan penyimpanan mencakup deteksi pembuatan dan akses tabel, deteksi status node, deteksi utilisasi CPU maksimum, deteksi rata-rata utilisasi CPU, deteksi ketidakseimbangan utilisasi CPU, dan analisis korelasi metrik deret waktu.
Deteksi pembuatan dan akses tabel
Deteksi Akses Tabel
Deteksi ini memeriksa tabel yang diakses dalam periode waktu tertentu dan menampilkannya dalam urutan menurun berdasarkan metrik. Metrik termasuk: Jumlah Maksimum Data Dibaca, Rata-rata Jumlah Data Dibaca, Biaya Maksimum Pembacaan, Rata-rata Biaya Pembacaan, dan Akses Tabel.
Deteksi Skew Data
Dalam tabel partisi AnalyticDB for MySQL, pilih bidang distribusi yang merata untuk mendistribusikan data ke node pekerja. Jika bidang distribusi tidak merata, skew tabel mungkin terjadi. Deteksi ini mengidentifikasi tabel dengan jumlah data terbesar dan memeriksa apakah data tersebar tidak merata. Optimalkan tabel yang miring untuk meningkatkan kinerja kueri dan menyeimbangkan jumlah data di antara disk, mencegah disk terkunci.
Deteksi Ketidakwajaran Partisi
Deteksi ini mengidentifikasi tabel dengan jumlah data terbesar dan memeriksa apakah data dipartisi secara tidak wajar.
Deteksi status node
Jika node pekerja menangani sejumlah besar data atau mengalami kesalahan internal, node tersebut mungkin menjadi tidak sehat dan gagal menjalankan kueri atau merespons dengan cepat. Deteksi status node menampilkan pengecualian tentang node pekerja yang tidak sehat berdasarkan status node dalam periode waktu tertentu untuk membantu Anda mengidentifikasi penyebab pengecualian.
Deteksi utilisasi CPU maksimum
Deteksi ini memeriksa utilisasi CPU maksimum dari semua node pekerja dalam periode waktu tertentu. Jika utilisasi CPU maksimum tetap lebih dari 90% selama 80% dari periode waktu tertentu, utilisasi CPU dianggap tinggi. Periksa kueri lambat. Untuk informasi lebih lanjut, lihat Kueri Lambat Tipikal.
Hasil deteksi ditampilkan pada tingkat berikut: NORMAL, PERINGATAN, dan KRITIS. Untuk memastikan bisnis Anda berjalan sesuai harapan, perhatikan dengan cermat hasil deteksi pada tingkat KRITIS.
Deteksi rata-rata utilisasi CPU
Deteksi ini memeriksa rata-rata utilisasi CPU dari semua node pekerja dalam periode waktu tertentu. Jika rata-rata utilisasi CPU tetap lebih dari 80% selama 80% dari periode waktu tertentu, utilisasi CPU dianggap tinggi. Periksa kueri lambat. Untuk informasi lebih lanjut, lihat Kueri Lambat Tipikal.
Hasil deteksi ditampilkan pada tingkat berikut: NORMAL, PERINGATAN, dan KRITIS. Untuk memastikan bisnis Anda berjalan sesuai harapan, perhatikan dengan cermat hasil deteksi pada tingkat KRITIS.
Deteksi ketidakseimbangan utilisasi CPU
Deteksi ini memeriksa apakah utilisasi CPU di antara node pekerja seimbang. Jika utilisasi CPU maksimum tetap lebih dari dua kali rata-rata utilisasi CPU selama 80% dari periode waktu tertentu, utilisasi CPU dianggap miring. Periksa ketidakseimbangan data. Untuk informasi lebih lanjut, lihat Diagnostik Penyimpanan.
Hasil deteksi ditampilkan pada tingkat berikut: NORMAL, PERINGATAN, dan KRITIS. Untuk memastikan bisnis Anda berjalan sesuai harapan, perhatikan dengan cermat hasil deteksi pada tingkat KRITIS.
Analisis korelasi metrik deret waktu
Jika metrik Rata-rata Utilisasi CPU Node Penyimpanan dan Utilisasi CPU Maksimum Node Penyimpanan abnormal, sistem menggunakan analisis korelasi metrik deret waktu untuk mendeteksi metrik terkait yang menyebabkan anomali. Metrik mencakup QPS, BUILD Jobs, Update TPS, Deletion TPS, dan Write TPS. Gunakan metrik terkait untuk mengidentifikasi kemungkinan penyebab tingginya utilisasi CPU.
Sebagai contoh, jika QPS terdeteksi sebagai metrik terkait dengan perubahan dalam metrik Rata-rata Utilisasi CPU Node Penyimpanan, peningkatan dalam rata-rata utilisasi CPU mungkin disebabkan oleh sejumlah besar kueri.
Saat menggunakan analisis korelasi metrik deret waktu dalam diagnosis, tentukan rentang waktu yang mencakup periode pemantauan anomali metrik utama untuk membantu mengidentifikasi penyebab anomali pada kesempatan pertama.