Fitur proteksi sistem menyediakan kemampuan perlindungan trafik tingkat node untuk menangani situasi tak terduga dalam berbagai skenario. Sebagai contoh, jika antarmuka tidak dikonfigurasi dengan aturan perlindungan trafik dan trafik melonjak, fitur ini memberikan perlindungan dasar untuk memastikan stabilitas aplikasi. Tata Kelola Layanan Mikro menyediakan berbagai kemampuan perlindungan untuk trafik pada server dan klien, termasuk perlindungan beban berlebih adaptif, pembatasan berdasarkan total permintaan per detik (QPS), pembatasan berdasarkan konkurensi total, pemutusan sirkuit untuk panggilan abnormal, dan pemutusan sirkuit untuk panggilan lambat.
Untuk informasi lebih lanjut tentang hubungan antara proteksi sistem dan perlindungan trafik, lihat Apa Hubungan Antara Proteksi Sistem dan Perlindungan Trafik? dalam topik ini.
Prasyarat
Versi Enterprise Tata Kelola Layanan Mikro telah diaktifkan. Untuk informasi lebih lanjut, lihat Aktifkan Tata Kelola Layanan Mikro.
Tata Kelola Layanan Mikro telah diaktifkan untuk aplikasi Anda. Untuk informasi lebih lanjut, lihat Aktifkan Tata Kelola Layanan Mikro untuk Aplikasi Layanan Mikro Java dalam Klaster ACK atau ACS dan Aktifkan Tata Kelola Layanan Mikro untuk Aplikasi Layanan Mikro pada Instance ECS.
Prosedur
Masuk ke Konsol MSE, dan pilih wilayah di bilah navigasi atas.
Di panel navigasi kiri, pilih Microservices Governance > Application Governance.
Pada halaman Application list, klik kartu sumber daya dari aplikasi yang diinginkan. Di panel navigasi kiri, klik Traffic management.
Klik tab System Protection dan konfigurasikan fitur terkait.
Perlindungan beban berlebih adaptif
Untuk menggunakan perlindungan beban berlebih adaptif, pastikan versi agen adalah V3.1.4 atau lebih baru.
Deskripsi
Kemampuan perlindungan beban berlebih adaptif menggunakan pemanfaatan CPU sebagai dasar pengukuran beban sistem dan secara adaptif menyesuaikan persentase pembatasan trafik server. Kemampuan ini juga menjaga fluktuasi pemanfaatan CPU dalam rentang kecil di sekitar ambang batas yang dikonfigurasi selama lonjakan trafik tak terduga.
Ruang lingkup efektif
Perlindungan beban berlebih adaptif berlaku untuk semua antarmuka server dan memiliki prioritas lebih rendah daripada aturan perlindungan trafik.
Skenario
Perlindungan beban berlebih adaptif memberikan perlindungan dasar berbasis CPU untuk antarmuka server dan cocok untuk aplikasi sensitif terhadap CPU. Jika terjadi lonjakan trafik tak terduga pada antarmuka, beban CPU sistem meningkat, sehingga waktu respons (RT) antarmuka inti bertambah.
Pemanfaatan CPU dalam keadaan stabil bervariasi berdasarkan bisnis aplikasi. Anda dapat menggunakan uji stres atau data historis untuk menentukan pemanfaatan CPU maksimum dalam keadaan stabil dan mengonfigurasi nilai yang lebih besar sebagai ambang batas.
Deskripsi GUI
Di sisi kiri bagian Perlindungan Beban Berlebih Adaptif, Anda dapat melihat peristiwa perlindungan beban berlebih adaptif. Di sisi kanan, Anda dapat melihat tren rata-rata pemanfaatan CPU setiap node aplikasi dalam 5 menit terakhir.
Peristiwa dilaporkan untuk node untuk menunjukkan perubahan status pembatasan berdasarkan algoritma. Sistem menghasilkan peristiwa saat pembatasan dimulai, bekerja, dan berakhir.
Anda dapat mengklik Lihat di kolom Tindakan suatu peristiwa untuk memeriksa pemanfaatan CPU yang sesuai dengan alamat IP node tertentu dan memutar ulang data selama interval peristiwa dilaporkan. Ini memungkinkan Anda mengamati informasi node, seperti pemanfaatan CPU dan probabilitas pembatasan, ketika peristiwa dilaporkan.
Parameter | Deskripsi |
ON |
|
vCPU Utilization | Ambang batas pemanfaatan CPU yang diharapkan. Jika perlindungan beban berlebih adaptif diaktifkan, sistem menggunakan algoritma untuk secara adaptif menyesuaikan probabilitas pemicuan pembatasan antarmuka berdasarkan pemanfaatan CPU aktual dan ambang batas pemanfaatan CPU yang dikonfigurasi. Ini memungkinkan sistem menolak permintaan tertentu dalam skenario beban tinggi dan menjaga pemanfaatan CPU berfluktuasi dalam rentang kecil di sekitar ambang batas yang dikonfigurasi. |
Pengaturan Pengecualian | Untuk informasi lebih lanjut, lihat Pengaturan pengecualian. |
Pembatasan berdasarkan total QPS
Deskripsi
Pembatasan berdasarkan total QPS memungkinkan sistem mengukur total QPS sebuah node. Total QPS adalah jumlah QPS dari semua antarmuka server pada satu node. Jika total QPS melebihi ambang batas yang dikonfigurasi, sistem melakukan pembatasan pada permintaan.
Untuk menerapkan pembatasan berdasarkan total QPS, pastikan versi agen adalah 4.2.0 atau lebih baru.
Ruang lingkup efektif
Pembatasan berdasarkan total QPS berlaku untuk semua antarmuka server dan memiliki prioritas lebih rendah daripada aturan perlindungan trafik.
Skenario
Kinerja beberapa perilaku sistem mungkin tidak terkait dengan pemanfaatan CPU. Dalam skenario pemanfaatan CPU rendah, aplikasi tertentu mungkin mengalami penurunan kinerja karena masalah terkait memori, jaringan, atau objek lainnya. Jika Anda mengaktifkan pembatasan berdasarkan total QPS, sistem membatasi permintaan berdasarkan total QPS sebuah node dan menyediakan metode perlindungan berbasis trafik.
Jika terjadi lonjakan trafik tak terduga pada antarmuka, terjadi persaingan sumber daya dan sumber daya menjadi tidak mencukupi. Akibatnya, antarmuka inti terpengaruh secara negatif.
Anda dapat menggunakan uji stres atau data historis untuk menentukan total QPS sebuah node dalam keadaan stabil dan mengonfigurasi nilai yang lebih besar sebagai ambang batas.
Deskripsi GUI
Di sisi kiri bagian Pembatasan Total QPS, Anda dapat melihat peristiwa untuk pembatasan berdasarkan total QPS. Di sisi kanan, Anda dapat melihat tren rata-rata total QPS setiap node aplikasi dalam 5 menit terakhir.
Peristiwa dilaporkan untuk node dan antarmuka tempat permintaan dibatasi berdasarkan total QPS dalam 5 menit terakhir. Interval pelaporan peristiwa adalah 5 menit.
Anda dapat mengklik Lihat di kolom Tindakan suatu peristiwa untuk memeriksa total QPS yang sesuai dengan alamat IP node tertentu dan memutar ulang data selama interval peristiwa dilaporkan. Ini memungkinkan Anda mengamati total QPS node terkait dan memeriksa apakah pembatasan bekerja sesuai harapan ketika peristiwa dilaporkan. Jika Anda perlu melihat informasi detail, seperti data antarmuka atau node, Anda dapat pergi ke halaman Detail API atau Detail Node. Kemampuan pengalihan halaman akan disediakan nanti.
Parameter | Deskripsi |
NYALA |
|
Ambang Batas Total QPS | Ambang batas total QPS sebuah node. |
Pengaturan Pengecualian | Untuk informasi lebih lanjut, lihat Pengaturan pengecualian. |
Pembatasan berdasarkan total konkurensi
Deskripsi
Pembatasan berdasarkan total konkurensi memungkinkan sistem mengukur total konkurensi sebuah node. Total konkurensi adalah jumlah konkurensi dari semua antarmuka server pada satu node. Jika total konkurensi melebihi ambang batas yang dikonfigurasi, sistem melakukan pembatasan pada permintaan.
Untuk menerapkan pembatasan berdasarkan total konkurensi, pastikan versi agen adalah 4.2.0 atau lebih baru.
Ruang lingkup efektif
Pembatasan berdasarkan total konkurensi berlaku untuk semua antarmuka server dan memiliki prioritas lebih rendah daripada aturan perlindungan trafik.
Skenario
Jika RT panggilan tinggi (lebih lama dari 1 detik dalam banyak kasus), masalah yang jelas terjadi saat pembatasan berdasarkan total QPS dilakukan. Jika sumber daya sistem, seperti thread pool, sumber daya memori, dan connection pool, ditempati, permintaan akan diantrekan dan RT antarmuka meningkat. Dalam kasus ini, jika Anda hanya melakukan pembatasan berdasarkan QPS, sejumlah kecil permintaan masih diinisiasi per detik. Namun, permintaan yang diantrekan tidak dapat diproses dalam hitungan detik. Akibatnya, lebih banyak permintaan diantrekan, dan RT permintaan lama dan baru meningkat secara signifikan. Jika Anda menggunakan pembatasan berdasarkan total konkurensi bersama dengan pembatasan berdasarkan total QPS, sistem langsung menolak permintaan baru jika permintaan tertentu belum diproses. Setelah sistem memproses permintaan, sistem mengizinkan permintaan berikutnya dan menyelesaikan pemrosesan permintaan dengan durasi antrean yang lebih pendek. Dengan cara ini, tingkat keberhasilan dan RT rata-rata permintaan dapat ditingkatkan secara signifikan.
Jika terjadi lonjakan trafik tak terduga pada antarmuka, terjadi persaingan sumber daya, sumber daya menjadi tidak mencukupi, dan permintaan diantrekan. Akibatnya, RT semua permintaan meningkat.
Anda dapat menggunakan uji stres atau data historis untuk menentukan total konkurensi sebuah node dalam keadaan stabil dan mengonfigurasi nilai yang lebih besar sebagai ambang batas.
Deskripsi GUI
Di sisi kiri bagian Pembatasan Total Konkurensi, Anda dapat melihat peristiwa untuk pembatasan berdasarkan total konkurensi. Di sisi kanan, Anda dapat melihat tren rata-rata total konkurensi setiap node aplikasi dalam 5 menit terakhir.
Peristiwa dilaporkan untuk node dan antarmuka tempat permintaan dibatasi berdasarkan total konkurensi dalam 5 menit terakhir. Interval pelaporan peristiwa adalah 5 menit.
Anda dapat mengklik Lihat di kolom Tindakan suatu peristiwa untuk memeriksa total konkurensi yang sesuai dengan alamat IP node tertentu dan memutar ulang data selama interval peristiwa dilaporkan. Ini memungkinkan Anda mengamati total konkurensi node terkait dan memeriksa apakah pembatasan bekerja sesuai harapan ketika peristiwa dilaporkan. Jika Anda perlu melihat informasi detail, seperti data antarmuka atau node, Anda dapat pergi ke halaman Detail API atau Detail Node. Kemampuan pengalihan halaman akan disediakan nanti.
Parameter | Deskripsi |
NYALA |
|
Ambang Batas Total Konkurensi | Ambang batas total konkurensi sebuah node. |
Pengaturan Pengecualian | Untuk informasi lebih lanjut, lihat Pengaturan pengecualian. |
Pemutusan sirkuit untuk panggilan abnormal
Deskripsi
Pemutusan sirkuit untuk panggilan abnormal memungkinkan sistem mengukur persentase panggilan abnormal setiap antarmuka klien. Jika persentase panggilan abnormal melebihi ambang batas yang dikonfigurasi, sistem memicu pemutusan sirkuit untuk antarmuka tersebut. Selama periode pemutusan sirkuit, antarmuka gagal dengan cepat, dan sistem mengirimkan permintaan deteksi pada interval tertentu. Jika permintaan berhasil, proses pemutusan sirkuit berakhir.
Untuk menerapkan pemutusan sirkuit untuk panggilan abnormal, pastikan versi agen adalah 4.2.0 atau lebih baru.
Ruang lingkup efektif
Pemutusan sirkuit untuk panggilan abnormal berlaku untuk semua antarmuka klien, kecuali antarmuka yang dikonfigurasi dengan aturan pemutusan sirkuit tingkat antarmuka.
Skenario
Pemutusan sirkuit untuk panggilan abnormal cocok untuk dua jenis skenario.
Skenario timeout: Jika masalah timeout sering terjadi pada antarmuka klien, penyedia layanan memiliki pengecualian dengan probabilitas tinggi. Hal ini menyebabkan lebih banyak permintaan aplikasi pemanggil diantrekan dan memengaruhi antarmuka lain dari aplikasi. Dalam skenario ini, pemutusan sirkuit memungkinkan penyedia layanan gagal dalam waktu singkat untuk mencegah antrian permintaan.
Skenario non-timeout: Jika masalah non-timeout sering terjadi pada antarmuka klien, pemutusan sirkuit untuk panggilan abnormal memungkinkan sistem melaporkan kesalahan terkait untuk penanganan pengguna. Ini meminimalkan dampak masalah dan mengoptimalkan pengalaman pengguna saat masalah terjadi.
Deskripsi GUI
Di sisi kiri bagian Pemutusan Sirkuit Panggilan Abnormal, Anda dapat melihat peristiwa yang dilaporkan untuk pemutusan sirkuit panggilan abnormal. Di sisi kanan, Anda dapat melihat 10 antarmuka aplikasi teratas dengan persentase panggilan abnormal tinggi dalam 5 menit terakhir.
Peristiwa dilaporkan untuk node dan antarmuka tempat pemutusan sirkuit dipicu untuk panggilan abnormal dalam 5 menit terakhir. Interval pelaporan peristiwa adalah 5 menit.
Parameter | Deskripsi |
NYALA |
|
Ambang Batas Persentase Pemutusan Sirkuit (%) | Ambang batas panggilan abnormal untuk memicu pemutusan sirkuit pada antarmuka. |
Pengaturan Pengecualian | Untuk informasi lebih lanjut, lihat Pengaturan pengecualian. |
Pengaturan Lanjutan | |
Durasi Jendela Statistik (d) | Panjang jendela waktu statistik. Anda dapat menentukan panjang jendela waktu dari 1 detik hingga 120 menit. |
Durasi Pemutusan Sirkuit (d) | Periode di mana pemutusan sirkuit dilaksanakan. Jika pemutusan sirkuit dilaksanakan pada sumber daya, semua permintaan gagal dengan cepat dalam durasi yang dikonfigurasi. |
Jumlah minimum permintaan | Jumlah minimum permintaan untuk memicu pemutusan sirkuit. Jika jumlah permintaan dalam jendela waktu saat ini kurang dari nilai parameter ini, pemutusan sirkuit tidak dipicu meskipun aturan pemutusan sirkuit terpenuhi. |
Strategi pemulihan pemutusan sirkuit | Menentukan apakah pemutus sirkuit memicu pemutusan sirkuit lagi setelah periode pemutusan sirkuit berakhir. Nilai valid:
|
Pemutusan sirkuit untuk panggilan lambat
Deskripsi
Pemutusan sirkuit untuk panggilan lambat memungkinkan sistem mengukur persentase panggilan lambat setiap antarmuka klien. Jika persentase panggilan lambat lebih besar dari ambang batas yang dikonfigurasi, sistem memicu pemutusan sirkuit untuk antarmuka tersebut. Selama periode pemutusan sirkuit, antarmuka gagal dengan cepat, dan sistem mengirimkan permintaan deteksi pada interval tertentu. Jika permintaan berhasil, proses pemutusan sirkuit berakhir.
Untuk menerapkan pemutusan sirkuit untuk panggilan lambat, pastikan versi agen adalah 4.2.0 atau lebih baru.
Ruang lingkup efektif
Pemutusan sirkuit untuk panggilan lambat berlaku untuk semua antarmuka klien, kecuali antarmuka yang dikonfigurasi dengan aturan pemutusan sirkuit tingkat antarmuka.
Skenario
Pemutusan sirkuit untuk panggilan lambat cocok untuk skenario timeout di mana pemutusan sirkuit untuk panggilan abnormal juga dapat dipicu. Berbeda dengan pemutusan sirkuit untuk panggilan abnormal, pemutusan sirkuit untuk panggilan lambat memungkinkan Anda menyesuaikan secara dinamis nilai RT yang digunakan untuk menentukan panggilan lambat tanpa mempertimbangkan pengaturan timeout.
Deskripsi GUI
Di sisi kiri bagian Pemutusan Sirkuit Panggilan Lambat, Anda dapat melihat peristiwa pemutusan sirkuit yang dilaporkan untuk panggilan lambat. Di sisi kanan, Anda dapat melihat 10 nilai RT rata-rata aplikasi dalam 5 menit terakhir.
Peristiwa dilaporkan untuk node dan antarmuka tempat pemutusan sirkuit dipicu untuk panggilan lambat dalam 5 menit terakhir. Interval pelaporan peristiwa adalah 5 menit.
Parameter | Deskripsi |
NYALA |
|
RT Panggilan Lambat (ms) | Panggilan permintaan yang nilai RT-nya melebihi nilai parameter ini dianggap sebagai panggilan lambat. |
Ambang Batas Degradasi (%) | Jika persentase panggilan permintaan yang nilai RT-nya lebih besar dari nilai RT Panggilan Lambat (ms) melebihi ambang batas yang ditentukan oleh parameter ini, pemutusan sirkuit dipicu. |
Pengaturan Pengecualian | Untuk informasi lebih lanjut, lihat Pengaturan pengecualian. |
Pengaturan Lanjutan | |
Durasi Jendela Statistik (d) | Panjang jendela waktu statistik. Anda dapat menentukan panjang jendela waktu dari 1 detik hingga 120 menit. |
Durasi Pemutusan Sirkuit (d) | Periode di mana pemutusan sirkuit dilaksanakan. Jika pemutusan sirkuit dilaksanakan pada sumber daya, semua permintaan gagal dengan cepat dalam durasi yang dikonfigurasi. |
Jumlah minimum permintaan | Jumlah minimum permintaan untuk memicu pemutusan sirkuit. Jika jumlah permintaan dalam jendela waktu saat ini kurang dari nilai parameter ini, pemutusan sirkuit tidak dipicu meskipun aturan pemutusan sirkuit terpenuhi. |
Strategi pemulihan pemutusan sirkuit | Menentukan apakah pemutus sirkuit memicu pemutusan sirkuit lagi setelah periode pemutusan sirkuit berakhir. Nilai valid:
|
Pengaturan pengecualian
Deskripsi
Anda dapat mengonfigurasi pengaturan pengecualian untuk semua fitur proteksi sistem. Untuk antarmuka yang terdaftar dalam pengaturan pengecualian, permintaan pada antarmuka tersebut langsung diizinkan lewat tanpa pemeriksaan aturan.
Untuk mengonfigurasi pengaturan pengecualian, pastikan versi agen adalah 4.2.0 atau lebih baru.
Skenario
Dalam banyak kasus, Anda hanya perlu mengonfigurasi pengaturan pengecualian untuk antarmuka pemeriksaan kesehatan dan antarmuka kunci sistem. Untuk antarmuka pemeriksaan kesehatan, pengaturan pengecualian mencegah memengaruhi status kesehatan node. Untuk antarmuka kunci sistem, batasan pembatasan terpisah diberlakukan. Diharapkan bahwa antarmuka kunci sistem tidak tunduk pada mekanisme pembatasan sistemwide.
Deskripsi GUI
Di bagian Antarmuka Tersedia di sisi kiri, antarmuka yang baru saja dipanggil ditampilkan. Untuk antarmuka yang tidak ditampilkan, Anda dapat memasukkan nama antarmuka di kotak pencarian, klik ikon pencarian untuk mencari antarmuka, dan kemudian tambahkan antarmuka ke bagian Antarmuka Terpilih di sisi kanan.
FAQ
Apa hubungan antara proteksi sistem dan perlindungan trafik?
Baik proteksi sistem maupun perlindungan trafik dapat memastikan bahwa aplikasi berada dalam keadaan stabil. Namun, skenario dan kehilangan trafik proteksi sistem dan perlindungan trafik berbeda.
Setelah pembatasan dipicu, sistem mengembalikan kode status HTTP 429. Konfigurasi kustom tidak didukung.
Proteksi sistem menyediakan perlindungan trafik berdasarkan metrik tingkat node. Ini memastikan bahwa aplikasi berada dalam keadaan stabil dalam sebagian besar skenario. Proteksi sistem diimplementasikan dari aspek aplikasi, dan aturan proteksi sistem yang sama diterapkan untuk semua antarmuka aplikasi. Namun, antarmuka aplikasi memiliki tingkat kepentingan yang berbeda dan dampak yang berbeda pada beban sistem. Perlindungan trafik memungkinkan Anda mengonfigurasi ambang batas yang berbeda untuk antarmuka yang berbeda untuk menutupi lebih banyak skenario dan meminimalkan jumlah trafik yang dibatasi.
Baik proteksi sistem maupun perlindungan trafik dapat memberikan kemampuan perlindungan. Namun, perlindungan trafik memberikan performa perlindungan yang lebih baik dalam hal cakupan skenario dan kehilangan trafik. Dibandingkan dengan perlindungan trafik, proteksi sistem memungkinkan Anda mengonfigurasi pengaturan dengan cara yang lebih sederhana. Oleh karena itu, kami merekomendasikan agar Anda mengikuti praktik terbaik untuk menggunakan proteksi sistem bersama dengan perlindungan trafik. Proteksi sistem membantu memastikan stabilitas aplikasi, dan perlindungan trafik membantu mengurangi jumlah trafik yang dibatasi berdasarkan konfigurasi granular tanpa mengorbankan performa perlindungan.
Referensi
Untuk informasi lebih lanjut tentang kebijakan perlindungan trafik, lihat Perlindungan Trafik.