Ikhtisar
Ringkasan
Seiring dengan transformasi digital yang terus berkembang, perusahaan semakin bergantung pada teknologi komputasi awan untuk menjalankan operasi bisnis. Operasi & Pemeliharaan (O&M) jaringan awan sangat penting untuk efisiensi kerja dan keamanan operasi platform awan. Hal ini tidak hanya memengaruhi keamanan transmisi data, tetapi juga ketersediaan layanan.
Dibandingkan dengan arsitektur TI tradisional, layanan dan fitur dalam lingkungan awan lebih kompleks dan abstrak. Secara tradisional, parameter dan sumber daya dasar dikonfigurasi secara manual. Namun, seiring meningkatnya jumlah parameter dan faktor pengaruh, alat otomatisasi diperlukan untuk mendukung pengambilan keputusan. Oleh karena itu, membangun sistem O&M cerdas di awan menjadi sangat penting. Sistem O&M cerdas dapat mengidentifikasi dan memperbaiki masalah potensial secara efisien untuk memastikan kelangsungan dan stabilitas layanan.
Tujuan dari O&M adalah untuk menemukan, memperbaiki, dan mencegah kegagalan potensial dengan cepat serta membangun jaringan dengan arsitektur dan performa yang dioptimalkan. Untuk mencapai tujuan tersebut, Alibaba Cloud merancang solusi berikut:
Peringatan: Gunakan CloudMonitor untuk memantau status sistem secara real-time dan memicu peringatan ketika anomali terdeteksi. CloudMonitor meminimalkan gangguan layanan karena dapat mendeteksi dan merespons masalah dengan cepat.
Inspeksi: Jalankan inspeksi multidimensi secara berkala pada jaringan untuk mengidentifikasi dan memperbaiki risiko potensial. Inspeksi berkala membantu mengurangi risiko kecelakaan besar.
Observasi: Terapkan metode Artificial Intelligence for IT Operations (AIOps) untuk melakukan observasi terus-menerus pada lingkungan jaringan. Pelacakan dan analisis pada metrik utama membantu menemukan tren perubahan dan membuat rencana sebelumnya. Selain itu, Anda dapat memberikan saran optimasi serta meningkatkan stabilitas dan performa jaringan berdasarkan metrik tersebut.
Kata Kunci
Network Intelligence Service (NIS): NIS menyediakan serangkaian alat AIOps untuk mengelola seluruh siklus hidup jaringan awan, mulai dari perencanaan hingga O&M jaringan. Misalnya, Anda dapat menggunakan NIS untuk analisis lalu lintas, inspeksi jaringan, pemantauan performa jaringan, diagnosis jaringan, analisis jalur, dan pembuatan topologi. NIS membantu mengoptimalkan arsitektur jaringan, meningkatkan efisiensi O&M jaringan, dan mengurangi biaya operasi jaringan.
CloudMonitor: CloudMonitor adalah layanan yang memantau sumber daya dan aplikasi Internet.
Virtual Private Cloud (VPC): VPC adalah jaringan pribadi kustom yang dapat dibuat di Alibaba Cloud. VPC secara logis terisolasi satu sama lain di Lapisan 2. Anda dapat membuat dan mengelola instance layanan awan seperti Elastic Compute Service (ECS), Server Load Balancer (SLB), dan ApsaraDB RDS di VPC Anda.
Elastic IP Address (EIP): EIP adalah alamat IP publik yang dapat dibeli dan dimiliki sebagai sumber daya independen.
NAT Gateway: Gateway NAT menerjemahkan alamat jaringan.
Application Load Balancer (ALB): ALB adalah layanan Alibaba Cloud yang berjalan di lapisan aplikasi dan dioptimalkan untuk menyeimbangkan lalu lintas melalui HTTP, HTTPS, dan Quick UDP Internet Connections (QUIC). ALB sangat elastis dan dapat memproses volume besar lalu lintas Lapisan 7 sesuai permintaan. ALB mendukung routing yang kompleks dan terintegrasi mendalam dengan layanan cloud-native lainnya, dirancang sebagai gateway Ingress cloud-native Alibaba Cloud.
Network Load Balancer (NLB): NLB adalah layanan penyeimbangan beban Lapisan 4 yang ditujukan untuk era Internet of Everything (IoE). NLB menawarkan performa ultra-tinggi dan dapat diskalakan secara otomatis sesuai permintaan. Instance NLB mendukung hingga 100 juta koneksi bersamaan, ideal untuk layanan yang memerlukan konkurensi tinggi.
Classic Load Balancer (CLB): CLB mendistribusikan lalu lintas jaringan masuk di beberapa server backend berdasarkan aturan pengalihan. CLB membantu meningkatkan performa dan ketersediaan aplikasi Anda.
Cloud Enterprise Network (CEN): CEN adalah jaringan ketersediaan tinggi yang berjalan di jaringan privat global Alibaba Cloud. CEN menggunakan router transit untuk membangun koneksi antar wilayah antara VPC, memungkinkan VPC berkomunikasi dengan pusat data dan membangun jaringan fleksibel, andal, dan berkelas perusahaan di awan.
VPN Gateway: VPN Gateway menyediakan koneksi jaringan aman dan andal yang menghubungkan pusat data perusahaan, jaringan kantor, dan klien Internet ke Alibaba Cloud melalui terowongan terenkripsi dan pribadi.
Express Connect circuit: Sirkuit Express Connect adalah kabel atau serat optik yang menghubungkan pusat data. Sirkuit Express Connect biasanya diterapkan dan dipelihara oleh penyedia layanan Internet (ISP). Sirkuit ini diklasifikasikan menjadi sirkuit Express Connect khusus dan sirkuit Express Connect bersama berdasarkan mode penyebaran.
Express Connect: Express Connect adalah layanan jaringan yang menghubungkan pusat data ke Alibaba Cloud. Anda dapat menggunakan Express Connect untuk membangun koneksi pribadi yang cepat, andal, dan aman antara pusat data dan jaringan awan. Express Connect membantu meningkatkan kualitas dan keamanan komunikasi jaringan karena transmisi data melalui Express Connect dapat dipercaya dan terkendali.
Virtual border routers (VBRs): VBR adalah abstraksi dari sirkuit Express Connect yang diisolasi dan divirtualisasi menggunakan teknologi overlay Lapisan 3 dan vSwitch dalam arsitektur Jaringan yang Didefinisikan Perangkat Lunak (SDN). Sebuah VBR diterapkan antara perangkat di tempat pelanggan (CPE) dan VPC untuk bertukar data antara VPC dan pusat data.
Prinsip desain
Kami merekomendasikan agar Anda mempertimbangkan prinsip-prinsip berikut:
Mekanisme respons O&M berbasis peringatan
Mekanisme Langganan Event: Konfigurasikan aturan peringatan yang dipicu pada waktu tertentu untuk memberi tahu Anda tentang anomali sistem potensial, masalah performa, atau risiko keamanan pada kesempatan pertama.
Tanggapan Darurat terhadap Peringatan Tingkat Tinggi: Konfigurasikan mekanisme tanggapan darurat untuk peringatan tingkat tinggi yang memerlukan rencana dan pemilik spesifik untuk memperbaiki peringatan tersebut.
Audit Periodik di Pusat Event: Konfigurasikan rencana periodik untuk mengaudit event historis di pusat event. Analisis event membantu mengidentifikasi tren kesalahan dan risiko potensial serta mengambil tindakan sebelumnya untuk mencegah gangguan layanan.
Mekanisme pemecahan masalah untuk risiko tingkat tinggi
Kami merekomendasikan agar Anda melakukan inspeksi jaringan secara berkala untuk mengidentifikasi dan memperbaiki risiko potensial. Anda dapat membangun sistem O&M jaringan untuk memantau status jaringan dan merespons dengan cepat risiko yang dapat mengganggu performa dan keamanan jaringan.
Mekanisme optimasi jaringan berbasis observasi
Pastikan analisis lalu lintas tetap diaktifkan sehingga sistem dapat terus memantau dan menganalisis metrik jaringan seperti throughput, tingkat kehilangan paket, latensi, dan distribusi pengguna. Metrik tersebut membantu insinyur O&M mengoptimalkan arsitektur layanan berdasarkan status lalu lintas.
Gunakan generator topologi untuk membantu insinyur O&M melacak status jaringan secara real-time dan mengoptimalkan struktur jaringan.
Gunakan penyedia wawasan jaringan untuk memantau status Internet dan mendeteksi masalah jaringan sehingga Anda dapat mengoptimalkan manajemen Internet.
Desain utama
Gunakan peringatan untuk mendeteksi dan menemukan kesalahan
Konfigurasikan aturan peringatan
Aturan peringatan untuk event sistem
Event Sistem: Event sistem mencakup event kegagalan dan event O&M dari berbagai layanan awan. Jika Anda berlangganan event sistem, notifikasi peringatan akan dikirim kepada Anda atau sistem pihak ketiga tertentu segera setelah sebuah event dipicu. Anda harus mengonfigurasi ruang lingkup langganan event sistem, termasuk layanan, jenis event, nama event, tingkat event, grup aplikasi, konten event, dan sumber daya event.
Kami merekomendasikan agar Anda mengaktifkan semua modul CloudMonitor yang terkait dengan event sistem. Kerangka kerja event sistem yang dirancang oleh Alibaba Cloud memastikan bahwa Anda dapat menerima dan memantau peringatan yang kritis bagi bisnis. Mekanisme ini meningkatkan stabilitas dan keamanan sistem karena Anda diberi tahu tentang event penting pada kesempatan pertama.
Untuk informasi lebih lanjut tentang event sistem yang didukung oleh CloudMonitor, lihat Layanan awan yang didukung dan event sistem mereka.
Event sistem jaringan dapat diklasifikasikan ke dalam jenis-jenis berikut:
Batas bandwidth dan performa
Event batas atas: Batas atas bandwidth pribadi, bandwidth Internet, bandwidth ALB, CLB, atau NLB, atau jumlah koneksi pada ALB, CLB, atau NLB telah tercapai.
Event kehilangan paket: Paket dijatuhkan karena bandwidth habis pada ALB, CLN, VPC, atau gateway NAT.
Event QPS dan permintaan melebihi batas: Kesalahan HTTP 503 dipicu ketika batas atas QPS ALB tercapai.
Manajemen koneksi dan kontrol sesi
Sesi melebihi batas dan koneksi dijatuhkan: Koneksi baru dijatuhkan karena jumlah sesi pada instance ALB atau CLB telah mencapai batas atas atau jumlah koneksi baru pada instance NLB tiba-tiba meningkat.
Kegagalan koneksi: Jumlah kegagalan koneksi pada instance CLB atau NLB tiba-tiba meningkat.
Rute dan stabilitas jaringan
Rute melebihi batas: Jumlah rute CEN atau rute BGP yang dialokasikan secara dinamis mencapai batas atas.
Jitter jaringan: Jitter jaringan CEN atau VPC.
Kesalahan koneksi: Kesalahan pada sirkuit Express Connect atau koneksi BGP.
Event VPN dan IPsec
Bandwidth dan koneksi melebihi batas: Batas atas bandwidth VPN dan negosiasi IPsec tercapai.
Pemeriksaan kesehatan: Gateway VPN atau koneksi IPsec lulus atau gagal dalam pemeriksaan kesehatan.
Manajemen titik akhir dan koneksi
Operasi pada titik akhir: Terima, tolak, tambahkan, atau hapus titik akhir.
Masalah sertifikat
Masalah sertifikat dan keamanan: Sertifikat SLB atau gateway VPN kedaluwarsa.
Peringatan bisnis
Event Pemicu Ambang Batas: Jika kondisi dalam aturan peringatan pemicu ambang batas terpenuhi, event dipicu. Jika Anda berlangganan event pemicu ambang batas, Anda dapat mengonfigurasi notifikasi peringatan kustom dengan detail halus. Misalnya, Anda dapat menggabungkan dan mendenoise peringatan serta menentukan metode notifikasi peringatan kustom. Anda harus mengonfigurasi ruang lingkup langganan event pemicu ambang batas, termasuk layanan, metrik, tingkat keparahan, dan grup aplikasi.
Kami merekomendasikan agar Anda mengonfigurasi aturan peringatan dan ambang batas dengan detail halus untuk metrik yang kritis bagi bisnis di CloudMonitor. Kemudian, sistem dapat melakukan analisis tren dan inspeksi anomali untuk mengidentifikasi kesalahan dan risiko potensial. Ini adalah langkah keamanan yang kuat bagi tim O&M untuk memastikan ketersediaan layanan dan meningkatkan pengalaman pengguna.
Untuk informasi lebih lanjut tentang metrik pemantauan yang didukung oleh CloudMonitor, lihat Lampiran 1: Metrik.
Berlangganan notifikasi peringatan
Notifikasi Peringatan diklasifikasikan menjadi Kritis, Peringatan, Notifikasi (Info), dan Diselesaikan berdasarkan tingkat keparahan peringatan.
Kami merekomendasikan agar Anda mengonfigurasi metode notifikasi yang tepat untuk setiap level peringatan. Untuk peringatan Kritis yang dapat menyebabkan dampak langsung dan terus-menerus pada bisnis Anda, kami merekomendasikan agar Anda menentukan panggilan telepon sebagai metode notifikasi utama dan segera merespons peringatan tersebut. Untuk peringatan yang dapat diabaikan yang tidak menyebabkan dampak buruk pada bisnis Anda, kami merekomendasikan agar Anda melihat dan mengelola peringatan tersebut selama jendela waktu tertentu setiap hari. Dengan cara ini, Anda dapat memperbaiki masalah sambil fokus pada agenda bisnis yang kritis.
Untuk informasi lebih lanjut tentang templat peringatan, lihat Kelola Templat Notifikasi.
Peringatan yang dipicu oleh event sistem
Berlangganan event di CloudMonitor: Masuk ke konsol CloudMonitor, pilih Pusat Event > Langganan Event, lalu buat kebijakan langganan untuk berlangganan event sistem.
Peringatan bisnis
Buat Aturan Peringatan
Jika Anda ingin memantau penggunaan sumber daya awan, Anda dapat membuat aturan peringatan. Jika metrik pemantauan suatu sumber daya memenuhi kondisi peringatan tertentu, CloudMonitor secara otomatis mengirimkan notifikasi peringatan kepada Anda. Dengan cara ini, Anda dapat mengidentifikasi dan menyelesaikan masalah pada kesempatan pertama.
Anda dapat membuat aturan peringatan berdasarkan metrik CloudMonitor atau metrik bisnis kustom. Untuk membuat aturan peringatan, masuk ke konsol CloudMonitor, pilih Peringatan > Aturan Peringatan, lalu klik Buat Aturan Peringatan.
Berlangganan Event Pemicu Ambang Batas
CloudMonitor memungkinkan Anda mengonfigurasi notifikasi peringatan kustom untuk kebijakan langganan event. Anda dapat menggunakan fitur langganan event untuk mengonfigurasi notifikasi peringatan kustom. Misalnya, Anda dapat berlangganan event pemicu ambang batas, menggabungkan dan mendenoise peringatan, meningkatkan grup kontak peringatan, menentukan metode notifikasi peringatan kustom, dan mendorong notifikasi peringatan ke saluran tujuan berdasarkan templat data dalam format JSON.
Untuk berlangganan event, masuk ke konsol CloudMonitor, pilih Pusat Event > Langganan Event, lalu klik Buat Kebijakan Langganan.
Kelola peringatan
Peringatan yang dipicu oleh event sistem
Event yang dideteksi oleh CloudMonitor ditampilkan di halaman Pusat Event > Riwayat Notifikasi. Insinyur O&M dapat mengambil tindakan untuk mengelola dan memperbaiki masalah berdasarkan informasi rinci yang disediakan oleh pusat event.
Peringatan kritis memerlukan tanggapan segera untuk meminimalkan dampak. Untuk peringatan tingkat rendah, kami merekomendasikan agar insinyur O&M memeriksa pusat event setiap hari untuk memastikan stabilitas dan performa sistem.
Peringatan bisnis
Untuk memastikan efisiensi operasi bisnis, Anda dapat melihat peringatan bisnis yang dipicu oleh aturan peringatan kustom di halaman Pusat Event > Riwayat Notifikasi di konsol CloudMonitor.
Kami merekomendasikan agar Anda mengonfigurasi kondisi berdasarkan kebutuhan bisnis Anda untuk memungkinkan Function Compute atau skrip otomatisasi memperbaiki masalah secara otomatis. Sebagai alternatif, Anda dapat mengelola peringatan di halaman Riwayat Notifikasi secara teratur. Ini tidak hanya memfasilitasi pemecahan masalah, tetapi juga mengoptimalkan pemanfaatan sumber daya melalui langkah-langkah otomatisasi.
Gunakan inspeksi untuk mengidentifikasi dan menghilangkan risiko potensial
Konfigurasikan inspeksi untuk berbagai jenis risiko
Risiko Stabilitas
Dalam desain arsitektur ketersediaan tinggi (HA), jika konfigurasi server primer/sekunder tidak tepat, switchover mungkin gagal. Hal ini dapat mengganggu kontinuitas dan stabilitas sistem. Selain itu, kebijakan penyebaran sumber daya yang tidak tepat dapat menyebarkan dampak kegagalan, yang juga dikenal sebagai radius ledakan yang meluas. Dalam kasus seperti itu, lebih banyak server atau komponen terpengaruh. Akibatnya, stabilitas layanan secara keseluruhan dapat berkurang secara signifikan.
Untuk mencegah risiko seperti itu, Anda dapat menjalankan inspeksi untuk mengoptimalkan kebijakan penyebaran sumber daya dan memastikan bahwa switchover dapat dilaksanakan sesuai konfigurasi. Ini membantu meningkatkan pemulihan bencana sistem dan mengambil langkah-langkah untuk menghilangkan risiko potensial.
Risiko Keamanan
Daftar kontrol akses (ACL) mungkin gagal memblokir akses tidak sah karena penyaringan yang kasar. Grup keamanan mungkin memberikan izin ke port dan layanan yang tidak diperlukan. Akibatnya, risiko serangan meningkat karena pelanggaran terhadap prinsip hak istimewa minimal (PoLP).
Anda dapat menjalankan inspeksi untuk memeriksa ACL dan grup keamanan secara menyeluruh untuk memastikan bahwa hanya akses yang diizinkan yang diizinkan ke tujuan yang diperlukan. Ini meningkatkan keamanan jaringan secara keseluruhan.
Risiko Performa
Latensi jaringan dapat meningkat karena hambatan performa atau bypass. Kehilangan paket mungkin terjadi jika lalu lintas jaringan sering melebihi bandwidth maksimum.
Kami merekomendasikan agar Anda menggunakan inspeksi untuk memantau latensi jaringan Anda dan menambahkan sumber daya berdasarkan hasil inspeksi. Ini membantu memastikan kualitas layanan (QoS) meskipun jumlah transfer data meningkat.
Pemborosan Sumber Daya
Unitisasi sumber daya yang rendah menghasilkan pemborosan sumber daya. Jika Anda memilih metode penagihan yang tidak tepat, pengeluaran untuk sumber daya mungkin meningkat secara tak terduga, yang mengurangi rasio manfaat biaya.
Anda dapat menjalankan inspeksi untuk mengoptimalkan kebijakan penyebaran sumber daya dan meningkatkan pemanfaatan sumber daya. Anda dapat memilih metode penagihan yang tepat berdasarkan analisis manfaat biaya yang rinci untuk mengontrol anggaran Anda dan meningkatkan rasio manfaat biaya.
Untuk informasi lebih lanjut, lihat Inspeksi Jaringan.
Jalankan inspeksi
Kami merekomendasikan agar Anda menjalankan inspeksi secara teratur, seperti setiap minggu, untuk memantau status jaringan Anda dan mengidentifikasi serta menganalisis masalah potensial yang dapat mengurangi pemanfaatan sumber daya. Pemantauan dan penilaian berkelanjutan membantu Anda mempertahankan arsitektur jaringan yang stabil, mengurangi biaya, dan memastikan kelangsungan layanan.
Untuk melihat laporan inspeksi jaringan mingguan, masuk ke konsol NIS, klik Inspeksi Jaringan di panel navigasi di sebelah kiri, klik Lihat Laporan Historis di kolom Laporan Inspeksi Terbaru, lalu klik Mulai Ulang di pojok kanan atas.
Evaluasi Status Jaringan Keseluruhan Berdasarkan Tingkat Kelulusan: Penilaian kesehatan jaringan dibuat berdasarkan tingkat kelulusan inspeksi. Insinyur O&M dapat dengan cepat menentukan performa jaringan keseluruhan dan mengidentifikasi masalah potensial berdasarkan tren skor laporan.
Tangani Risiko Berdasarkan Tingkat Risiko: Item inspeksi diurutkan berdasarkan prioritas dari risiko tertinggi hingga terendah. Anda dapat mengambil tindakan yang berbeda untuk tingkat risiko yang berbeda berdasarkan saran profesional yang diberikan oleh laporan inspeksi. Proses ini tidak hanya membantu Anda menangani masalah risiko tinggi yang dapat mengganggu stabilitas sistem, tetapi juga memberikan saran yang jelas tentang cara mengoptimalkan lingkungan jaringan Anda.
Tangani risiko potensial
Contoh:
Kontrol Biaya
EIP: Jalankan inspeksi untuk mendeteksi dan melepaskan EIP yang tidak digunakan untuk mencegah pemborosan sumber daya.
CEN: Alokasikan sumber daya bandwidth antar wilayah berdasarkan volume lalu lintas aktual untuk mencegah pemborosan sumber daya.
Tingkatkan Stabilitas
Risiko batas atas: Kehabisan bandwidth atau spesifikasi sumber daya yang tidak memadai.
Poin kegagalan tunggal (SPOF) di zona: Jika Anda menerapkan instance ALB, instance NLB, atau router transit di zona tunggal, masalah ketidakstabilan mungkin muncul.
SPOF pada koneksi: Jika Anda hanya menggunakan satu sirkuit Express Connect, satu percepatan GA, atau satu terowongan VPN, masalah konektivitas mungkin muncul.
Ketersediaan layanan: Kesalahan layanan mungkin terjadi.
Lakukan optimasi jaringan global berdasarkan observabilitas
Gunakan alat observasi
Buat Topologi — Virtualisasikan Seluruh Jaringan
Topologi jaringan menampilkan koneksi dan hubungan antara sumber daya jaringan dalam bagan visual. Topologi jaringan membantu Anda dengan cepat mempelajari arsitektur jaringan di Alibaba Cloud, memverifikasi konfigurasi jaringan, memecahkan masalah jaringan, dan melakukan O&M terpusat pada sumber daya jaringan awan.
Topologi
Informasi yang ditampilkan
VPC
Sumber daya, termasuk instance ECS, vSwitch, dan router
Rute, termasuk elemen jaringan di dalam dan luar VPC serta tabel rute
CEN
Router transit di seluruh dunia, VPC yang terhubung ke router transit, dan router transit yang saling terhubung
SLB
Zona SLB, alamat IP virtual (VIP), EIP, dan grup keamanan
Analisis Lalu Lintas — Urutkan Lalu Lintas Jaringan dari Beberapa Dimensi
Fitur analisis lalu lintas dapat digunakan untuk memantau lalu lintas jaringan secara real-time, menganalisis lalu lintas jaringan historis, dan menghasilkan bagan deret waktu yang divisualisasikan di konsol NIS berdasarkan hasil analisis. Anda dapat memecahkan masalah berdasarkan data lalu lintas dan metrik yang dikumpulkan.
Analisis Lalu Lintas Internet: Anda dapat menggunakan fitur ini untuk menganalisis lalu lintas di setiap wilayah berdasarkan jenis sumber daya yang berbeda yang terkait dengan alamat IP publik, termasuk lalu lintas alamat IP publik yang terkait dengan instance CLB, lalu lintas alamat IP publik yang terkait dengan instance ECS, lalu lintas alamat IP publik yang terkait dengan gateway NAT Internet, lalu lintas EIP, dan lalu lintas EIP yang ditambahkan ke instance Bandwidth Internet Bersama yang sama.
Analisis Lalu Lintas Cloud Hybrid: Anda dapat menggunakan kemampuan ini untuk menganalisis lalu lintas masuk dan keluar yang mengalir melalui VBR yang terhubung ke router transit di cloud hybrid.
Analisis Lalu Lintas Antar Wilayah: Anda dapat menggunakan kemampuan ini untuk menganalisis lalu lintas masuk dan keluar yang mengalir melalui router transit di berbagai wilayah. Data lalu lintas ditampilkan dalam bentuk 1-tupel, 2-tupel, dan 5-tupel.
Analisis Lalu Lintas Intra-Wilayah: Anda dapat menggunakan kemampuan ini untuk menganalisis lalu lintas masuk dan keluar yang mengalir melalui router transit yang terhubung ke VPC di wilayah yang sama.
Analisis Lalu Lintas Gateway NAT Internet: Anda dapat menggunakan kemampuan ini untuk menganalisis lalu lintas gateway NAT Internet dan menghasilkan bagan deret waktu yang divisualisasikan di halaman Ikhtisar di konsol NIS.
Kualitas Internet — Dampak yang Disebabkan oleh Penurunan Kualitas Internet
Deteksi penurunan kualitas Internet berdasarkan waktu round-trip (RTT) dan tingkat pengiriman ulang.
Deteksi peristiwa penurunan kualitas Internet, termasuk rentang waktu, ISP, area, dan volume lalu lintas.
Deteksi alamat IP publik yang terpengaruh oleh penurunan kualitas Internet.
Observasi sesuai permintaan
Topologi Jaringan
Di konsol NIS, temukan modul Topologi Jaringan, pilih instance jaringan, lalu klik Buat Topologi. Modul ini juga mendukung drilldown topologi yang dapat memperoleh informasi dari berbagai lapisan jaringan. Fitur ini menganalisis dan memvisualisasikan status alokasi sumber daya jaringan untuk memfasilitasi manajemen dan O&M jaringan.
Topologi VPC: Topologi VPC dikategorikan menjadi topologi sumber daya dan topologi rute. Topologi VPC menampilkan topologi rute dan korelasi antara entitas sumber daya yang diterapkan di VPC. Di topologi VPC, Anda dapat melihat informasi dasar tentang instance jaringan terkait, menganalisis instance tersebut, dan menganalisis reachability.
Topologi CEN: Topologi CEN menampilkan koneksi intra-wilayah dan antar wilayah antara router transit yang diterapkan pada instance CEN berdasarkan konfigurasi real-time. Di topologi CEN, Anda dapat melihat koneksi antara sumber daya awan global yang dibangun oleh router transit dan melihat informasi dasar tentang instance jaringan terkait. Ini membantu Anda memahami dan mengelola jaringan awan secara intuitif.
Topologi SLB: Topologi SLB menampilkan koneksi antara pendengar dan grup server backend dari instance SLB. Anda dapat melihat informasi dasar tentang instance jaringan di topologi SLB dan menganalisis instance tersebut untuk memeriksa apakah lalu lintas dirutekan sesuai harapan.
Analisis Lalu Lintas
Anda dapat menggunakan fitur analisis lalu lintas NIS untuk memantau lalu lintas jaringan secara real-time dan menganalisis lalu lintas jaringan historis. Fitur analisis lalu lintas membantu Anda menganalisis lalu lintas berdasarkan alamat IP sumber, berdasarkan alamat IP sumber dan tujuan, dan berdasarkan alamat IP sumber, port sumber, alamat IP tujuan, port tujuan, dan protokol. Anda dapat menggunakan fitur ini untuk mengurutkan lalu lintas jaringan, seperti N instance teratas.
Anda perlu mengaktifkan fitur-fitur berikut secara terpisah sebelum dapat menggunakannya: analisis lalu lintas Internet, analisis lalu lintas cloud hybrid, analisis lalu lintas antar wilayah, dan analisis lalu lintas intra-wilayah.
Anda dapat mengaktifkan fitur analisis lalu lintas Internet untuk wilayah tertentu atau alamat IP publik tertentu. Jika Anda memilih wilayah, fitur ini diaktifkan untuk semua alamat IP publik di wilayah tersebut.
Anda dapat mengaktifkan fitur analisis lalu lintas cloud hybrid untuk koneksi VBR tertentu pada router transit.
Anda dapat mengaktifkan fitur analisis lalu lintas antar wilayah untuk koneksi antar wilayah tertentu pada router transit.
Anda dapat mengaktifkan fitur analisis lalu lintas intra-wilayah untuk koneksi VPC tertentu pada router transit.
Penyedia Wawasan
Anda dapat menggunakan penyedia wawasan untuk mendapatkan informasi real-time tentang penilaian kualitas Internet, mempelajari penurunan kualitas Internet secara tepat waktu, dan menerima peristiwa kualitas Internet dan analisis dampak peristiwa.
Saat Anda membuat penyedia wawasan, Anda harus mengonfigurasi objek yang dipantau untuk penyedia wawasan tersebut. Sepuluh menit setelah penyedia wawasan dibuat, penyedia wawasan mulai mengumpulkan lalu lintas sumber daya dan mendorong metrik tertentu. Anda dapat mengklik nama penyedia wawasan untuk melihat skor penilaian kualitas jaringan, peristiwa penurunan kualitas Internet, dan alamat IP publik yang terpengaruh oleh peristiwa penurunan kualitas Internet. Informasi semacam itu mencerminkan kualitas Internet dan membantu Anda membuat keputusan bisnis yang tepat dan penyesuaian.
Analisis dan optimasi
Optimasi Berdasarkan Observasi Topologi Jaringan
Topologi jaringan menunjukkan seluruh arsitektur jaringan, yang membantu Anda mendapatkan ringkasan arsitektur, analisis jalur, dan status alokasi sumber daya.
Topologi jaringan membantu Anda mengidentifikasi masalah potensial secara efisien dengan menggunakan pemeriksaan berikut:
Pemeriksaan Redundansi: Memastikan bahwa Anda memiliki mekanisme redundansi untuk mencegah SPOF.
Pemeriksaan Konfigurasi: Memeriksa apakah konfigurasi Anda mengikuti praktik terbaik dan membantu Anda memperbaiki pengaturan yang tidak tepat.
Pemeriksaan Keamanan: Memeriksa risiko keamanan potensial, seperti port dan layanan yang tidak perlu diekspos.
Kami merekomendasikan agar Anda mengambil langkah-langkah berikut untuk mengelola sumber daya dengan utilisasi rendah atau idle:
Daur Ulang Sumber Daya: Lepaskan alamat IP dan port yang tidak lagi digunakan.
Optimasi Konfigurasi: Optimalkan alokasi sumber daya dan nonaktifkan layanan yang tidak lagi digunakan.
Optimasi Lalu Lintas dan Bisnis Berdasarkan Analisis Lalu Lintas
Optimasi Internet
Analisis lalu lintas Internet secara akurat mengidentifikasi distribusi geografis pengguna. Anda dapat menerapkan layanan di area populer untuk mengurangi latensi jaringan dan meningkatkan pengalaman pengguna.
Analisis lalu lintas Internet terus memantau status Internet berdasarkan metrik utama, seperti pemanfaatan bandwidth, alamat IP sumber, alamat IP tujuan, port sumber, port tujuan, protokol, dan RTT. Informasi semacam itu tidak hanya membantu Anda mengidentifikasi jam puncak bisnis Anda, tetapi juga memberikan bukti untuk perencanaan kapasitas dan manajemen lalu lintas. Anda dapat menjaga ketersediaan dan stabilitas tinggi untuk bisnis Anda bahkan selama jam puncak dengan beban kerja tinggi.
Optimasi Jaringan Internal
Untuk mengoptimalkan lalu lintas di jaringan internal Anda, kami merekomendasikan agar Anda mendeteksi N sumber teratas yang menghasilkan volume lalu lintas tertinggi dan melakukan analisis drilldown untuk mengidentifikasi dan memperbaiki anomali. Langkah ini membantu Anda memprioritaskan bisnis utama dan mengurangi degradasi performa yang disebabkan oleh bisnis non-kritis. Langkah lainnya adalah memeriksa tingkat pengiriman ulang TCP secara berkala untuk menilai tingkat kehilangan paket, yang dapat mengganggu kelangsungan bisnis. Anda dapat menyesuaikan bisnis berdasarkan hasil observasi sebelumnya dan meningkatkan kualitas serta keandalan jaringan.
Identifikasi Masalah Internet Berdasarkan Penyedia Wawasan
Penyedia wawasan memberikan informasi tentang lokasi klien dan jaringan ISP, menggunakan algoritma baseline cerdas untuk memeriksa apakah peristiwa penurunan performa atau ketersediaan terjadi, dan memberikan detail peristiwa untuk membantu Anda melakukan pemecahan masalah, termasuk analisis lalu lintas dan probe Internet. Anda juga dapat melihat informasi RTT dan lalu lintas serta memantau status Internet secara real-time menggunakan peta sumber lalu lintas Internet. Informasi semacam itu membantu Anda membuat penyesuaian Internet secara tepat waktu untuk mencegah kerugian bisnis.
Praktik terbaik
Praktik terbaik dikembangkan berdasarkan prinsip desain sebelumnya. Praktik terbaik berikut terdiri dari tiga langkah:
Periksa peringatan dan perbaiki masalah
Periksa peringatan setiap hari. Pastikan peringatan tingkat tinggi didorong ke ponsel Anda secara real-time.
Jalankan inspeksi untuk menghilangkan risiko potensial
Jalankan inspeksi secara mingguan.
Amati dan optimalkan
Pilih alat analisis yang sesuai.
Skenario
Peringatan O&M jaringan
Notifikasi Risiko dan Anomali: Ketika event terkait ketersediaan sumber daya atau masalah performa terjadi, Alibaba Cloud mendorong event tersebut ke pusat event di konsol NIS atau CloudMonitor. Event tersebut mencakup degradasi performa instance yang disebabkan oleh penggunaan sumber daya yang berlebihan, ketidaktersediaan bisnis yang disebabkan oleh kehilangan paket dalam koneksi Internet, dan kedaluwarsa langganan instance. Kami merekomendasikan agar Anda menangani event-event ini secepat mungkin untuk mencegah gangguan bisnis.
O&M Otomatis: Alibaba Cloud mendefinisikan status event yang ditampilkan di pusat event konsol NIS. Ini membantu Anda memahami status tugas O&M sistem. Event baru dan perubahan status event dilaporkan ke CloudMonitor, yang memungkinkan Anda membangun sistem O&M otomatis berbasis event untuk memenuhi kebutuhan bisnis Anda.
Inspeksi O&M jaringan
Ketika Anda menerapkan atau memelihara jaringan atau sumber daya, konfigurasi jaringan Anda mungkin tidak memenuhi persyaratan praktik terbaik jika Anda tidak terbiasa dengan layanan awan yang Anda gunakan. Setelah optimasi jaringan terus-menerus, Anda mungkin perlu mengelola sejumlah besar instance jaringan. Mengonfigurasi, memverifikasi, dan memeriksa sumber daya ini memerlukan banyak tenaga kerja. Untuk mengatasi tantangan ini, Anda dapat menggunakan fitur inspeksi jaringan, yang dapat membantu Anda mendiagnosis arsitektur jaringan dan sumber daya yang diterapkan di jaringan serta memberikan saran optimasi jaringan.
Observasi O&M jaringan
Analisis Topologi Jaringan: Topologi jaringan menyediakan informasi komprehensif tentang arsitektur jaringan untuk membantu Anda mengidentifikasi dan mengoptimalkan penyebaran dan komunikasi antara node jaringan. Topologi jaringan menampilkan koneksi dan hubungan antara sumber daya jaringan dalam bagan visual. Topologi jaringan membantu Anda dengan cepat mempelajari arsitektur jaringan di Alibaba Cloud, memverifikasi konfigurasi jaringan, memecahkan masalah jaringan, dan melakukan O&M terpusat pada sumber daya jaringan awan.
Pemantauan dan Manajemen Lalu Lintas Jaringan: Anda dapat memantau lalu lintas di jaringan Anda di konsol yang sama, yang memudahkan operasi bagi insinyur O&M. Anda juga dapat menggunakan fitur analisis lalu lintas untuk memantau lalu lintas jaringan secara real-time dan menganalisis lalu lintas jaringan historis.
Penilaian Kualitas Internet: Anda dapat menjalankan tes periodik atau terus-menerus untuk menilai kualitas Internet berdasarkan metrik utama, seperti latensi, tingkat kehilangan paket, dan jitter. Penilaian ini menunjukkan performa layanan keseluruhan, dan Anda dapat mengambil langkah-langkah untuk meningkatkan pengalaman pengguna.