Dokumen ini menyajikan praktik terbaik untuk ketersediaan tinggi layanan online guna meminimalkan gangguan layanan serta meningkatkan stabilitas dan keandalan sistem.
Panduan memulai cepat
Sebelum mempelajari praktik terbaik untuk ketersediaan tinggi, baca dokumen-dokumen berikut untuk memulai penggunaan ApsaraDB for SelectDB dan memahami fitur-fiturnya.
(Wajib) Quick Start
Dokumen ini menjelaskan konsep dasar ApsaraDB for SelectDB, menguraikan proses pembelian dan penggunaan instans, serta menyoroti pertimbangan penting dalam desain tabel database. Informasi ini membantu Anda segera memulai penggunaan ApsaraDB for SelectDB.
(Opsional) Migrasi data
Migrasikan data dari berbagai sumber data, seperti MySQL, PostgreSQL, dan Doris, ke ApsaraDB for SelectDB.
(Opsional) Performance Testing
Jalankan pengujian kinerja menggunakan Star Schema Benchmark, TPC-H Benchmark, dan TPC-DS Benchmark.
(Opsional) Solusi
Rilis dan perubahan spesifikasi
(Wajib) Uji terlebih dahulu
Sebelum merilis fitur baru, lakukan pengujian menyeluruh pada instans pengujian. Untuk layanan berbeban tinggi, tambahkan uji stres kinerja guna mengevaluasi performanya di lingkungan produksi.
(Wajib) Rilis bertahap (grayscale)
Lakukan perubahan selama jam-jam tidak sibuk dengan metode rilis bertahap seperti 10%→50%→100%. Amati layanan selama 10 hingga 30 menit antara setiap tahap. Selain itu, pantau layanan secara ketat selama puncak aktivitas bisnis pertama karena potensi masalah mungkin tidak terlihat pada jam-jam tidak sibuk.
Rekomendasi O&M
(Wajib) Pemantauan bisnis
ApsaraDB for SelectDB menyediakan fitur pemantauan dan peringatan yang komprehensif. Untuk memantau layanan dari perspektif bisnis, gabungkan beberapa metrik utama, terutama waktu tanggapan kueri rata-rata, waktu tanggapan kueri persentil ke-99, laju keberhasilan kueri, kecepatan impor data, pemanfaatan CPU, dan penggunaan memori. Untuk informasi lebih lanjut, lihat Setel aturan peringatan.
Manajemen kapasitas
Untuk layanan berbeban tinggi, lakukan optimasi dan uji stres terlebih dahulu guna mengevaluasi jumlah maksimum permintaan per detik (QPS) yang dapat didukung oleh sumber daya Anda. Evaluasi dan lakukan skala keluar sumber daya berdasarkan pertumbuhan bisnis atau sebelum acara promosi.
Pembaruan versi
ApsaraDB for SelectDB terus memperbaiki bug melalui pembaruan versi minor. Nomor versi tersebut terdiri dari tiga atau empat bagian. Kami menyarankan agar Anda segera meningkatkan ke versi patch terbaru untuk versi minor saat ini. Sebelum melakukan peningkatan, uji versi baru tersebut di lingkungan pengujian. Dalam keadaan darurat, hubungi dukungan teknis untuk melakukan rollback. Misalnya, versi 4.0.4.2 dirilis pada 6 Februari 2025. Selama enam bulan berikutnya, versi tersebut diperbarui 12 kali hingga menjadi versi 4.0.6.1. Melakukan peningkatan secara tepat waktu membantu Anda menghindari masalah yang telah diketahui.
Isolasi layanan
Untuk skenario bisnis yang sepenuhnya independen, gunakan instans terpisah. Untuk skenario di mana layanan berbeda menggunakan data yang sama, gunakan arsitektur kelompok komputasi ganda. Arsitektur ini menyediakan beberapa antrian komputasi fisik dalam satu instans, dan antrian-antrian tersebut berbagi data dari instans baca-tulis.
Latihan operasional
Perubahan instans
Operasi O&M umum mencakup peningkatan dan skala keluar. Latih operasi-operasi ini terlebih dahulu untuk memverifikasi dampak perubahan instans terhadap layanan Anda. Selama perubahan pada instans ApsaraDB for SelectDB, gangguan koneksi sementara dapat terjadi. Aplikasi Anda harus mampu menangani dan mencoba ulang koneksi yang gagal.
Pemulihan kesalahan
ApsaraDB for SelectDB menyediakan beberapa solusi pemulihan kesalahan. Misalnya, Anda dapat dengan cepat beralih ke kelompok komputasi baru jika salah satu gagal, memulai ulang instans yang gagal, atau memulai ulang kelompok komputasi yang macet. Kami menyarankan agar Anda melatih solusi-solusi ini terlebih dahulu agar terbiasa dengan prosedurnya.
Rekomendasi arsitektur ketersediaan tinggi
(Opsional) Pembatasan layanan
ApsaraDB for SelectDB mendukung Workload Groups, yaitu antrian tugas logis. Anda dapat menggunakan Workload Groups untuk mengontrol sumber daya yang digunakan oleh berbagai jenis permintaan atau layanan serta membatasi penggunaan sumber daya maksimumnya. Hal ini memberikan kemampuan pembatasan layanan selama lonjakan lalu lintas.
(Opsional) Pemulihan bencana multi-zona
ApsaraDB for SelectDB mendukung penerapan pemulihan bencana multi-zona. Jika suatu zona gagal, sistem akan melakukan alih otomatis. Objektif Waktu Pemulihan (RTO) untuk alih bencana tersebut sekitar 10 detik.
(Opsional) Pencadangan dan pemulihan data
Untuk layanan online yang sangat sensitif, kami menyarankan agar Anda mengaktifkan pencadangan harian rutin. Anda juga dapat melakukan pencadangan manual sebelum melakukan perubahan penting. Jika terjadi kegagalan kritis, Anda dapat menggunakan data cadangan untuk memulihkan layanan Anda dengan cepat.