Disk cloud ESSD menggunakan penyimpanan triplikat dan validasi data end-to-end untuk menjamin ketahanan dan integritas data. Disk cloud ESSD dengan redundansi lokal menyediakan keandalan data sebesar 99,9999999% (sembilan sembilan), sedangkan yang menggunakan redundansi zona mencapai keandalan data sebesar 99,9999999999% (dua belas sembilan).
Keunggulan teknis
Ketahanan data: Sistem secara otomatis menyimpan setiap data sebagai tiga replika yang didistribusikan di berbagai node fisik dan rak berbeda. Jika satu atau dua replika tidak tersedia, data tetap dapat dibaca dan ditulis dari replika yang tersisa.
Integritas data: Pada setiap tahap proses penulisan dan penyimpanan data, sistem menghasilkan checksum—mirip dengan sidik jari data—menggunakan algoritma validasi, lalu memverifikasinya pada setiap langkah berikutnya. Jika terdeteksi ketidaksesuaian antara data dan checksum-nya, koreksi kesalahan segera dipicu untuk mencegah korupsi data selama transfer dan penyimpanan. Validasi ini dipercepat oleh perangkat keras, sehingga dampaknya terhadap performa baca-tulis dapat diabaikan.
Pemulihan kesalahan otomatis: Saat sistem mendeteksi kegagalan node penyimpanan atau jumlah replika yang tidak mencukupi, sistem secara otomatis memulihkan data dari replika yang sehat untuk memulihkan kembali kondisi penuh tiga-replika. Seluruh proses pemulihan ini transparan bagi aplikasi Anda.
Skenario perlindungan
Ketidaktersediaan data akibat kegagalan perangkat keras
Tantangan: Kegagalan tak terduga seperti kerusakan disk, downtime server, atau gangguan daya rak dapat membuat data pada perangkat fisik yang terdampak menjadi tidak dapat diakses.
Perlindungan teknis: Mekanisme penyimpanan triplikat mendistribusikan data di berbagai node fisik. Jika terjadi kegagalan, sistem secara otomatis melakukan failover ke replika yang sehat untuk menjaga kelangsungan layanan sambil membangun kembali replika baru di latar belakang, tanpa berdampak pada bisnis Anda.
Korupsi data senyap (silent data corruption)
Tantangan: Kesalahan yang tidak terdeteksi dapat terjadi selama transfer atau penyimpanan data akibat faktor seperti bit flip pada memori, kesalahan transmisi jaringan, atau degradasi firmware dan media disk. Karena kesalahan ini sulit dideteksi dengan metode tradisional, mereka dapat menyebabkan inkonsistensi data dan menjadi ancaman serius terhadap integritas data.
Perlindungan teknis: Validasi data end-to-end menghasilkan checksum pada setiap langkah proses penulisan data. Saat Anda membaca data, sistem memverifikasi checksum tersebut di setiap tahap. Jika ditemukan ketidaksesuaian, sistem segera memicu koreksi kesalahan untuk memastikan data yang Anda baca identik dengan data yang ditulis.
Teknologi keandalan ini melindungi dari kegagalan perangkat keras dan korupsi data di lapisan infrastruktur. Risiko tingkat aplikasi, seperti penghapusan tidak sengaja atau serangan virus, memerlukan perlindungan melalui snapshot.
Mekanisme penyimpanan tripel
Mekanisme penyimpanan triplikat dirancang untuk mengatasi ketidaktersediaan data akibat kegagalan perangkat keras. Sistem secara otomatis mereplikasi setiap data yang ditulis ke disk cloud menjadi tiga salinan di lapisan dasar dan menyimpannya di node fisik yang berbeda.
Proses penulisan data

Sistem menggunakan mekanisme penulisan sinkron multi-replika. Operasi penulisan hanya berhasil jika data berhasil ditulis ke semua replika. Jika tidak, operasi tersebut gagal. Mekanisme ini menjamin konsistensi kuat, artinya setiap permintaan baca berikutnya dapat mengakses data yang paling baru ditulis.
Strategi penempatan replika
Untuk mencegah kegagalan berkorelasi—seperti beberapa replika menjadi tidak tersedia akibat gangguan daya pada satu rak—mekanisme penyimpanan triplikat secara otomatis menerapkan strategi penempatan berikut:
Isolasi rak: Sistem mendistribusikan ketiga replika di node penyimpanan pada rak yang berbeda. Kegagalan satu mesin atau satu rak tidak memengaruhi ketersediaan data.
Isolasi domain kesalahan: Sistem mendistribusikan ketiga replika disk cloud ESSD yang menggunakan redundansi lokal di berbagai rak dalam zona ketersediaan yang sama. Untuk disk cloud ESSD yang menggunakan redundansi zona, replika didistribusikan di berbagai zona ketersediaan. Hal ini meningkatkan kemampuan disaster recovery dari tingkat rak ke tingkat zona ketersediaan.
Penyeimbangan beban: Selain memenuhi persyaratan isolasi, sistem juga mempertimbangkan kapasitas disk, beban I/O, dan topologi jaringan untuk mencapai pemanfaatan resource yang seimbang dan performa optimal.
Proses pemulihan kesalahan

Sistem memiliki kemampuan self-healing data otomatis. Saat sistem mendeteksi jumlah replika yang tidak mencukupi, proses pemulihan secara otomatis dipicu. Sistem memilih node penyimpanan sehat baru yang memenuhi kebijakan isolasi dan menyalin data dari replika yang ada untuk segera memulihkan kondisi penuh tiga-replika. Seluruh proses ini transparan bagi aplikasi Anda dan tidak memerlukan intervensi manual.
Validasi data end-to-end
Validasi data end-to-end dirancang untuk mengatasi masalah korupsi data senyap selama transfer dan penyimpanan data.
Proses validasi
End-to-end berarti bahwa pada setiap tahap proses penulisan dan penyimpanan, sistem menggunakan kode Cyclic Redundancy Check (CRC) untuk memverifikasi integritas data.
Setelah permintaan I/O dimulai: Data memasuki jalur penyimpanan blok, dan checksum awal dihasilkan.
Setelah penyalinan memori: Setelah data disalin ke memori node komputasi, sistem membandingkan checksum untuk mendeteksi kesalahan data.
Setelah transmisi jaringan: Saat data mencapai lapisan jaringan node penyimpanan, sistem membandingkan checksum untuk mendeteksi kesalahan bit selama transfer.
Saat diterima oleh node penyimpanan: Setelah data ditulis ke memori node penyimpanan, sistem membandingkan checksum.
Saat data dipersisten ke disk: Setelah data ditulis ke disk, sistem membandingkan checksum.
Jika sistem menemukan ketidaksesuaian checksum pada tahap mana pun, sistem segera memicu penanganan kesalahan. Validasi ini dipercepat oleh perangkat keras, sehingga dampaknya terhadap performa baca-tulis dapat diabaikan.
Penanganan kesalahan
Sistem menangani kesalahan secara berbeda tergantung lokasi terjadinya kesalahan:
Lapisan transport jaringan: Sistem secara otomatis mengirim ulang data hingga validasi berhasil.
Media penyimpanan: Sistem menandai blok rusak dan membaca data yang benar dari replika lain untuk pemulihan.
Memori: Mekanisme Error-Correcting Code (ECC) secara otomatis mengoreksi kesalahan, dan sistem mengulangi operasi I/O.
FAQ
Apakah mekanisme penyimpanan triplikat berarti saya harus membayar tiga kali kapasitas penyimpanan?
Tidak. Penyimpanan triplikat adalah fitur keandalan data bawaan yang disediakan oleh Alibaba Cloud. Alibaba Cloud menanggung biaya redundansi penyimpanan 3x di lapisan dasar. Anda hanya membayar kapasitas disk cloud yang Anda beli. Misalnya, jika Anda membeli disk cloud 40 GiB, ruang yang dapat digunakan dan kapasitas yang ditagihkan tetap 40 GiB.
Bagaimana cara saya melindungi data lebih lanjut?
Buat kebijakan snapshot otomatis untuk melakukan backup secara berkala. Anda dapat menggunakan snapshot untuk mengembalikan disk cloud jika terjadi masalah.
Copy snapshot lintas wilayah. Jika terjadi kegagalan, Anda dapat menggunakan snapshot untuk membuat data disk dan attach ke instans cadangan.
Apakah mekanisme penyimpanan triplikat dapat mencegah semua jenis kehilangan data?
Mekanisme penyimpanan triplikat melindungi dari kegagalan perangkat keras di lapisan infrastruktur. Risiko tingkat aplikasi, seperti penghapusan tidak sengaja atau serangan virus, memerlukan perlindungan melalui snapshot.
Bagaimana mekanisme penyimpanan triplikat menjamin konsistensi data?
Sistem menggunakan mekanisme penulisan sinkron multi-replika. Operasi penulisan hanya berhasil jika data berhasil ditulis ke semua replika. Jika tidak, operasi tersebut gagal. Mekanisme ini menjamin konsistensi kuat, artinya setiap permintaan baca berikutnya dapat mengakses data yang paling baru ditulis.