Database Seri Waktu (TSDBs) dirancang khusus untuk menyimpan dan memproses data deret waktu secara efisien. Data deret waktu adalah urutan titik-titik data yang disusun dalam urutan kronologis, dengan setiap titik data biasanya berisi cap waktu dan satu atau lebih nilai. Data ini banyak digunakan di bidang-bidang seperti Internet of Things (IoT), sistem Pemantauan, transaksi keuangan, kontrol industri, jaringan sensor, catatan meteorologi, serta pemantauan metrik server.
Informasi Latar Belakang
Database seri waktu diperkenalkan karena alasan-alasan berikut:
Munculnya Internet of Things (IoT): Dengan semakin populernya teknologi IoT, sejumlah besar perangkat dan sensor ditempatkan di seluruh dunia. Mereka terus-menerus menghasilkan data deret waktu, seperti suhu, kelembapan, dan status perangkat. Data ini biasanya memiliki cap waktu dan volumenya sangat besar, sehingga database relasional tradisional sulit untuk menyimpan dan memprosesnya secara efisien.
Peningkatan kebutuhan pemantauan dan manajemen log: Pemantauan sistem dan aplikasi menjadi semakin penting di bidang-bidang seperti TI, kontrol industri, dan manajemen energi. Aplikasi-aplikasi ini perlu mengumpulkan dan menganalisis data deret waktu untuk menemukan anomali, hambatan kinerja, dan tren guna mendukung pengambilan keputusan. Database tradisional tidak memadai untuk menangani penulisan dengan konkurensi tinggi, kompresi data, dan kueri efisien dari data deret waktu.
Kebutuhan analisis big data dan prediksi: Dengan perkembangan teknologi analisis data, perusahaan dan lembaga penelitian semakin fokus pada analisis data deret waktu historis untuk pemeliharaan prediktif, prediksi tren pasar, dan model iklim. Ini mengharuskan database tidak hanya menyimpan data deret waktu skala besar secara efisien tetapi juga mendukung analisis kompleks dan kueri rentang waktu.
Optimalisasi sumber daya dan pengendalian biaya: Di banyak skenario, biaya penyimpanan dan pemrosesan data deret waktu merupakan pertimbangan penting. Database seri waktu menggunakan teknologi seperti kompresi data, pengindeksan efisien, dan optimalisasi penyimpanan untuk secara signifikan mengurangi biaya penyimpanan dan sumber daya komputasi sambil memastikan efisiensi kueri.
Oleh karena itu, database seri waktu diperkenalkan untuk menyimpan data deret waktu. Database ini dioptimalkan berdasarkan karakteristik data deret waktu, seperti throughput penulisan tinggi, kompresi data, dan optimasi kueri rentang waktu, untuk memenuhi persyaratan skenario-skenario tersebut.
Fitur
GanosBase TSDB adalah database seri waktu yang diimplementasikan pada PolarDB for PostgreSQL. GanosBase TSDB sepenuhnya kompatibel dengan TimescaleDB Apache 2.0 open-source dan menyediakan fitur-fitur canggih seperti agregat kontinu, kompresi seri waktu, dan analisis statistik. Fitur inti meliputi:
Baca dan tulis berperforma tinggi: GanosBase TSDB dapat memproses puluhan ribu penulisan titik data per detik dan menyediakan kemampuan pengambilan data historis cepat untuk memenuhi kebutuhan pemantauan dan analisis real-time.
Agregat kontinu: GanosBase TSDB mendukung tampilan agregasi kustom. Dalam tampilan ini, data deret waktu mentah diagregasi dan dihitung (seperti jumlah, rata-rata, maksimum, atau minimum) pada interval waktu tertentu (seperti setiap menit, setiap jam, atau setiap hari), dan hasilnya disimpan dalam tampilan materialisasi terpisah. Proses ini otomatis. Setelah konfigurasi selesai, GanosBase TSDB memperbarui tampilan agregat ini di latar belakang pada interval reguler atau berdasarkan perubahan data untuk memastikan bahwa data agregat diperbarui secara real-time.
Pemrosesan data multimodal: GanosBase TSDB mendukung penyimpanan dan pengambilan terintegrasi dari data dalam modalitas berbeda, seperti data deret waktu dan data spatio-temporal. Data dapat dipartisi berdasarkan waktu dan ruang. Selama kueri, data dapat dipartisi dan dipangkas secara otomatis untuk mempercepat efisiensi pengambilan.
Penyimpanan biaya rendah: GanosBase TSDB menggunakan struktur penyimpanan dan algoritma kompresi yang dioptimalkan untuk mengurangi konsumsi ruang penyimpanan. Ini mendukung deduplikasi dan penyimpanan kompresi tinggi untuk data serupa atau duplikat, mengurangi ruang penyimpanan lebih dari 70%. GanosBase TSDB interoperabel dengan OSS untuk mengarsipkan data dingin dan sangat mengurangi biaya penyimpanan, yang penting untuk sejumlah besar data deret waktu.
Kebijakan retensi data: GanosBase TSDB mendukung kebijakan retensi data yang fleksibel dan dapat menghapus data kedaluwarsa secara otomatis berdasarkan kebutuhan bisnis. Ini membantu mengontrol biaya penyimpanan data dan menjaga agar database tetap beroperasi secara efisien.
Skalabilitas dan ketersediaan tinggi: Untuk aplikasi besar, GanosBase TSDB bergantung pada PolarDB untuk menyediakan kemampuan penskalaan horizontal dan mekanisme failover guna memastikan stabilitas dan keandalan sistem.
Secara keseluruhan, GanosBase TSDB dapat memproses data deret waktu dengan desain dan optimasi uniknya. Ini sangat diperlukan untuk tugas pemantauan, analisis, dan prediksi berskala besar.
Skenario
GanosBase TSDB terutama digunakan dalam skenario-skenario berikut:
IoT: Sejumlah besar perangkat (seperti sensor pintar) terus-menerus menghasilkan data pemantauan seperti suhu, kelembapan, dan tekanan. Data ini memiliki karakteristik deret waktu dan perlu dikumpulkan, disimpan, dan dianalisis secara real-time untuk mencapai pemantauan jarak jauh dan peringatan dini terhadap kerusakan.
Sistem pemantauan: Melaksanakan pemantauan infrastruktur TI (seperti performa server, lalu lintas jaringan) dan manajemen performa aplikasi. Sistem-sistem ini perlu mencatat perubahan metrik sistem dari waktu ke waktu untuk menemukan masalah dengan cepat dan mengoptimalkan performa.
Jasa keuangan: Data harga saham, volume perdagangan, dan kurs mata uang di pasar keuangan adalah data deret waktu yang khas. Database seri waktu dapat digunakan untuk analisis perdagangan frekuensi tinggi, prediksi tren pasar, dan manajemen risiko.
Energi dan utilitas: Data operasional dan data konsumsi energi dari smart grid dan stasiun hidroelektrik disimpan dan dianalisis menggunakan database seri waktu untuk membantu meningkatkan efisiensi alokasi energi dan prediksi.
Otomasi industri: Pemantauan status peralatan dan kontrol proses produksi di industri manufaktur menghasilkan sejumlah besar data deret waktu. Database seri waktu mengimplementasikan manajemen kesehatan peralatan dan optimalisasi kapasitas.