Kudu adalah sistem penyimpanan data terdistribusi, skalabel, dan berorientasi kolom yang mendukung analitik cepat pada data yang sering berubah.
Skenario
Kudu cocok untuk skenario-skenario berikut:
Komputasi mendekati waktu nyata
Data deret waktu
Pemodelan prediksi
Data historis dalam jumlah besar
Dalam banyak kasus, sejumlah besar data historis tersimpan di lingkungan produksi. Data historis dapat disimpan di Hadoop Distributed File System (HDFS), sistem manajemen basis data relasional (RDBMS), atau Kudu. Jika Anda hanya perlu mengakses atau menanyai data historis, Anda dapat menggunakan Impala untuk melakukan operasi tersebut tanpa harus memindahkan data ke Kudu.
Komponen
Kudu terdiri dari komponen-komponen berikut:
Server master: mengelola metadata, termasuk informasi server dan tablet dari server tablet. Server master beroperasi dalam mode ketersediaan tinggi (HA) menggunakan algoritma Raft.
Server tablet: menyimpan tablet. Setiap tablet memiliki beberapa replika untuk memastikan ketersediaan tinggi dengan menggunakan algoritma Raft.
Istilah
Istilah | Deskripsi |
server master | Mengelola metadata seluruh kluster. Metadata mencakup informasi server tablet, informasi tabel, informasi tablet, dan informasi lainnya yang terkait dengan metadata. |
server tablet | Menyimpan dan menyediakan tablet untuk klien. |
penyimpanan berorientasi kolom | Kudu adalah sistem penyimpanan data berorientasi kolom. Data dalam kolom yang sama disimpan di lokasi yang berdekatan di penyimpanan bawah. |
tabel | Kudu menyimpan data dalam tabel. Sebuah tabel memiliki skema dan kunci utama yang diurutkan secara global. Sebuah tabel dapat dibagi menjadi beberapa segmen yang disebut tablet. |
tablet | Segmen kontigu dari sebuah tabel. Tablet tertentu direplikasi di beberapa server tablet. Salah satu replika ini dianggap sebagai tablet pemimpin. |
Raft | Algoritma konsensus yang digunakan untuk memastikan ketersediaan tinggi server master dan konsistensi data di antara replika tablet. |
tabel katalog | Lokasi pusat untuk metadata di Kudu. Tabel katalog menyimpan informasi tentang tabel dan tablet. |