全部产品
Search
文档中心

E-MapReduce:Kudu

更新时间:Jun 24, 2025

Kudu adalah sistem penyimpanan data terdistribusi, skalabel, dan berorientasi kolom yang mendukung analitik cepat pada data yang sering berubah.

Skenario

Kudu cocok untuk skenario-skenario berikut:

  • Komputasi mendekati waktu nyata

  • Data deret waktu

  • Pemodelan prediksi

  • Data historis dalam jumlah besar

    Dalam banyak kasus, sejumlah besar data historis tersimpan di lingkungan produksi. Data historis dapat disimpan di Hadoop Distributed File System (HDFS), sistem manajemen basis data relasional (RDBMS), atau Kudu. Jika Anda hanya perlu mengakses atau menanyai data historis, Anda dapat menggunakan Impala untuk melakukan operasi tersebut tanpa harus memindahkan data ke Kudu.

Komponen

Kudu terdiri dari komponen-komponen berikut:

  • Server master: mengelola metadata, termasuk informasi server dan tablet dari server tablet. Server master beroperasi dalam mode ketersediaan tinggi (HA) menggunakan algoritma Raft.

  • Server tablet: menyimpan tablet. Setiap tablet memiliki beberapa replika untuk memastikan ketersediaan tinggi dengan menggunakan algoritma Raft.

Istilah

Istilah

Deskripsi

server master

Mengelola metadata seluruh kluster. Metadata mencakup informasi server tablet, informasi tabel, informasi tablet, dan informasi lainnya yang terkait dengan metadata.

server tablet

Menyimpan dan menyediakan tablet untuk klien.

penyimpanan berorientasi kolom

Kudu adalah sistem penyimpanan data berorientasi kolom. Data dalam kolom yang sama disimpan di lokasi yang berdekatan di penyimpanan bawah.

tabel

Kudu menyimpan data dalam tabel. Sebuah tabel memiliki skema dan kunci utama yang diurutkan secara global. Sebuah tabel dapat dibagi menjadi beberapa segmen yang disebut tablet.

tablet

Segmen kontigu dari sebuah tabel. Tablet tertentu direplikasi di beberapa server tablet. Salah satu replika ini dianggap sebagai tablet pemimpin.

Raft

Algoritma konsensus yang digunakan untuk memastikan ketersediaan tinggi server master dan konsistensi data di antara replika tablet.

tabel katalog

Lokasi pusat untuk metadata di Kudu. Tabel katalog menyimpan informasi tentang tabel dan tablet.