Druid - E-MapReduce

Apache Druid是一個分布式記憶體即時分析系統，用於解決如何在大規模資料集下快速的、互動查詢和分析問題。

基本特點

Apache Druid具有如下特點：

即時資料分析是Apache Druid最典型的使用情境。該情境涵蓋的面很廣，例如：

Apache Druid擁有優秀的架構設計，多個組件協同工作，共同完成資料從攝取到索引、儲存和查詢等一系列流程。

Druid工作層（資料索引以及查詢）包含以下組件：

Realtime組件負責資料的即時攝入。
Broker組件負責查詢任務的分發以及查詢結果的匯總，並將結果返回給使用者。
Historical組件負責索引後的歷史資料的儲存，資料存放區在deep storage。Deep storage可以是本地，也可以是HDFS等Distributed File System。
Indexing service包含以下兩個組件：
- Overlord組件負責索引任務的管理、分發。
- MiddleManager負責索引任務的具體執行。

Druid segments（Druid索引檔案）管理層涉及以下組件：

E-MapReduce Druid基於Apache Druid做了大量的改進，包括與E-MapReduce和阿里雲周邊生態的整合、方便的監控與營運支援、易用的產品介面等，實現即買即用和7*24免營運。

E-MapReduce Druid目前支援的特性如下所示：