Topik ini menjelaskan cara menggunakan Hive untuk melakukan operasi dasar seperti membuat database dan tabel di kluster E-MapReduce (EMR).
Prasyarat
Kluster EMR telah dibuat. Untuk informasi lebih lanjut, lihat Buat Kluster.
Buka CLI Hive
- Masuk ke kluster EMR dalam mode SSH. Untuk informasi lebih lanjut, lihat Masuk ke Kluster.
- Jalankan perintah berikut untuk beralih ke pengguna hadoop:
su hadoop - Jalankan perintah berikut untuk membuka CLI Hive:
hive
Kelola database
Dalam contoh ini, digunakan database bernama testdb.
- Jalankan perintah berikut untuk membuat database:
create database if not exists testdb;Jika informasi yang dikembalikan berisi OK, database testdb telah dibuat.
- Jalankan perintah berikut untuk menanyakan informasi tentang database:
desc database testdb; - Jalankan perintah berikut untuk menggunakan database:
use testdb; - Jalankan perintah berikut untuk menghapus database:
drop database if exists testdb;Jika informasi yang dikembalikan berisi OK, database telah dihapus.
Kelola tabel
Dalam contoh ini, digunakan tabel bernama t.
- Jalankan perintah berikut untuk membuat tabel:
create table if not exists t (id bigint, value string);Jika informasi yang dikembalikan berisi OK, tabel t telah dibuat.
- Jalankan perintah berikut untuk menanyakan informasi tentang tabel:
desc formatted t; - Jalankan perintah berikut untuk menanyakan semua tabel yang ada:
show tables;Informasi berikut dikembalikan:OK t - Jalankan perintah berikut untuk menghapus tabel:
drop table if exists t;Jika informasi yang dikembalikan berisi OK, tabel telah dihapus.
Eksekusi Pernyataan SQL
- Eksekusi pernyataan berikut untuk menyisipkan data:
insert into table t select 1, 'value-1';Jika informasi yang dikembalikan berisi OK, data telah dimasukkan.OK Waktu yang diperlukan: 14,73 detik - Eksekusi pernyataan berikut untuk menanyakan 10 rekaman pertama dalam tabel:
select * from t limit 10;Informasi berikut dikembalikan:OK 1 value-1 Waktu yang diperlukan: 11,48 detik, Diambil: 1 baris - Eksekusi pernyataan berikut untuk menggabungkan data:
select value, count(id) from t group by value;Informasi berikut dikembalikan:OK value-1 1 Waktu yang diperlukan: 20,11 detik, Diambil: 1 baris