全部产品
Search
文档中心

E-MapReduce:Gunakan Hive untuk melakukan operasi dasar

更新时间:Jul 02, 2025

Topik ini menjelaskan cara menggunakan Hive untuk melakukan operasi dasar seperti membuat database dan tabel di kluster E-MapReduce (EMR).

Prasyarat

Kluster EMR telah dibuat. Untuk informasi lebih lanjut, lihat Buat Kluster.

Buka CLI Hive

  1. Masuk ke kluster EMR dalam mode SSH. Untuk informasi lebih lanjut, lihat Masuk ke Kluster.
  2. Jalankan perintah berikut untuk beralih ke pengguna hadoop:
    su hadoop
  3. Jalankan perintah berikut untuk membuka CLI Hive:
    hive

Kelola database

Dalam contoh ini, digunakan database bernama testdb.

  1. Jalankan perintah berikut untuk membuat database:
    create database if not exists testdb;

    Jika informasi yang dikembalikan berisi OK, database testdb telah dibuat.

  2. Jalankan perintah berikut untuk menanyakan informasi tentang database:
    desc database testdb;
  3. Jalankan perintah berikut untuk menggunakan database:
    use testdb;
  4. Jalankan perintah berikut untuk menghapus database:
    drop database if exists testdb;

    Jika informasi yang dikembalikan berisi OK, database telah dihapus.

Kelola tabel

Dalam contoh ini, digunakan tabel bernama t.

  1. Jalankan perintah berikut untuk membuat tabel:
    create table if not exists t (id bigint, value string);

    Jika informasi yang dikembalikan berisi OK, tabel t telah dibuat.

  2. Jalankan perintah berikut untuk menanyakan informasi tentang tabel:
    desc formatted t;
  3. Jalankan perintah berikut untuk menanyakan semua tabel yang ada:
    show tables;
    Informasi berikut dikembalikan:
    OK
    t
  4. Jalankan perintah berikut untuk menghapus tabel:
    drop table if exists t;

    Jika informasi yang dikembalikan berisi OK, tabel telah dihapus.

Eksekusi Pernyataan SQL

  1. Eksekusi pernyataan berikut untuk menyisipkan data:
    insert into table t select 1, 'value-1';
    Jika informasi yang dikembalikan berisi OK, data telah dimasukkan.
    OK
    Waktu yang diperlukan: 14,73 detik
  2. Eksekusi pernyataan berikut untuk menanyakan 10 rekaman pertama dalam tabel:
    select * from t limit 10;
    Informasi berikut dikembalikan:
    OK
    1       value-1
    Waktu yang diperlukan: 11,48 detik, Diambil: 1 baris
  3. Eksekusi pernyataan berikut untuk menggabungkan data:
    select value, count(id) from t group by value;
    Informasi berikut dikembalikan:
    OK
    value-1 1
    Waktu yang diperlukan: 20,11 detik, Diambil: 1 baris