全部产品
Search
文档中心

E-MapReduce:Integrasikan Impala dengan Kudu

更新时间:Jul 06, 2025

Setelah mengintegrasikan Impala dengan Kudu, Anda dapat menggunakan Impala untuk mengakses tabel data di Kudu. Topik ini menjelaskan cara mengintegrasikan Impala dengan Kudu.

Prasyarat

Kluster E-MapReduce (EMR) telah dibuat, dan Impala serta Kudu dipilih dari layanan opsional saat pembuatan kluster. Untuk informasi lebih lanjut, lihat Buat kluster.

Prosedur

Gunakan konsol EMR

  1. Pada tab Configure halaman layanan Impala, tambahkan item konfigurasi. Untuk informasi lebih lanjut, lihat Kelola item konfigurasi.

    1. Pada tab Configure halaman layanan Impala, klik impalad.flgs.

    2. Pada tab impalad.flgs, klik Add Configuration Item untuk menambahkan item konfigurasi bernama kudu_master_hosts dengan nilai master-1-1:7051.

      Catatan

      kudu_master_hosts menentukan nama dan nomor port Node master dalam kluster Kudu yang terhubung ke Impala. Jika kluster Kudu memiliki beberapa Node master, pisahkan nama dan nomor port Node master tersebut dengan koma (,). Contoh: master-1-1:7051,master-1-2:7051,master-1-3:7051.

    3. Klik tab catalogd.flgs. Pada tab catalogd.flgs, klik Add Configuration Item untuk menambahkan item konfigurasi bernama kudu_master_hosts dengan nilai master-1-1:7051.

  2. Opsional. Masuk ke kluster untuk memeriksa apakah Impala telah terintegrasi dengan Kudu.

    1. Sambungkan ke Impala. Untuk informasi lebih lanjut, lihat Gunakan alat shell Impala.

    2. Jalankan perintah berikut untuk membuat tabel:

      create table my_first_table
      (
        id bigint,
        name string,
        primary key(id)
      )
      partition by hash partitions 16
      stored as kudu
      tblproperties(
        'kudu.num_tablet_replicas' = '1');

      Jika keluaran berisi Table has been created., tabel berhasil dibuat. Ini menunjukkan bahwa Impala telah terintegrasi dengan Kudu.

Gunakan CLI

  1. Sambungkan ke Impala. Untuk informasi lebih lanjut, lihat Gunakan alat shell Impala.

  2. Jalankan perintah berikut untuk membuat tabel.

    kudu.master_addresses dalam kode menentukan kluster Kudu. Contoh:

    create table my_first_table
    (
       id bigint,
       name string,
       primary key(id)
    )
    partition by hash partitions 16
    stored as kudu
    tblproperties(
     'kudu.master_addresses' = 'master-1-1:7051',
     'kudu.num_tablet_replicas' = '1');
    Catatan

    Parameter dalam contoh kode:

    • my_first_table: Nama tabel. Anda dapat menentukan nama kustom.

    • kudu.master_addresses: menentukan Node master. Jika kluster Anda memiliki beberapa Node master, pisahkan nama dan nomor port Node master tersebut dengan koma (,). Contoh: master-1-1:7051,master-1-2:7051,master-1-3:7051. Jika kluster Anda adalah kluster Hadoop, ubah master-1-1 menjadi emr-header-1.

    Jika keluaran berisi Table has been created., tabel berhasil dibuat. Ini menunjukkan bahwa Impala telah terintegrasi dengan Kudu.

  3. Opsional. Jalankan perintah berikut untuk menyisipkan data ke dalam tabel:

    insert into my_first_table values(1,"ss");
  4. Opsional. Jalankan perintah berikut untuk menanyakan data dalam tabel:

    select * from my_first_table;

    Keluaran berikut akan dikembalikan:

    +----+------+
    | id | name |
    +----+------+
    | 1  | ss   |
    +----+------+
    Catatan

    Jika Anda ingin menghapus tabel, jalankan perintah drop table my_first_table;.