Impala集成Kudu后,您可以使用impala访问kudu的数据表。本文为您介绍Impala如何集成Kudu。

前提条件

已创建集群,并且选择了Impala和Kudu服务,详情请参见创建集群

Impala集成Kudu

Impala集成Kudu的方式如下:
  • 方式一:命令行方式
    1. 连接Impala,详情请参见Impala命令行工具
    2. 执行以下命令,新建表格。
      代码中添加了kudu.master_addresses来指定Kudu集群。代码示例如下。
      create table my_first_table
          (
            id bigint,
            name string,
            primary key(id)
          )
          partition by hash partitions 16
          stored as kudu
          tblproperties(
            'kudu.master_addresses' = 'emr-header-1:7051,emr-header-2:7051,emr-header-3:7051',
            'kudu.num_tablet_replicas' = '1');
      说明 本文代码示例中的my_first_table为表名称,您可以自定义。
      返回如下提示信息时,表示成功创建表。create_table
    3. 可选:您可以执行以下命令,向表中插入数据。
      insert into my_first_table values(1,"ss");
    4. 可选:您可以执行以下命令,查询表数据。
      select * from my_first_table;
      返回如下提示信息。select
      说明 您可以使用命令drop table my_first_table;删除表。
  • 方式二:控制台方式
    1. 在EMR控制台新增配置。
      1. 在Impala服务的配置页面,单击impalad.flgs页签。
      2. 单击自定义配置
      3. 新增配置项对话框中,添加参数名为kudu_master_hosts,参数值为emr-header-1:7051,emr-header-2:7051,emr-header-3:7051的配置项来指定Kudu集群。add_impala
      4. 单击确定
      5. 重复步骤ⅰ~步骤ⅳ,在catalogd.flgs页签也添加参数名为kudu_master_hosts,参数值为emr-header-1:7051,emr-header-2:7051,emr-header-3:7051的配置项。
    2. 保存配置。
      1. 单击保存
      2. 确认修改对话框中,输入执行原因,单击确定
    3. 重启配置。
      1. 在右上角选择操作 > 重启All Components
      2. 执行集群操作对话框中,输入执行原因,单击确定
      3. 确认对话框中,单击确定
    4. 可选:您可以登录集群查看集群连接情况。
      1. 连接Impala,详情请参见Impala命令行工具
      2. 执行以下命令,新建表格。
        代码示例如下。
        create table my_first_table
            (
              id bigint,
              name string,
              primary key(id)
            )
            partition by hash partitions 16
            stored as kudu
            tblproperties(
              'kudu.num_tablet_replicas' = '1');
        返回如下提示信息时,表示成功创建表。create_table2