Tez是Apache构建在Hadoop之上的支持分布式DAG(Directed Acyclic Graph)的计算框架,支持通过复杂的DAG描述并处理大数据任务。

背景信息

Tez主要使用在Apache Hive中,作为Hive的一种运行时引擎,可以优化Hive SQL的查询引擎。与Hive On MR(MapReduce)相比,Hive On Tez具有更好的查询性能和稳定性。

Hive基于MapReduce提交任务和基于Tez提交任务流程图如下所示:Hive-MR-Tez

Tez的详细信息,请参见Apache TEZ

开启Tez引擎

Hive支持使用Tez引擎执行SQL任务,在执行任务前您可以按照如下操作手动开启Tez引擎。

  1. 进入详情页面。
    1. 登录阿里云E-MapReduce控制台
    2. 在顶部菜单栏处,根据实际情况选择地域和资源组
    3. 单击上方的集群管理页签。
    4. 集群管理页面,单击相应集群所在行的详情
  2. 在左侧导航栏中,选择集群服务 > Hive
  3. 在Hive服务页面,单击上方的配置页签。
  4. 修改配置。
    1. 在配置搜索中,输入配置项hive.execution.engine,单击Search图标。
    2. 设置hive.execution.engine的值为tez
  5. 保存配置。
    1. 在Hive服务页面,单击右上角的保存
    2. 确认修改对话框中,输入执行原因,单击确定
  6. 重启HiveServer2。
    1. 在Hive服务页面,选择右上角的操作 > 重启HiveServer2
    2. 执行集群操作对话中,输入执行原因,单击确定
    3. 确认对话中,单击确定

访问Tez Web UI

您可以在访问链接与端口页面,访问Tez Web UI。

访问Tez Web UI的详情,请参见访问链接与端口Tez