本文介绍如何配置数据湖构建(Data Lake Formation,DLF),作为E-MapReduce(简称EMR)上Hadoop集群的元数据。
背景信息
阿里云数据湖构建是一款全托管的快速帮助用户构建云上数据湖的服务,产品为云原生数据湖提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力,详细信息请参见数据湖构建产品简介。
您可以快速完成云原生数据湖方案的构建与管理,并可无缝对接多种计算引擎,打破数据孤岛,洞察业务价值。
前提条件
已在数据湖构建(Data Lake Formation)控制台开通数据湖构建。
使用限制
- 数据湖元数据适配EMR的Hive 2.x、Hive 3.x、Presto和SparkSQL。
- 仅EMR-3.30.0及之后版本和EMR-4.5.0及之后版本,支持选择数据湖元数据作为Hive数据库。
切换元数据存储类型
您可以通过修改Hive参数的方式,切换Hive MetaStore的存储方式。
说明 如果需要迁移数据库的元数据信息,请参见EMR元数据迁移公告。
- 进入Hive服务页面。
- 登录阿里云E-MapReduce控制台。
- 在顶部菜单栏处,根据实际情况选择地域和资源组。
- 单击上方的集群管理页签。
- 在集群管理页面,单击相应集群所在行的详情。
- 在左侧导航栏,选择 。
- 修改hive.imetastoreclient.factory.class的值。
- 保存配置。
- 在Hive服务页面,单击右上角的保存。
- 在确认修改对话框中,输入执行原因,单击确定。
- 重启Hive MetaStore服务。