全部产品
Search
文档中心

云原生数据湖分析 DLA:创建虚拟集群

更新时间:Jan 05, 2023

DLA有两种不同的计费方式:按扫描量付费和按计算资源付费(CU版计费)。如果您选择使用CU版,需要创建虚拟集群来进行DLA管理。

操作步骤

  1. 登录Data Lake Analytics管理控制台

  2. 单击左侧导航栏中的虚拟集群管理 ,查看虚拟集群的状态以及创建时间等信息。

  3. 虚拟集群管理页面中,单击新建虚拟集群。

    7

    您也可以前往数据湖分析产品详情页,单击购买数据湖分析CU版创建虚拟集群。

  4. 数据湖分析CU版(包年包月)页面,选择商品类型。

    • 按量付费:属于后付费,即按小时扣费。适合短期需求,用完可以立即释放集群,节省费用。

    • 包年包月:属于预付费,即在新建集群时需要支付费用。适合长期需求,价格比按量付费更实惠。

  5. 请参考以下参数说明进行参数配置。

    6

    参数

    说明

    地域

    集群所在的地理位置,购买后无法更换地域。

    引擎

    • Spark:云原生Spark引擎

    • Presto:兼容开源Presto语法

    长期保有资源(MIN)

    您长期持有且可以使用的CU规格,阿里云会按照该CU规格持续进行收费。

    说明

    1个CU提供1CPU和4 GB内存,即1CU=1核4 GB。

    弹性资源上限(MAX)

    为防止您在使用过程中突发大的容量,阿里云会给您设置一定的弹性资源,该部分弹性资源采取不使用不收费的计费方式,您在购买时可以自行选择。MIN与MAX之间的资源是弹性的,不会保留资源。

    实例名称

    集群名称,同一用户集群名称不能重复。

  6. 设置购买时长(仅针对包年包月集群),然后单击右侧的立即购买

  7. 确认订单页面,勾选数据湖分析CU版服务协议并阅读,根据提示完成支付。

后续使用

创建虚拟集群以后,您还需要构建数据湖才能进行数据分析。你可以通过如下方式构建数据湖。

  • 手工上传文件到OSS,然后通过元数据爬取功能创建表来构建数据湖。具体操作请参见上传文件OSS数据源

  • 通过其他产品投递文件到OSS(如通过操作审计控制台投递日志文件到OSS),然后通过元数据爬取功能创建表来构建数据湖。具体操作请参见创建单账号跟踪OSS数据源

  • 通过一键建仓和多仓合并建仓(仅支持数据库)、实时数据湖(支持数据库和消息日志)功能来构建数据湖。具体操作请参见T+1多库合并建仓实时数据湖

  • 连接数据源:您也可以通过DLA直接连接其他数据源或者OSS来进行数据分析与计算。具体操作请参见Presto引擎连接数据源Spark引擎连接源