DLA有两种不同的计费方式:按扫描量付费和按计算资源付费(CU版计费)。如果您选择使用CU版,需要创建虚拟集群来进行DLA管理。
操作步骤
单击左侧导航栏中的虚拟集群管理 ,查看虚拟集群的状态以及创建时间等信息。
在虚拟集群管理页面中,单击新建虚拟集群。
您也可以前往数据湖分析产品详情页,单击购买数据湖分析CU版,创建虚拟集群。
在数据湖分析CU版(包年包月)页面,选择商品类型。
按量付费:属于后付费,即按小时扣费。适合短期需求,用完可以立即释放集群,节省费用。
包年包月:属于预付费,即在新建集群时需要支付费用。适合长期需求,价格比按量付费更实惠。
请参考以下参数说明进行参数配置。
参数
说明
地域
集群所在的地理位置,购买后无法更换地域。
引擎
Spark:云原生Spark引擎
Presto:兼容开源Presto语法
长期保有资源(MIN)
您长期持有且可以使用的CU规格,阿里云会按照该CU规格持续进行收费。
说明1个CU提供1CPU和4 GB内存,即1CU=1核4 GB。
弹性资源上限(MAX)
为防止您在使用过程中突发大的容量,阿里云会给您设置一定的弹性资源,该部分弹性资源采取不使用不收费的计费方式,您在购买时可以自行选择。MIN与MAX之间的资源是弹性的,不会保留资源。
实例名称
集群名称,同一用户集群名称不能重复。
设置购买时长(仅针对包年包月集群),然后单击右侧的立即购买。
在确认订单页面,勾选数据湖分析CU版服务协议并阅读,根据提示完成支付。
后续使用
创建虚拟集群以后,您还需要构建数据湖才能进行数据分析。你可以通过如下方式构建数据湖。
通过其他产品投递文件到OSS(如通过操作审计控制台投递日志文件到OSS),然后通过元数据爬取功能创建表来构建数据湖。具体操作请参见创建单账号跟踪和OSS数据源。
通过一键建仓和多仓合并建仓(仅支持数据库)、实时数据湖(支持数据库和消息日志)功能来构建数据湖。具体操作请参见T+1多库合并建仓和实时数据湖。
连接数据源:您也可以通过DLA直接连接其他数据源或者OSS来进行数据分析与计算。具体操作请参见Presto引擎连接数据源和Spark引擎连接源。