全部产品
Search
文档中心

云原生大数据计算服务 MaxCompute:环境准备

更新时间:Jun 06, 2023

本文为您介绍开始本教程前的环境准备工作,需要开通表格存储(Tablestore)、大数据计算服务(MaxCompute)、一站式大数据开发治理平台(DataWorks)和数据可视化分析平台(Quick BI)。

前提条件

  • 已注册阿里云账号。如果您还没有注册阿里云账号,请进入阿里云官网,单击免费注册,即可进入阿里云账号注册页面创建新的阿里云账号。

  • 已实名认证。如果您还没有实名认证,请进入实名认证页面对账号进行实名认证。

背景信息

本教程涉及的阿里云产品如下:

操作步骤

  1. 创建表格存储实例。

    1. 进入表格存储Tablestore产品详情页,单击免费开通

    2. Tablestore (Pay-As-You-Go)页面,单击立即购买

      立即购买
    3. 确认订单页面,勾选我已阅读并同意Tablestore (Pay-As-You-Go)服务协议,并单击立即开通

      确认订单
    4. 单击管理控制台

      管理控制台
    5. 管理控制台页面的概述页签,选择地域为华北2(北京),单击创建实例

      创建实例
      说明

      在本教程中,表格存储服务选择华北2(北京)。您可以根据需要选择其他地域。

    6. 购买方式对话框选择按量模式,填写实例名称实例规格请选择容量型实例,单击确定

      创建实例
      说明
      • 实例名称在表格存储同一个地域内必须全局唯一,建议您选用自己可辨识且符合规则的名称。

      • 实例名称在MaxCompute数据处理中也会被使用,本例中为workshop-bj-mc,关于实例的详细解释请参见实例

    7. 完成创建后,单击左侧导航栏全部实例可以看到您刚刚创建的实例,状态为运行中

  2. 开通大数据计算服务MaxCompute。

    1. 进入MaxCompute产品详情页,单击立即购买

    2. 选择按量计费,选择地域为华东2(上海)规格类型为默认的标准版,单击立即购买

      说明

      MaxCompute地域与表格存储地域相同可以节省您的流量费用,因此您可以选择地域为华北2(北京)。本教程中MaxCompute地域选择为华东2(上海),以便为您展示跨地域的外部表使用过程。

  3. 开通DataWorks。

    1. 进入DataWorks产品详情页,单击立即购买

    2. 选择地域为华东2(上海),单击立即购买

      说明

      MaxCompute地域与表格存储地域相同可以节省您的流量费用,因此您也可以选择地域为华北2(北京)。本教程中MaxCompute地域选择为华东2(上海),以便为您展示跨地域访问数据的使用过程。

  4. 创建DataWorks工作空间。

    1. 进入DataWorks工作空间列表,选择地域为华东2(上海),单击创建工作空间

      创建工作空间
    2. 创建工作空间面板中,填写基本配置相关内容,单击提交

      简单模式
      说明
      • 工作空间名称全局唯一,建议您使用易于区分的名称。

      • 为方便使用,本教程中DataWorks工作空间模式为简单模式(单环境)。在简单模式下,DataWorks工作空间与MaxCompute项目一一对应,详情请参见必读:简单模式和标准模式的区别

    3. 工作空间创建完成后,DataWorks为您提供了常用引擎的绑定入口,可直接进行引擎绑定操作,选择MaxCompute后的立即绑定

      分类

      参数

      MaxCompute

      资源显示名

      • 用于定义当前引擎配置在DataWorks作为一个执行计算引擎实例的显示名称,用于在DataWorks上标识该套引擎配置(类似于该引擎在DataWorks的别名)。

      • 您可以自定义该显示名称。 名称必须唯一。

      项目来源

      默认为创建项目。

      付费模式

      定义MaxCompute项目按照哪种付费方式进行计费,包括按量付费包年包月。 关于MaxCompute计费模式详情请参见计费项与计费方式概述

      说明

      标准模式下不支持添加开发者版本的实例。

      Quota组

      定义MaxCompute项目使用的计算资源池。关于Quota相关说明详情请参配额

      数据类型

      定义MaxCompute项目使用哪一类数据类型。包括2.0数据类型(推荐)1.0数据类型(面向已有使用1.0数据类型用户)和Hive兼容类型(面向Hive迁移用户),详情请参见:数据类型版本说明

      是否加密

      指定创建的项目空间是否需要开启数据加密功能。

      项目名称

      长度为3~27个字符,以字母开头,且只能包含字母、下划线(_)和数字。

      调度访问身份

      DataWorks任务提交调度后,作为在MaxCompute项目内执行代码的身份(账号)。

      阿里云子账号

      当前登录账号。

      引擎详情

      分类

      参数

      MaxCompute

      资源显示名

      • 用于定义当前引擎配置在DataWorks作为一个执行计算引擎实例的显示名称,用于在DataWorks上标识该套引擎配置(类似于该引擎在DataWorks的别名)。

      • 您可以自定义该显示名称。 名称必须唯一。

      项目来源

      默认为创建项目。

      付费模式

      定义MaxCompute项目按照哪种付费方式进行计费,包括按量付费包年包月。 关于MaxCompute计费模式详情请参见计费项与计费方式概述

      说明

      标准模式下不支持添加开发者版本的实例。

      Quota组

      定义MaxCompute项目使用的计算资源池。关于Quota相关说明详情请参配额

      数据类型

      定义MaxCompute项目使用哪一类数据类型。包括2.0数据类型(推荐)1.0数据类型(面向已有使用1.0数据类型用户)和Hive兼容类型(面向Hive迁移用户),详情请参见:数据类型版本说明

      是否加密

      指定创建的项目空间是否需要开启数据加密功能。

      项目名称

      长度为3~27个字符,以字母开头,且只能包含字母、下划线(_)和数字。

      调度访问身份

      DataWorks任务提交调度后,作为在MaxCompute项目内执行代码的身份(账号)。

      阿里云子账号

      当前登录账号。

      单击完成绑定,完成创建。

  5. 开通Quick BI。详情请参见Quick BI购买、升级、降级、续费、欠费