为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和机器学习PAI。
前提条件
- 注册阿里云账号。
- 进行个人实名认证或企业实名认证。
开通大数据计算服务MaxCompute
说明 如果您已经开通MaxCompute,请跳过该步骤,直接创建DataWorks工作空间。
- 登录阿里云官网,单击右上角的登录,输入您的阿里云账号和密码。
- 鼠标悬停至顶部菜单栏中的产品,单击,进入MaxCompute产品详情页。
- 单击立即开通。
- 在购买页面,选择地域,并选中服务协议,单击确认订单并支付。
说明
- 购买页面默认提供的规格类型为MaxCompute按量计费标准版和DataWorks基础版。
- MaxCompute的项目管理和查询编辑集成DataWorks的功能,因此需要同时开通DataWorks服务。DataWorks基础版为0元开通,如果您不使用数据集成、不执行调度任务,则不会产生费用。
- 选择地域时,您需要考虑的最主要因素是MaxCompute与其它阿里云产品之间的关系。例如,ECS所在地域、数据所在地域等。
创建工作空间
- 使用主账号登录DataWorks控制台。
- 在概览页面,单击右侧的。
您也可以单击左侧导航栏中的工作空间列表,切换至相应的区域后,单击创建工作空间。
- 在创建工作空间对话框,配置各项参数,单击下一步。
分类 |
参数 |
描述 |
基本信息 |
工作空间名称 |
工作空间名称的长度需要在3~23个字符,以字母开头,且只能包含字母、下划线(_)和数字。 |
显示名 |
显示名不能超过23个字符,只能字母、中文开头,仅包含中文、字母、下划线(_)和数字。 |
模式 |
工作空间模式是DataWorks新版推出的新功能,分为简单模式和标准模式:
- 简单模式:指一个Dataworks工作空间对应一个MaxCompute项目,无法设置开发和生产环境,只能进行简单的数据开发,无法对数据开发流程以及表权限进行强控制。
- 标准模式:指一个Dataworks工作空间对应两个MaxCompute项目,可以设置开发和生产两种环境,提升代码开发规范,并能够对表权限进行严格控制,禁止随意操作生产环境的表,保证生产表的数据安全。
详情请参见简单模式和标准模式的区别。
|
描述 |
对创建的工作空间进行简单描述。 |
高级设置 |
能下载select结果 |
控制数据开发中查询的数据结果是否能够下载,如果关闭无法下载select的数据查询结果。 |
- 在选择引擎界面,选择相应引擎后,单击下一步。
DataWorks已正式商用,如果该区域没有开通,需要首先开通正式商用的服务。默认选中
数据集成、
数据开发、
运维中心和
数据质量。
说明 此处需要同时勾选机器学习PAI和MaxCompute。
- 进入引擎详情页面,配置选购引擎的参数。
分类 |
参数 |
描述 |
MaxCompute |
实例显示名称 |
实例显示名称需要以字母开头,只能包含字母、数字和下划线(_)。 |
Quota组切换 |
Quota用于实现计算资源和磁盘配额。 |
MaxCompute数据类型 |
该选项设置后将在5分钟内生效,数据类型模式的详情请参见数据类型版本说明。如果您不清楚模式的选择,建议与工作空间管理员确认后再进行选择。
|
是否加密 |
您可以设置不加密和加密。
|
MaxCompute项目名称 |
开发环境的默认名称为DataWorks工作空间的名称_dev,生产环境的默认名称与DataWorks工作空间名称一致。
|
MaxCompute访问身份 |
开发环境的MaxCompute访问身份默认为任务负责人,不可以修改。
生产环境的MaxCompute访问身份包括阿里云主账号和阿里云子账号。
|
- 配置完成后,单击创建工作空间。
工作空间创建成功后,即可在工作空间列表页面查看相应内容。