全部产品
Search
文档中心

大数据开发治理平台 DataWorks:ETL工作流快速体验

更新时间:Feb 21, 2024

DataWorks推出ETL工作流模板案例集,旨在帮助用户快速了解产品的最佳实践。您可以一键将案例导入至指定工作空间,快速还原案例,体验产品能力。

注意事项

  • 案例导入可能会产生少量费用,具体收费请以案例说明为准。

  • 案例提供的数据仅用于阿里云大数据开发治理平台DataWorks数据应用体验。

  • 空间管理员角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见空间级模块权限管控

导入ETL工作流模板

您可以将DataWorks ETL工作流模板直接导入至目标工作空间进行体验,具体操作如下:

  1. 登录DataWorks控制台

    说明

    若您是首次登录DataWorks控制台,可以0元开通DataWorks产品,进行后续模板导入操作。

  2. 查看案例列表。

    点击左侧导航栏的大数据体验 > ETL工作流模板,进入ETL工作流模板页面。

  1. 查看案例详情。

    ETL工作流模板页面点击任意案例的查看详情按钮,进入案例详情页面查看详情,支持的案例请参见教程列表

  2. 导入案例至指定空间。

    在案例详情页面,点击载入模板。填写载入模板对话框,单击确认

    说明

    不同的案例教程使用的产品以及导入前校验要求不同,请根据载入模板对话框的内容指引配置并导入即可。

教程列表

DataWorks当前支持的ETL工作流模板列表如下:

说明

ETL工作流模板载入数据开发模块后,您可通过查看虚拟节点(业务流程第一个节点)查看案例详情。

教程(点击链接快速体验)

涉及产品

涉及模块

DataWorks版本要求

模板描述

网站用户行为分析

  • DataWorks

  • MaxCompute

  • MYSQL(无须开通)

  • OSS(无须开通)

  • 数据集成

  • 数据开发

基础版

揭秘用户行为,驱动业务增长!该案例将通过数据分析技术,解析用户访问日志,结合用户信息,获取用户画像,并自动更新用户画像,实现网站的精细化运营。

案例配套文档:简单用户画像分析(MaxCompute版)

GitHub十大热门编程语言

  • DataWorks

  • MaxCompute

  • 函数计算

  • OSS

  • 数据集成

  • 数据开发

基础版

基于GitHub Archive公开数据集,通过DataWorks数据集成模块获取过去1小时GitHub中提交次数最多的代码语言数据,在DataStudio数据开发模块通过函数计算节点周期调度实现将处理后的数据发送至用户预设的邮箱中。

案例配套文档:通过函数计算节点实现GitHub实时数据分析与结果发送

电商漏斗模型分析

  • DataWorks

  • MaxCompute

数据开发

基础版

基于漏斗模型,使用DataStudio数据开发模块完成从原始数据获取购买商品的用户路径数据,并计算从用户的浏览、点击、购买环节流量的转化情况。

赋值节点应用

  • DataWorks

  • MaxCompute

数据开发

标准版及以上版本

DataStudio数据开发模块的赋值节点支持ODPS SQL、Shell和Python三种赋值语言,通过赋值节点实现将上游节点任务的查询或输出结果提供给下游节点使用。

案例配套文档:赋值节点

智慧城市人口财产主题分析

  • DataWorks

  • MaxCompute

数据开发

基础版

以人口、房产等相关数据整合与人口特征提取为例,使用DataStudio数据开发模块。通过数据加工处理,并设置调度策略,实现数据处理的自动化,从而向您展示智慧城市项目下数据加工的整个过程。

拉链表实现

  • DataWorks

  • MaxCompute

  • 数据开发

  • 运维中心

基础版

基于DataWorks on MaxCompute实现拉链存储场景,使用DataStudio数据开发运维中心模块,实现拉链数据加载功能,记录电商订单从开始到当前状态(创建/支付/完成)所有变化信息。

案例配套文档:基于MaxCompute实现拉链表

清理与释放

体验完成后,您可参考以下文档删除当前案例所生成的资源。

相关文档