课程介绍
本课程以在线博客网站数据为例,通过 Python 数据分析解决一些业务问题,哪些国家的用户最多,星期几的访客量最大,哪些区域贡献的点击量最多等等,将结构通过可视化的方式展示出来,更直观的理解业务的数据。课程中涵盖 Python Pandas 本地数据读取,数据清洗,数据分析以及可视化的基本函数和操作,为在分布式 Spark SQL,云上 MaxCompute Python SDK 数据开发环境变成打基础。
适合人群
初级开发人员和云初学者
考试
-
认证:Apsara Clouder—大数据:Python 结构化数据处理入门
-
考试类型:线上
-
语言:英文
-
考试时间:30 Minutes
-
考试机会:2次
相关课题
Python Pandas 以及实验场景介绍
不同数据格式导入(CSV JSON)
原始数据问题分析
数据清洗步骤
数据分析与可视化
处理多个数据集