Files
2020-11-17 14:30:34 +08:00
..
2020-11-17 14:30:34 +08:00

动手学数据分析

开源内容:https://github.com/datawhalechina/hands-on-data-analysis

基本信息

  • 学习周期10天每天学习3~5个小时
  • 学习形式使用jupyter完成课程版块的内容并做笔记或者写博客。
  • 人群定位懂一些python希望入门数据分析的学习者。
  • 先修内容:Python编程语言编程实践Pandas
  • 难度系数:低

学习目标

了解数据分析中基本库的操作比如pandas,numpy和matplotlib熟悉数据分析的操作流程建立数据分析思维入门数据建模。

任务安排

Task01数据加载及探索性数据分析2天

  • 了解数据加载以及数据观察
  • 掌握pandas基础
  • 完成探索性数据分析

主要学习内容是:课程的第一章

Task02数据清洗及特征处理2天

  • 掌握数据清洗的方法
  • 了解特征观察与处理

主要学习内容是:课程的第二章的第一部分(数据清洗及特征处理)

Task03数据重构2天

  • 了解数据重构的方法
  • 使用groupby做数据运算

主要学习内容是:课程的第二章第二和第三部分(数据重构)

Task04数据可视化2天

  • 了解可视化的目的
  • 知道各种图形可用于的场景
  • 实战数据可视化的基本库

主要学习内容是:课程的第二章第四部分(数据可视化)

Task05数据建模及模型评估2天

  • 了解数据建模
  • 使用sklearn完成分类模型的建模
  • 了解模型评估
  • 使用sklearn完成模型评估

主要学习内容是:课程的第三章(数据建模及模型评估)


贡献人员

姓名 博客 备注
陈安东 GitHub知乎 中央民族大学研究生
金娟娟 知乎 浙江大学硕士 业务与数据分析师
李玲 知乎 算法工程师
老表 微信公众号简说Python 数据分析爱好者
杨佳达 Github 数据挖掘师
张文涛 Github 中山大学博士研究生
高立业 Github 太原理工大学研究生