Files
team-learning-data-mining/HandsOnDataAnalysis/readme.md
2020-11-17 14:30:34 +08:00

75 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 动手学数据分析
开源内容https://github.com/datawhalechina/hands-on-data-analysis
## 基本信息
- 学习周期10天每天学习3~5个小时
- 学习形式使用jupyter完成课程版块的内容并做笔记或者写博客。
- 人群定位懂一些python希望入门数据分析的学习者。
- 先修内容:[Python编程语言](https://github.com/datawhalechina/team-learning-program/tree/master/PythonLanguage)[编程实践Pandas](https://github.com/datawhalechina/joyful-pandas)
- 难度系数:低
## 学习目标
了解数据分析中基本库的操作比如pandas,numpy和matplotlib熟悉数据分析的操作流程建立数据分析思维入门数据建模。
## 任务安排
### Task01数据加载及探索性数据分析2天
- 了解数据加载以及数据观察
- 掌握pandas基础
- 完成探索性数据分析
*主要学习内容是*:课程的第一章
### Task02数据清洗及特征处理2天
- 掌握数据清洗的方法
- 了解特征观察与处理
*主要学习内容是*:课程的第二章的第一部分(数据清洗及特征处理)
### Task03数据重构2天
- 了解数据重构的方法
- 使用groupby做数据运算
*主要学习内容是*:课程的第二章第二和第三部分(数据重构)
### Task04数据可视化2天
- 了解可视化的目的
- 知道各种图形可用于的场景
- 实战数据可视化的基本库
*主要学习内容是*:课程的第二章第四部分(数据可视化)
### Task05数据建模及模型评估2天
- 了解数据建模
- 使用sklearn完成分类模型的建模
- 了解模型评估
- 使用sklearn完成模型评估
*主要学习内容是*:课程的第三章(数据建模及模型评估)
---
# 贡献人员
姓名 | 博客|备注
---|---|---
陈安东|[GitHub](https://github.com/andongBlue)[知乎](https://www.zhihu.com/people/wang-ya-fei-48)|中央民族大学研究生
金娟娟|[知乎](https://www.zhihu.com/people/wu-shi-lan-xiao-wang-zi)|浙江大学硕士 业务与数据分析师
李玲|[知乎](https://www.zhihu.com/people/liu-yu-18-38)|算法工程师
老表|微信公众号简说Python|数据分析爱好者
杨佳达|[Github](https://github.com/yangjiada)|数据挖掘师
张文涛|[Github](https://github.com/Fatflower)|中山大学博士研究生
高立业|[Github](https://github.com/0-yy-0)|太原理工大学研究生