75 lines
2.4 KiB
Markdown
75 lines
2.4 KiB
Markdown
# 动手学数据分析
|
||
|
||
开源内容:https://github.com/datawhalechina/hands-on-data-analysis
|
||
|
||
|
||
|
||
|
||
## 基本信息
|
||
|
||
- 学习周期:10天,每天学习3~5个小时
|
||
- 学习形式:使用jupyter完成课程版块的内容,并做笔记或者写博客。
|
||
- 人群定位:懂一些python,希望入门数据分析的学习者。
|
||
- 先修内容:[Python编程语言](https://github.com/datawhalechina/team-learning-program/tree/master/PythonLanguage),[编程实践(Pandas)](https://github.com/datawhalechina/joyful-pandas)
|
||
- 难度系数:低
|
||
|
||
|
||
|
||
|
||
## 学习目标
|
||
|
||
了解数据分析中基本库的操作(比如:pandas,numpy和matplotlib);熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。
|
||
|
||
## 任务安排
|
||
|
||
|
||
### Task01:数据加载及探索性数据分析(2天)
|
||
- 了解数据加载以及数据观察
|
||
- 掌握pandas基础
|
||
- 完成探索性数据分析
|
||
|
||
*主要学习内容是*:课程的第一章
|
||
|
||
### Task02:数据清洗及特征处理(2天)
|
||
- 掌握数据清洗的方法
|
||
- 了解特征观察与处理
|
||
|
||
*主要学习内容是*:课程的第二章的第一部分(数据清洗及特征处理)
|
||
|
||
### Task03:数据重构(2天)
|
||
- 了解数据重构的方法
|
||
- 使用groupby做数据运算
|
||
|
||
*主要学习内容是*:课程的第二章第二和第三部分(数据重构)
|
||
|
||
### Task04:数据可视化(2天)
|
||
- 了解可视化的目的
|
||
- 知道各种图形可用于的场景
|
||
- 实战数据可视化的基本库
|
||
|
||
*主要学习内容是*:课程的第二章第四部分(数据可视化)
|
||
|
||
### Task05:数据建模及模型评估(2天)
|
||
- 了解数据建模
|
||
- 使用sklearn完成分类模型的建模
|
||
- 了解模型评估
|
||
- 使用sklearn完成模型评估
|
||
|
||
*主要学习内容是*:课程的第三章(数据建模及模型评估)
|
||
|
||
|
||
---
|
||
# 贡献人员
|
||
|
||
|
||
姓名 | 博客|备注
|
||
---|---|---
|
||
陈安东|[GitHub](https://github.com/andongBlue),[知乎](https://www.zhihu.com/people/wang-ya-fei-48)|中央民族大学研究生
|
||
金娟娟|[知乎](https://www.zhihu.com/people/wu-shi-lan-xiao-wang-zi)|浙江大学硕士 业务与数据分析师
|
||
李玲|[知乎](https://www.zhihu.com/people/liu-yu-18-38)|算法工程师
|
||
老表|微信公众号:简说Python|数据分析爱好者
|
||
杨佳达|[Github](https://github.com/yangjiada)|数据挖掘师
|
||
张文涛|[Github](https://github.com/Fatflower)|中山大学博士研究生
|
||
高立业|[Github](https://github.com/0-yy-0)|太原理工大学研究生
|
||
|