75 lines
3.1 KiB
Markdown
75 lines
3.1 KiB
Markdown
# 数据挖掘实战(异常检测)
|
||
|
||
## 贡献者信息
|
||
|
||
| 姓名 | 介绍 | 个人主页 |
|
||
| -------------------- | ----------------------------------- | ----------------------------------------- |
|
||
| 梁家晖 | 华南理工大学广州学院,Datawhale成员 | https://github.com/leungkafai |
|
||
| 李玲 | Datawhale成员 | https://www.zhihu.com/people/liu-yu-18-38 |
|
||
| 李芝翔 | 华北电力大学,Datawhale成员 | https://blog.csdn.net/weixin_39940512 |
|
||
| 赵可 | 国家电网,Datawhale成员 | |
|
||
| 陈信达【运营,群主】 | 华北电力大学,Datawhale成员 | |
|
||
|
||
|
||
|
||
## 基本信息
|
||
|
||
- 贡献人员:**梁家晖**,李玲,李芝翔,赵可,陈信达
|
||
- 学习周期:15天,每天平均花费时间2小时-5小时不等,根据个人学习接受能力强弱有所浮动。
|
||
- 学习形式:理论+实践
|
||
- 人群定位:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学员。
|
||
- 先修内容:[Python编程语言](https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language)、[编程实践(Numpy)](https://github.com/datawhalechina/team-learning-program/tree/master/IntroductionToNumpy)、[编程实践(Pandas)](https://github.com/datawhalechina/team-learning-program/tree/master/IntroductionToPandas)、[编程实践(数据可视化)](https://github.com/datawhalechina/fantastic-matplotlib)
|
||
|
||
|
||
|
||
## 学习目标
|
||
|
||
理解传统的异常检测方法原理,并具备基本的调用相应python库进行操作的能力。
|
||
|
||
|
||
|
||
## 任务安排
|
||
|
||
|
||
|
||
### Task00:熟悉规则(1天)
|
||
|
||
- 组队、修改群昵称
|
||
- 熟悉打卡规则。
|
||
|
||
### Task01:异常检测介绍(2天)
|
||
|
||
* 了解异常检测基本概念
|
||
* 了解异常检测基本方法
|
||
|
||
### Task02:基于统计学的方法(3天)
|
||
|
||
* 掌握基于高斯分布的异常检测方法
|
||
* 理解非参数异常检测方法
|
||
* 掌握HBOS算法
|
||
|
||
### Task03:线性模型(3天)
|
||
|
||
* 理解线性回归
|
||
* 掌握主成分分析的异常检测方法
|
||
|
||
### Task04:基于相似度的方法(3天)
|
||
|
||
* 理解基于距离的异常检测方法
|
||
* 掌握基于密度的LOF算法
|
||
|
||
### Task05:高维异常检测(3天)
|
||
|
||
* 了解集成方法的思想
|
||
* 理解feature bagging原理
|
||
|
||
* 掌握孤立森林算法
|
||
|
||
|
||
|
||
|
||
**关于Datawhale**:
|
||
|
||
>Datawhale是一个专注于数据科学与AI领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale以“for the learner,和学习者一起成长”为愿景,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。
|
||
|
||
|