Files
team-learning-data-mining/AnomalyDetection/readme.md
2021-01-05 18:00:49 +08:00

75 lines
3.1 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters
This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 数据挖掘实战(异常检测)
## 贡献者信息
| 姓名 | 介绍 | 个人主页 |
| -------------------- | ----------------------------------- | ----------------------------------------- |
| 梁家晖 | 华南理工大学广州学院Datawhale成员 | https://github.com/leungkafai |
| 李玲 | Datawhale成员 | https://www.zhihu.com/people/liu-yu-18-38 |
| 李芝翔 | 华北电力大学Datawhale成员 | https://blog.csdn.net/weixin_39940512 |
| 赵可 | 国家电网Datawhale成员 | |
| 陈信达【运营,群主】 | 华北电力大学Datawhale成员 | |
## 基本信息
- 贡献人员:**梁家晖**,李玲,李芝翔,赵可,陈信达
- 学习周期15天每天平均花费时间2小时-5小时不等根据个人学习接受能力强弱有所浮动。
- 学习形式:理论+实践
- 人群定位:熟悉数据挖掘的基本方法,对学习异常检测算法有需求的学员。
- 先修内容:[Python编程语言](https://github.com/datawhalechina/team-learning-program/tree/master/Python-Language)、[编程实践Numpy](https://github.com/datawhalechina/team-learning-program/tree/master/IntroductionToNumpy)、[编程实践Pandas](https://github.com/datawhalechina/team-learning-program/tree/master/IntroductionToPandas)、[编程实践(数据可视化)](https://github.com/datawhalechina/fantastic-matplotlib)
## 学习目标
理解传统的异常检测方法原理并具备基本的调用相应python库进行操作的能力。
## 任务安排
### Task00熟悉规则1天
- 组队、修改群昵称
- 熟悉打卡规则。
### Task01异常检测介绍2天
* 了解异常检测基本概念
* 了解异常检测基本方法
### Task02基于统计学的方法3天
* 掌握基于高斯分布的异常检测方法
* 理解非参数异常检测方法
* 掌握HBOS算法
### Task03线性模型3天
* 理解线性回归
* 掌握主成分分析的异常检测方法
### Task04基于相似度的方法3天
* 理解基于距离的异常检测方法
* 掌握基于密度的LOF算法
### Task05高维异常检测3天
* 了解集成方法的思想
* 理解feature bagging原理
* 掌握孤立森林算法
**关于Datawhale**
>Datawhale是一个专注于数据科学与AI领域的开源组织汇集了众多领域院校和知名企业的优秀学习者聚合了一群有开源精神和探索精神的团队成员。Datawhale以“for the learner和学习者一起成长”为愿景鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。