Files
team-learning-data-mining/FinancialRiskControl/readme.md
2020-10-10 17:45:12 +08:00

56 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 数据挖掘实践(金融风控)
## 基本信息
- 贡献人员:王贺、杨冰楠、陶旭东、吴争光、苏鹏、王程伟、担扬杰、成森、陈长沙、刘雯静
- 学习周期14天
- 学习形式:理论学习 + 练习
- 人群定位有一定数据分析与python编程的基础。
- 先修内容:[Python编程语言](https://github.com/datawhalechina/team-learning-program/tree/master/PythonLanguage)[动手学数据分析](https://github.com/datawhalechina/hands-on-data-analysis)
- 难度系数:中
## 任务安排
### Task1 赛题理解 2天
- 理解赛题数据和目标,清楚评分体系。
- 完成赛题报名和数据下载,理解赛题的解题思路。
### Task2 探索性数据分析EDA3天
- EDA的价值主要在于熟悉数据集了解数据集对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。
- 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。
- 引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。
- 完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。
### Task3 特征工程 3天
- 对于特征进行进一步分析,并对于数据进行处理。
- 完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。
### Task4 建模与调参 3天
- 了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程。
- 完成相应学习打卡任务。
### Task5 模型融合 3天
- 对于多种调参完成的模型进行模型融合。
- 完成对于多种模型的融合,提交融合结果并打卡。
## 学习视频
### 第1讲赛题理解baseline讲解
- 主讲人鱼佬王贺武汉大学计算机硕士天池数据科学家2019和2020腾讯广告算法冠军
- 链接https://tianchi.aliyun.com/course/video?liveId=41203
### 第2讲数据探索性分析和特征工程
- 主讲人:言溪(陶旭东):北京师范大学硕士 ,算法工程师
- 链接https://tianchi.aliyun.com/course/live?liveId=41204
### 第3讲建模调参模型融合
- 主讲人小一吴争光Datawhale成员金融风控爱好者数据分析工程师
- 链接https://tianchi.aliyun.com/course/live?liveId=41206