Files
fun-rec/RecommendationSystemFundamentals
2020-11-19 18:38:44 +08:00
..
2020-10-11 09:52:52 +08:00
2020-10-11 09:52:52 +08:00
2020-10-11 09:52:52 +08:00
2020-10-11 09:52:52 +08:00
2020-10-11 09:52:52 +08:00
2020-10-11 09:52:52 +08:00
2020-10-11 09:52:52 +08:00
2020-11-19 18:38:44 +08:00

推荐系统基础

基本信息

  • 学习周期12天
  • 学习形式:理论学习 + 练习
  • 人群定位对机器学习有一定的了解会使用常见的数据分析工具NumpyPandas了解向量检索工具faiss的学习者。
  • 先修内容:Python编程语言编程实践Pandas编程实践Numpy
  • 难度系数:中

学习目标

本次课程是由Datawhale推荐系统小组内部成员共同完成是针对推荐系统小白的一入门课程。学习本课程需要学习者对机器学习有一定的了解会使用常见的数据分析工具NumpyPandas了解向量检索工具faiss

本次课程内容的设计参考了项亮老师的《推荐系统实践》、王喆老师的《深度学习推荐系统》以及大量的技术博客,选择了在推荐系统算法发展中比较重要的几个算法作为本次课程的核心内容,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者们深刻理解推荐算法的本质。除此之外,每个算法都会在一个完整的数据集上从头到尾的重新把算法实现一遍,以便于学习者们可以快速的使用这些算法。在这些完整的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。

传统推荐系统及深度学习推荐系统的演化关系图(图来自《深度学习推荐系统》)

传统推荐系统:

深度学习推荐系统:

本开源内容的目标是掌握以下算法:

  • 协同过滤算法
  • 矩阵分解算法
  • FMFactorization Machines算法
  • Wide&Deep
  • GBDT+LR

推荐系统组队学习内容汇总:

任务安排

Task01推荐系统简介1天

了解推荐系统常用的评测指标、召回的策略和作用等。

Task02协同过滤3天

掌握协同过滤算法包括基于用户的协同过滤UserCF和基于商品的协同过滤ItemCF这是入门推荐系统的人必看的内容因为这些算法可以让初学者更加容易的理解推荐算法的思想。

Task03矩阵分解和FM3天

掌握矩阵分解和FM算法。

矩阵分解算法通过引入了隐向量的概念加强了模型处理稀疏矩阵的能力也为后续深度学习推荐系统算法中Embedding的使用打下了基础。

FMFactorization Machines算法属于对逻辑回归LR算法应用在推荐系统上的一个改进在LR模型的基础上加上了特征交叉项该思想不仅在传统的推荐算法中继续使用过在深度学习推荐算法中也对其进行了改进与应用。

Task04Wide&Deep2天

从深度学习推荐系统的演化图中可以看出Wide&Deep模型处在最中间的位置可以看出该模型在推荐系统发展中的重要地位此外该算法模型的思想与实现都比较的简单非常适合初学深度学习推荐系统的学习者们去学习。

Task05GBDT+LR3天

该模型仍然是对LR模型的改进使用树模型做特征交叉相比于FM的二阶特征交叉树模型可以对特征进行深度的特征交叉充分利用了特征之间的相关性。


贡献人员

姓名 博客 备注
何世福 大连理工大学研究生
罗如意 个人网站 西安电子科技大学研究生
吴忠强 CSDN 东北大学研究生
徐何军 Github 华中科技大学研究生
陈锴 个人网站 中山大学本科生
梁家晖 微信公众号:可能好玩