Files
2022-04-01 19:38:57 +08:00
..
2021-12-13 17:49:50 +08:00
2022-03-31 19:25:15 +08:00
2022-03-19 21:42:12 +08:00
2022-03-19 21:42:12 +08:00
2022-03-31 19:26:10 +08:00

FunRec

本教程主要是针对具有机器学习基础并想找推荐算法岗位的同学。教程内容由推荐系统概述、推荐算法基础、推荐系统实战和推荐系统面经四个部分组成。本教程对于入门推荐算法的同学来说,可以从推荐算法的基础到实战再到面试,形成一个闭环。每个部分的详细内容如下:

  • 推荐系统概述。 这部分内容会从推荐系统的意义及应用,到架构及相关的技术栈做一个概述性的总结,目的是为了让初学者更加了解推荐系统。
  • 推荐系统算法基础。 这部分会介绍推荐系统中对于算法工程师来说基础并且重要的相关算法,如经典的召回、排序算法。随着项目的迭代,后续还会不断的总结其他的关键算法和技术,如重排、冷启动等。
  • 推荐系统实战。 这部分内容包含推荐系统竞赛实战和新闻推荐系统的实践。其中推荐系统竞赛实战是结合阿里天池上的新闻推荐入门赛做的相关内容。新闻推荐系统实践是实现一个具有前后端交互及整个推荐链路的项目该项目是一个新闻推荐系统的demo没有实际的商业化价值。
  • 推荐系统算法面经。 这里会将推荐算法工程师面试过程中常考的一些基础知识、热门技术等面经进行整理,方便同学在有了一定推荐算法基础之后去面试,因为对于初学者来说只有在公司实习学到的东西才是最有价值的。

项目在Datawhale的组队学习过程中不断的迭代和优化通过大家的反馈来修正或者补充相关的内容如果对项目内容设计有更好的意见欢迎给我们反馈。为了方便学习和交流建了一个fun-rec微信交流群由于微信群的二维码只有7天内有效所以直接加下面这个微信备注Fun-Rec会被拉到Fun-Rec交流群。

内容导航

推荐系统概述

  • 推荐系统的意义【未完成】
  • 推荐系统的应用【未完成】
  • 推荐系统的架构【未完成】
  • 推荐系统技术栈【未完成】

推荐系统算法基础

经典召回模型

  • 基于协同过滤的召回
    • UserCF【已完成待优化】
    • ItemCF【已完成待优化】
    • Swing(Graph-based)【未完成】
    • 矩阵分解系列(ALS,SVD++)【已完成,待优化】
  • 基于向量的召回
    • FM召回【未完成】
    • word2vec召回
      • word2vec原理【未完成】
      • Airbnb召回【未完成】
    • YoutubeDNN召回【完成一半待优化】
    • 双塔召回
      • 经典双塔【未完成】
      • Youtube双塔【未完成】
      • MOBIUS【未完成】
    • 图召回
      • EGES【完成一半待优化】
      • PinSAGE【未完成】
    • 序列召回
      • MIND【已完成待优化】
      • SDM【完成一半待优化】
  • 树模型召回
    • TDM【未完成】

经典排序模型

  • GBDT+LR【已完成】
  • 特征交叉
    • FM【已完成】
    • PNN【已完成】
    • DCN【已完成】
    • AutoInt【完成一半待优化】
    • FiBiNET【完成一半待优化】
  • WideNDeep系列
    • Wide&Deep【已完成】
    • 改进Deep侧
      • NFM【已完成】
      • AFM【已完成】
    • 改进Wide侧
      • DeepFM【已完成】
      • xDeepFM【未完成】
  • 序列模型
    • DIN【已完成】
    • DIEN【完成一半待优化】
    • DISN【未完成】
    • BST【未完成】
  • 多任务学习
    • SharedBottom【已完成待优化】
    • ESSM【已完成待优化】
    • MMOE【已完成待优化】
    • PLE【已完成待优化】

推荐系统实战

竞赛实践(天池入门赛-新闻推荐)

  • 入门赛讲解视频【已完成】
  • 赛题理解&Baseline【已完成】
  • 数据分析【已完成】
  • 多路召回【已完成】
  • 特征工程【已完成】
  • 排序模型&模型融合【已完成】

新闻推荐系统实践

  • 新闻推荐系统流程的构建视频讲解【已完成】
  • 离线物料系统的构建
    • Mysql基础【已完成】
    • MongoDB基础【已完成】
    • Redis基础【已完成】
    • Scrapy基础及新闻爬取实战【已完成】
    • 自动化构建用户及物料画像【已完成】
  • 前后端基础及交互
    • 前端基础及Vue实战【已完成】
    • flask简介及基础【已完成】
    • 前后端交互【已完成】
  • 推荐流程的构建【已完成】
  • 召回
    • 规则类召回
      • 热度召回【完成一半,待优化】
      • 地域召回【完成一半,待优化】
    • 模型类召回
      • YoutubeDNN召回【已完成待优化】
      • DSSM召回【已完成待优化】
  • DeepFM排序模型【已完成待优化】
  • 规则与重排【完成一半,待优化】
  • 任务监控与调度【完成一半,待优化】

推荐系统算法面经

  • ML与DL基础【已完成待优化】
  • 推荐模型相关【已完成,待优化】
  • 热门技术相关【已完成,待优化】
  • 业务场景相关【已完成,待优化】

致谢

成员 个人简介及贡献 个人主页
罗如意 Datawhale成员西安电子科技大学硕士项目负责人, 核心贡献者 Github
吴忠强 Datawhale成员东北大学硕士CSDN博客专家核心贡献者 CSDN
何世福 Datawhale成员算法工程师课程设计及内容审核
徐何军 Datawhale成员算法工程师内容审核
李万业 Datawhale成员同济大学硕士新闻推荐入门赛贡献部分内容
陈琰钰 Datawhale成员清华大学硕士新闻推荐入门赛贡献部分内容
陈锴 Datawhale成员中山大学本科推荐算法基础贡献部分内容
梁家晖 Datawhale成员公众号可能好玩基础推荐算法贡献部分内容
王贺 Datawhale成员算法工程师新闻推荐入门赛赛题设计者 鱼遇雨欲语与余
宁彦吉 Datawhale成员算法工程师深度推荐模型章节贡献部分内容
田雨 Datawhale成员武汉大学硕士深度推荐模型章节贡献部分内容
赖敏材 Datawhale成员上海科技大学硕士深度模型及面经贡献部分内容
汪志鸿 Datawhale意向成员东北大学硕士新闻推荐系统实践贡献部分内容
王辰玥 Datawhale意向成员中国地质大学新闻推荐系统实践前端负责人
唐鑫 Datawhale意向成员西安电子科技大学硕士机器学习基础贡献部分内容
宋禹成 Datawhale意向成员东北大学硕士新闻推荐系统贡献部分内容

感谢Datawhale成员刘雯静、吕豪杰及意向成员张汉隆、吴丹飞、王云川、肖桐、管柯琴、陈雨龙和宋禹成等人在开源项目组队学习中担任助教时的辛苦付出

关注我们

扫描下方二维码关注公众号Datawhale

LICENSE

知识共享许可协议 本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。