diff --git a/docs/README.md b/docs/README.md
index 42ad147e..8c0a93d7 100644
--- a/docs/README.md
+++ b/docs/README.md
@@ -119,10 +119,12 @@
- 任务监控与调度【完成一半,待优化】
### 推荐系统算法面经
- - ML与DL基础【已完成】
- - 推荐模型相关【已完成】
- - 热门技术相关【已完成】
- - 业务场景相关【已完成】
+ - [ML与DL基础](/推荐系统算法面经/ML与DL基础)
+ - [推荐模型相关](/推荐系统算法面经/推荐模型相关)
+ - [热门技术相关](/推荐系统算法面经/热门技术相关)
+ - [业务场景相关](/推荐系统算法面经/业务场景相关)
+ - [HR及其他](/推荐系统算法面经/HR及其他)
+
## 致谢
diff --git a/docs/推荐算法面经/HR及其他.md b/docs/推荐算法面经/HR及其他.md
index a1713ef1..c8c22258 100644
--- a/docs/推荐算法面经/HR及其他.md
+++ b/docs/推荐算法面经/HR及其他.md
@@ -1,54 +1,50 @@
# HR及其他
-
-
-
### 工程相关
-1. java语言怎么样
-2. 大数据有没有做过
-3. 项目中最大的难点
-4. tensor(1, 2) 和tensor(2)有什么区别
-5. tensorflow loss NAN一般可能原因,怎么解决
-6. tensorflow debug工具
-7. python yield
-8. mapreduce用过嘛
-9. 撕代码itemcf
-10. 按召回原因计算点击率(用pandas)
-11. 大数据这块工具会用么
-12. python内存管理:引用计数,垃圾回收,分代回收
-13. 引用计数有什么缺点
-14. C++智能指针
-15. 并发,多线程通信
-16. python多线程,多进程适合IO密集型,计算密集型
-17. 堆栈的区别
-18. 内存分配
-19. new delete
-20. tensorflow的框架理念
-
+- java语言怎么样
+- 大数据有没有做过
+- 项目中最大的难点
+- tensor(1, 2) 和tensor(2)有什么区别
+- tensorflow loss NAN一般可能原因,怎么解决
+- tensorflow debug工具
+- python yield
+- mapreduce用过嘛
+- 撕代码itemcf
+- 按召回原因计算点击率(用pandas)
+- 大数据这块工具会用么
+- python内存管理:引用计数,垃圾回收,分代回收
+- 引用计数有什么缺点
+- C++智能指针
+- 并发,多线程通信
+- python多线程,多进程适合IO密集型,计算密集型
+- 堆栈的区别
+- 内存分配
+- new delete
+- tensorflow的框架理念
### HR相关
-1. 期望薪资
-2. 意向城市
-3. 未来规划
-4. 自己的优缺点
-5. 有么有跟进最新论文
-6. 自我介绍
-7. 工作期望
-8. 薪资
-9. 对公司的看法
-10. 导师是谁,做什么方向
-11. 目前的offer和进展中的公司,这几个公司的优先级
-12. 怎么选择工作岗位
-13. 团队背景,构成,分工,协调
-14. 技术关注渠道,怎么学习技术
-15. 性格,最成功的事,最大的挫折
-16. 为什么选择上海,北京不够好嘛
-17. 本科毕业到研究生入学期间做了什么
-18. 实验室项目情况,怎么分工和沟通,有没有出现过摩擦或争执,怎么解决的
-19. 竞赛中有什么影响比较深的挫折,经历了之后收获了是什么
-20. 你认为你现在对这个工作岗位的优势有什么?有什么不足呢
-21. 对第一份工作岗位有什么期待
-22. 现在有什么offer,或者在面试流程中的公司,薪资怎么样,对上面几家公司,哪个和之前做的更匹配
-23. 对于互联网产品有什么想法嘛,新的项目有什么看法
\ No newline at end of file
+- 期望薪资
+- 意向城市
+- 未来规划
+- 自己的优缺点
+- 有么有跟进最新论文
+- 自我介绍
+- 工作期望
+- 薪资
+- 对公司的看法
+- 导师是谁,做什么方向
+- 目前的offer和进展中的公司,这几个公司的优先级
+- 怎么选择工作岗位
+- 团队背景,构成,分工,协调
+- 技术关注渠道,怎么学习技术
+- 性格,最成功的事,最大的挫折
+- 为什么选择上海,北京不够好嘛
+- 本科毕业到研究生入学期间做了什么
+- 实验室项目情况,怎么分工和沟通,有没有出现过摩擦或争执,怎么解决的
+- 竞赛中有什么影响比较深的挫折,经历了之后收获了是什么
+- 你认为你现在对这个工作岗位的优势有什么?有什么不足呢
+- 对第一份工作岗位有什么期待
+- 现在有什么offer,或者在面试流程中的公司,薪资怎么样,对上面几家公司,哪个和之前做的更匹配
+- 对于互联网产品有什么想法嘛,新的项目有什么看法
\ No newline at end of file
diff --git a/docs/推荐算法面经/ML与DL基础.md b/docs/推荐算法面经/ML与DL基础.md
index d3bcae50..4409890e 100644
--- a/docs/推荐算法面经/ML与DL基础.md
+++ b/docs/推荐算法面经/ML与DL基础.md
@@ -1,137 +1,73 @@
-# 3.1 机器学习相关
+# 机器学习相关
-## 3.1.1 机器学习
+## 机器学习
- 介绍一个最熟悉的机器学习算法
-
- 决策树怎么建树,基尼系数公式
-
- Adaboost拟合目标是什么
-
- Adaboost介绍一下,每个基学习器的权重怎么得到的
-
- 介绍下GBDT
-
- 介绍XGBoost
-
- 介绍下LightGBM
-
- LightGBM相对于XGBoost的改进
-
- GBDT中的梯度是什么,怎么用
-
- GBDT如何计算特征重要性
-
- GBDT讲一下,GBDT拟合残差,是真实的误差嘛,在什么情况下看做是真实的误差
-
- 介绍XGBoost中的并行
-
- 介绍XGBoost中精确算法与近似算法
-
- XGBoost如何处理空缺值,为何要进行行采样、列采样
-
- 讲一下xgboost算法,xgboost是如何处理离散特征的,xgb怎么训练,xgb算法优点,怎么选特征,主要参数有哪些,xgb的特征重要性怎么看
-
- xgboost介绍一下,xgb对目标函数二阶泰勒展开,哪个是x,哪个是delta x, 一阶导和二阶导是对谁求得
-
- 为什么高维稀疏数据,LR比GBDT要好
-
- 随机森林与GBDT采样的区别
-
- 随机森林中列采样的作用
-
- bagging与boosting对比, boosting和bagging的区别及分别适用于什么场景
-
- bagging与boosting分别从什么角度降低过拟合
-
- 逻辑回归如何避免过拟合
-
- 推导逻辑回归损失函数和损失函数求导
-
- 正则化项L1和L2为什么有用
-
- l1正则不可导,如何优化
-
- 什么样的特征容易产生比较小的权重
-
- 随机森林采样n次,n趋于无穷大,oob样本的概率接近于?
-
- 逻辑回归与树模型的优缺点
-
- 对于高维稀疏数据,树模型能训练吗?一般怎么处理
-
- 树模型一般有哪些参数,分别有什么作用
-
- 随机森林如何处理空缺值
-
- 介绍kmeans,与其他聚类算法的对比
-
- 机器学习导致误差的原因?过拟合、欠拟合对应的偏差和方差是怎样的?
-
- 如何解决过拟合问题?哪些角度
-
- LR的原理,问题的假设,为什么用交叉熵作为损失函数
-
- LR损失函数写一下
-
- LR是不是凸优化问题,如何判断LR达到最优值
-
- LR一般用什么数据,一般有什么特点(离散数据,离散化的一堆优点)
-
- LR,SVM, xgboost如何防止过拟合
-
- lr和树模型,离散特征和连续特征分别怎么处理
-
- lr和线性回归的区别
-
- 连续特征可以直接输入到lr中不? (归一化和标准化有什么区别)
-
- 线性回归可以求闭式解,逻辑回归可以吗,为什么,LR用什么求解参数,为什么要用梯度下降算法
-
- SVM和LR的区别
-
- SVM的公式会推导嘛,SVM的损失函数
-
- SVM原理,为什么求最大间隔,为什么用核函数,常见的核函数及区别
-
- SVM支持向量怎么得到的
-
- 写一下SVM的原问题和对偶问题,分别解释一下
-
- SVM核函数有什么性质,写一下SVM核化的形式
-
- 无监督学习,半监督学习,有监督学习的区别
-
- 有哪些无监督学习的方法(kmeans,pca,生成模型,自编码器)
-
- 有哪些回归模型(多项式回归,树模型,svr, 神经网络)
-
- 生成模型、判别模型的区别
-
- 概率和似然的区别
-
- 最大似然估计和后验概率的区别,分别用LR来推导损失函数的话有什么区别(乘以W的先验概率)
-
- 朴素贝叶斯介绍,朴素贝叶斯公式,为什么朴素
-
- l1,l2特性及原理,分别适用于那些场合
-
- 给一个多峰数据场景,为什么l2不适合,可以怎么解决
-
- 讲讲Kmeans、EM算法
-
- 机器学习中怎么解决过拟合,DNN中怎么解决
-
- 说一下SVD怎么降维
-
- 推导softmax做激活函数求导
-
- LR,SVM,xgb哪个对样本不平衡不太敏感,顺便把SVM和xgb介绍了
-
- 降维方法了解嘛,PCA? 为什么取特征值前k大的对应的特征向量组成的矩阵?低秩表示
-
-## 3.1.2 深度学习
+## 深度学习
- 梯度是什么,hessian矩阵怎么求
- 有没有上过凸优化的课程,如何判断凸函数
@@ -166,8 +102,7 @@
- 深度模型和传统机器学习模型对数据量的要求,什么场景用什么模型
-
-## 3.1.3 特征工程
+## 特征工程
- 特征工程一般怎么做
- 特征数值分布比较稀疏如何处理
- 正负样本不均衡如何处理
@@ -181,8 +116,7 @@
- 如果不使用最近邻检索的库,你会怎么做最近邻检索
-
-## 3.1.4 评估指标
+## 评估指标
- auc的含义和计算方法, 有没有更快的计算方法
- AUC会不会出现小于0.5的情况,出现了怎么调bug
@@ -200,14 +134,11 @@
- 分类评价指标,TPR,FPR等的含义
-
-
-
## 参考解析
(解析仅供参考,如果有错误、补充或者建议欢迎Issue,部分方向题目笔者还不熟悉不确定答案的没有更新)
-#### 3.1.5.1 机器学习
+#### 机器学习
- 介绍一个最熟悉的机器学习算法
@@ -769,7 +700,7 @@
-#### 3.1.5.2深度学习
+#### 深度学习
- 梯度是什么,hessian矩阵怎么求
@@ -1007,7 +938,7 @@
- 深度模型和传统机器学习模型对数据量的要求,什么场景用什么模型
-#### 3.1.5.3 特征工程
+#### 特征工程
- 特征工程一般怎么做:
@@ -1083,7 +1014,7 @@
- 如果不使用最近邻检索的库,你会怎么做最近邻检索
-#### 3.1.5.4 评估指标
+#### 评估指标
- auc的含义和计算方法, 有没有更快的计算方法
diff --git a/docs/推荐算法面经/业务场景相关.md b/docs/推荐算法面经/业务场景相关.md
index 34513ce7..1d4b57f2 100644
--- a/docs/推荐算法面经/业务场景相关.md
+++ b/docs/推荐算法面经/业务场景相关.md
@@ -1,15 +1,9 @@
# 3.4 业务场景相关
- CVR相比CTR的区别、特点
-
- 搜索与推荐的区别,你认为哪个难度更大
-
- 广告与推荐的区别
-
- 什么时候用策略规则,什么时候用模型
-
- 线上如何生成最终的排序得分
-
- 正负样本介绍(规模和比例),如何构造负样本
-
- 低活用户特征稀疏如何解决
\ No newline at end of file
diff --git a/docs/推荐算法面经/推荐模型相关.md b/docs/推荐算法面经/推荐模型相关.md
index 3b60c4df..49f3d62b 100644
--- a/docs/推荐算法面经/推荐模型相关.md
+++ b/docs/推荐算法面经/推荐模型相关.md
@@ -1,15 +1,12 @@
-# 3.2 推荐模型相关
-## 3.2.1 召回
+# 推荐模型相关
+## 召回
- 介绍双塔模型
-
- 双塔模型的输出,用双塔embedding做内积+sigmoid和求余弦相似度+sigmoid的区别
-
- 双塔模型一般怎么做特征
-
- 双塔模型为什么不直接把两个塔合起来输入一个DNN
-## 3.2.2 排序
+## 排序
- 为什么CTR中目前普遍使用深度学习模型替换树模型
- 为什么要有wide层、FM层,deep层不也有记忆能力吗
@@ -24,7 +21,7 @@
## 参考解析
-## 3.2.1召回
+## 召回
- 介绍双塔模型
- 双塔模型最大的特点就是**「user和item是独立的两个子网络」**,左侧是用户塔,右侧是item塔,这两个塔的参数不共享;
@@ -40,7 +37,7 @@
- 性能:减少线上运算速度,item塔可以提前训练,线上只需要user的embedding和相似度计算;
-## 3.2.2 排序
+## 排序
- 为什么CTR中目前普遍使用深度学习模型替换树模型
- 强大的表达能力,能够挖掘更深层次数据模式;
diff --git a/docs/推荐算法面经/热门技术相关.md b/docs/推荐算法面经/热门技术相关.md
index 83584dc2..59026a2f 100644
--- a/docs/推荐算法面经/热门技术相关.md
+++ b/docs/推荐算法面经/热门技术相关.md
@@ -1,5 +1,5 @@
-# 3.3 热门技术相关
-## 3.3.1 Embedding
+# 热门技术相关
+## Embedding
- 介绍下item2vec模型
- embedding冷启动怎么做
@@ -14,10 +14,7 @@
- DeepWalk相比序列embedding优缺点,对那一部分item影响最大
- w2v用的哪一个,是google13年的那篇嘛
-
-
-
-## 3.3.2 多任务学习
+## 多任务学习
- 多任务学习模型的发展历史详细介绍
- 为什么要用多任务学习
@@ -34,10 +31,7 @@
- 如果一个特征对任务a是正相关,对任务b是负相关,如何处理这个特征
- CTR和CVR任务放在ESMM(都是曝光空间)里和放在PLE(CTR点击空间,CVR曝光空间)里哪种效果好
-
-
-
-## 3.3.3 图神经网络
+## 图神经网络
- GNN在推荐系统中有哪些用法
- GCN、GraphSAGE、GAT的区别与联系