From 089cf25e76e83d05d42a3e92436fd13f95174e31 Mon Sep 17 00:00:00 2001 From: RuyiLuo Date: Mon, 22 Mar 2021 20:55:37 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E5=9B=BE=E7=89=87=E9=93=BE?= =?UTF-8?q?=E6=8E=A5?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- DeepRecommendationModel/DIN.md | 4 ++-- DeepRecommendationModel/PNN.md | 2 +- 2 files changed, 3 insertions(+), 3 deletions(-) diff --git a/DeepRecommendationModel/DIN.md b/DeepRecommendationModel/DIN.md index 832bb5d9..8b1cd0dc 100644 --- a/DeepRecommendationModel/DIN.md +++ b/DeepRecommendationModel/DIN.md @@ -22,13 +22,13 @@ Deep Interest Network(DIIN)是2018年阿里巴巴提出来的模型, 该模型 工业上的CTR预测数据集一般都是`multi-group categorial form`的形式,就是类别型特征最为常见,这种数据集一般长这样: - + 这里的亮点就是框出来的那个特征,这个包含着丰富的用户兴趣信息。 对于特征编码,作者这里举了个例子:`[weekday=Friday, gender=Female, visited_cate_ids={Bag,Book}, ad_cate_id=Book]`, 这种情况我们知道一般是通过one-hot的形式对其编码, 转成系数的二值特征的形式。但是这里我们会发现一个`visted_cate_ids`, 也就是用户的历史商品列表, 对于某个用户来讲,这个值是个多值型的特征, 而且还要知道这个特征的长度不一样长,也就是用户购买的历史商品个数不一样多,这个显然。这个特征的话,我们一般是用到multi-hot编码,也就是可能不止1个1了,有哪个商品,对应位置就是1, 所以经过编码后的数据长下面这个样子: - + 这个就是喂入模型的数据格式了,这里还要注意一点 就是上面的特征里面没有任何的交互组合,也就是没有做特征交叉。这个交互信息交给后面的神经网络去学习。 diff --git a/DeepRecommendationModel/PNN.md b/DeepRecommendationModel/PNN.md index e2ca0be6..51c3163c 100644 --- a/DeepRecommendationModel/PNN.md +++ b/DeepRecommendationModel/PNN.md @@ -12,7 +12,7 @@ PNN模型其实是对IPNN和OPNN的总称,两者分别对应的是不同的Pro PNN模型的整体架构如下图所示: -image-20210308142624189 +image-20210308142624189 一共分为五层,其中除了Product Layer别的layer都是比较常规的处理方法,均可以从前面的章节进一步了解。模型中最重要的部分就是通过Product层对embedding特征进行交叉组合,也就是上图中红框所显示的部分。