From 293b28b9a51a8aebb25e0d8ee86ac6f330b0f7eb Mon Sep 17 00:00:00 2001 From: RuyiLuo Date: Thu, 28 Apr 2022 21:31:33 +0800 Subject: [PATCH] =?UTF-8?q?=E6=B7=BB=E5=8A=A0=E6=96=B0=E9=97=BB=E6=8E=A8?= =?UTF-8?q?=E8=8D=90=E7=B3=BB=E7=BB=9F=E7=AB=9E=E8=B5=9B=E6=95=B0=E6=8D=AE?= =?UTF-8?q?=E9=9B=86=E8=BF=9E=E6=8E=A5?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- docs/ch03/ch3.2/3.2.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/ch03/ch3.2/3.2.md b/docs/ch03/ch3.2/3.2.md index 7fd1cad8..bb37dc33 100644 --- a/docs/ch03/ch3.2/3.2.md +++ b/docs/ch03/ch3.2/3.2.md @@ -5,7 +5,7 @@ - 系统将新闻的爬取、预处理、入库等事情都串在了一起,并将整个过程都自动化的执行 - 对于展示的新闻内容,没有使用复杂的推荐算法,仅仅是通过简单的策略实现了热门打分,然后按照热度分进行排序。此外,考虑到展示的内容可能同类别的都排在了一起,实现了一个简单的类别打散的策略。(注意:整个系统中都没有排序相关的模型,只有简单的规则类召回) - 当前系统虽然能够实现用户的注册,点击等交互功能,但是由于使用的用户很少,很难得到一个比较好的用户行为数据,也就无法有效的将该系统迭代起来,甚至都无法很好的对推荐效果进行评估。 -- 为了实现能够对系统中的推荐算法进行有效的评估,我们在代码中还想嵌入一个现有的公开新闻推荐数据集,这个数据集是科大讯飞的一个竞赛数据集。所以在代码中的recall和rank目录下添加了一部分处理竞赛数据集的代码,目前由于时间原因,还没有把整个竞赛数据集全部迁入到数据库、前端展示等环节。也就是说基于竞赛数据集的系统和上面提到的(已经完全可以运行的基于规则的新闻推荐系统),是完全脱节的,后面会花时间把整个流程给串起来。 +- 为了实现能够对系统中的推荐算法进行有效的评估,我们在代码中还想嵌入一个现有的公开新闻推荐数据集,这个数据集是科大讯飞的一个竞赛数据集。所以在代码中的recall和rank目录下添加了一部分处理竞赛数据集的代码,目前由于时间原因,还没有把整个竞赛数据集全部迁入到数据库、前端展示等环节。也就是说基于竞赛数据集的系统和上面提到的(已经完全可以运行的基于规则的新闻推荐系统),是完全脱节的,后面会花时间把整个流程给串起来。这里用到的竞赛相关的数据下载连接(注意:不能作为商业用途):https://cowtransfer.com/s/5461d6c2fdfb4c 或 打开【奶牛快传】cowtransfer.com 使用传输口令:2v5lky 提取; 该新闻推荐系统只是基于现有的技术,实现了推荐系统的基本流程,对于架构是否合理,技术选型是否合理都没有深入研究,这也是未来该项目的优化方向,会结合实际工业的推荐系统对其进行不断的迭代优化。