diff --git a/docs/ch03/ch3.2/3.2.8.1.md b/docs/ch03/ch3.2/3.2.8.1.md index ad63d955..0a32118c 100644 --- a/docs/ch03/ch3.2/3.2.8.1.md +++ b/docs/ch03/ch3.2/3.2.8.1.md @@ -43,23 +43,32 @@ - 问:在执行`Scrapy`进行新闻爬取实战的时候,写不进去`mongdb`数据库 - ![image-20211229131610291](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229131610291.png) +
+ image-20210308142624189 +
- ![image-20211229131758632](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229131758632.png) +
+ image-20210308142624189 +
答:`mongodb`安装是否成功?有没有报错之类的。 问:成功安装。爬虫已经成功,我看`title content`已经有数据了 - - ![image-20211229131818388](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229131818388.png) +
+ image-20210308142624189 +
答:你这里是不是什么都没有,你退出`mongo`命令行重新进入查看一下呢? - ![image-20211229131834758](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229131834758.png) - +
+ image-20210308142624189 +
+ 问:对,我是在`windows`下做的,还是没有 - ![image-20211229131922288](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229131922288.png) +
+ image-20210308142624189 +
答:你看下这个路径是不是有问题,我这里好像忘记改成`fun-rec`的路径了,你改成`fun-rec`下的路径再试试,有可能这里没有的参数没有导入进去。 @@ -75,13 +84,15 @@ 答:不过应该不影响,代码你是自己单独写呢?还是运行的`fun-rec`下的`code代`码?你检查下pipline下面,看参数配置是否有问题,写一点print查看一下,然后在这里单独使用`insert`方法插入点东西查看是否有问题。 - ![image-20211229132407052](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229132407052.png) +
+ image-20210308142624189 +
问(解决):找到问题了,在`copy piplines`文件的时候,`def`类没有对齐。 - ![image-20211229132519459](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229132519459.png) - - +
+ image-20210308142624189 +
- 问:`linux`一般软件安装都放在哪个目录下面啊?是`usr/local`吗? @@ -112,21 +123,24 @@ - 问:服务没启动问题 - - ![image-20211229133614924](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229133614924.png) +
+ image-20210308142624189 +
答:对,需要安装,启动这个服务,已经加入到文档中。 +
+ image-20210308142624189 +
- ![image-20211229133652271](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229133652271.png) - - +
+ image-20210308142624189 +
- 问:`redis key`的问题如何处理? 答:https://github.com/datawhalechina/fun-rec/blob/master/codes/news_recsys/news_rec_server/recprocess/README.md - - 问:`No module named 'conf.dao_config' `没有正确识别包,怎么办? 答1:看一下自己的路径是不是正确导入了,有可能跟系统有关,需要自己调整一下。 @@ -262,8 +276,9 @@ - 问:运行后端`server`遇到过这个报错吗? - - ![image-20211229213706142](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211229213706142.png) +
+ image-20210308142624189 +
答:重新安装下`cryptography`这个包 diff --git a/docs/ch03/ch3.2/3.2.8.2.md b/docs/ch03/ch3.2/3.2.8.2.md index 545d4866..6ea8ce49 100644 --- a/docs/ch03/ch3.2/3.2.8.2.md +++ b/docs/ch03/ch3.2/3.2.8.2.md @@ -23,16 +23,14 @@ 答:将`\\d`改为`\d` - - - 问:请问这个报错是缺少什么? - ![image-20211230094102936](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211230094102936.png) +
+ image-20210308142624189 +
答:需要下载`drive`驱动才可以正常运行。 - - - 问:为什么热门文章一直显示在加载中呀? 答:你这个问题应该是没有往下跑后面几个代码,要跑完才能正常加载。 @@ -43,8 +41,9 @@ 问:应该是有 - ![image-20211230094518764](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211230094518764.png) - +
+ image-20210308142624189 +
- 问:为什么有`package.json`这个文件还是报文件缺失错误? @@ -67,7 +66,9 @@ - 问:`python process material.py`需要`redis`验证怎么解决,有没有除了取消密码之外的解决方式。 - ![image-20211230095259645](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211230095259645.png) +
+ image-20210308142624189 +
答:估计是设置了`redis`的用户和密码,这个没有办法,只能取消密码。或者修改代码,连接`redis` @@ -96,8 +97,9 @@ 答:修改此处代码。 - ![image-20211230100239555](https://gitee.com/murasamelory/cloudimages/raw/master/img/image-20211230100239555.png) - +
+ image-20210308142624189 +
- 问:有没有试过在本地访问`vm`虚拟机里面的前端,这个时候`ip`应该填什么? diff --git a/docs/ch03/ch3.2/3.2.8.3.md b/docs/ch03/ch3.2/3.2.8.3.md index 9ca0104b..8d82a64f 100644 --- a/docs/ch03/ch3.2/3.2.8.3.md +++ b/docs/ch03/ch3.2/3.2.8.3.md @@ -17,7 +17,9 @@ - 问:请问这样处理会不会时间复杂度较大? - ![image-20211230102322111](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230102322111.png) +
+ image-20210308142624189 +
答:不容易吧,爬取的文章判断重复怎么用`id`啊?如果式唯一性`id`必然是跟时间相关的。 @@ -29,7 +31,9 @@ - 问:请教下大家,正常这两个`col`的大小是不是一样的? - ![image-20211230102626648](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230102626648.png) +
+ image-20210308142624189 +
答:不是一样大,你看一下具体内容就知道了, @@ -45,7 +49,10 @@ 答:这一步 - ![image-20211230103141635](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230103141635.png) +
+ image-20210308142624189 +
+ 问:这一步不是用`redis`的动态去更新`mongo`的`featureprotrail`吗? @@ -57,23 +64,27 @@ 问:`update_redis_mongo_protrail_data`这个函数是遍历`material_collection`,也就是`mongo_server.get_feature_protrail_collection()`也就是`featureprotrail`应该是和`featureprotrail`一样多的。 - ![image-20211230103519843](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230103519843.png) +
+ image-20210308142624189 +
答:理解一样多没有问题,后面会修改。 - - 问:用户的喜欢,收藏,点击是直接落到`mysql`里面吗? - ![image-20211230103617150](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230103617150.png) +
+ image-20210308142624189 +
答:是的,前端点击阅读、喜欢、收藏会实时更新。 - - 问:这个关键词属于长尾是什么意思? - ![image-20211230103705581](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230103705581.png) +
+ image-20210308142624189 +
答:个别关键词的类别占了大量数目,以至于前三一直是那几个,长尾现象。 @@ -81,6 +92,8 @@ - 问:请教下大家,这个`user_exposure.py`是用来建`exposure_日期`这个表的么 - ![image-20211230103852764](http://ryluo.oss-cn-chengdu.aliyuncs.com/图片image-20211230103852764.png) +
+ image-20210308142624189 +
答:是的。 \ No newline at end of file