From f998606c16e5ae72a13c7cf840591410fe4d59e9 Mon Sep 17 00:00:00 2001 From: Muxiaoxiong <46742031+muxiaoxiong@users.noreply.github.com> Date: Thu, 5 Aug 2021 10:25:40 +0800 Subject: [PATCH] Add files via upload --- CollectData/4.综合实践-boss直聘信息采集.md | 2 +- CollectData/5.综合实践-微博个人信息采集.md | 8 ++++---- 2 files changed, 5 insertions(+), 5 deletions(-) diff --git a/CollectData/4.综合实践-boss直聘信息采集.md b/CollectData/4.综合实践-boss直聘信息采集.md index 4aaf99d..655a30b 100644 --- a/CollectData/4.综合实践-boss直聘信息采集.md +++ b/CollectData/4.综合实践-boss直聘信息采集.md @@ -32,7 +32,7 @@ boss直聘武汉地区网站:https://www.zhipin.com/wuhan/ ![](./img/40.png) -自动识别完成后可以看到系统抓取的数据比较全面 +这是自动识别完成后的界面,我们可以看到系统抓取的数据比较全面 ![](./img/41.png) diff --git a/CollectData/5.综合实践-微博个人信息采集.md b/CollectData/5.综合实践-微博个人信息采集.md index 4eed7be..61a2697 100644 --- a/CollectData/5.综合实践-微博个人信息采集.md +++ b/CollectData/5.综合实践-微博个人信息采集.md @@ -1,12 +1,12 @@ # 5.综合实践 -> 本节课程所涉及到的问题均为Datawhale读者所遇到的实际问题,将八爪鱼的操作知识点融合在实际问题中,本节中的方案均为作者整理和思考后的原创方案,在学习输出成笔记的过程中请附带参考课程链接,感谢你对原创工作的支持! +> 本节课程所涉及到的问题均为Datawhale读者所遇到的实际问题,将八爪鱼的操作知识点与实际问题相结合,本节中的方案均为作者整理和思考后的原创方案,在学习输出成笔记的过程中请附带课程参考链接,感谢你对原创工作的支持! -在完成了前面的boss直聘的数据抓取后,我们根据数据采集中所遇到的实际问题,增加了微博个人信息抓取的相关课程,其中课程中针对Xpath数据提取的情况进行了详细的介绍,以期学习者能够在日常的学习和工作中能够实地使用。 +在完成了上一节的boss直聘的数据抓取后,我们根据数据采集中所遇到的实际问题,增加了微博个人信息抓取的相关实践部分,该部分针对Xpath数据提取的情况进行了详细的介绍,以期学习者能够在日常的学习和工作中能够实地使用。 ## 5.1综合实践背景 -小李是某高校的大二的学生,在学校的课程项目中需要采集微博某个主题广场上相关用户的信息,在Datawhale的公众号上看到了相关文章[《我用“觉醒年代”做数据分析》](https://mp.weixin.qq.com/s/f_euOxrMKEh5Db2ixVhTjw)后想了解个人用户信息是如何采集的。 +小李是某高校的大二的学生,在学校的课程项目中需要采集微博某个主题广场上相关用户的信息,在Datawhale的公众号上看到了相关文章[《我用“觉醒年代”做数据分析》](https://mp.weixin.qq.com/s/f_euOxrMKEh5Db2ixVhTjw)后想了解如何采集个人用户信息。 基于这个问题,本项目就详细的介绍如何使用八爪鱼进行微博个人信息的采集。 @@ -110,7 +110,7 @@ icon_pf_male代表男生,icon_pf_female代表女生 思考部分 -1.对于微博个人信息数据的采集,这部分数据是属于个人隐私数据嘛?如果是,在使用中应该做怎样的操作?如果不是,请说明理由。 +1.对于微博个人信息数据的采集,这部分数据是属于个人隐私数据吗?如果是,在使用中应该做怎样的操作?如果不是,请说明理由。 **Task5 END.**