Add files via upload

This commit is contained in:
Muxiaoxiong 2021-08-05 10:25:40 +08:00 committed by GitHub
parent 04f06d9c4a
commit f998606c16
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
2 changed files with 5 additions and 5 deletions

View File

@ -32,7 +32,7 @@ boss直聘武汉地区网站https://www.zhipin.com/wuhan/
![](./img/40.png)
自动识别完成后可以看到系统抓取的数据比较全面
这是自动识别完成后的界面,我们可以看到系统抓取的数据比较全面
![](./img/41.png)

View File

@ -1,12 +1,12 @@
# 5.综合实践
> 本节课程所涉及到的问题均为Datawhale读者所遇到的实际问题将八爪鱼的操作知识点融合在实际问题中,本节中的方案均为作者整理和思考后的原创方案,在学习输出成笔记的过程中请附带参考课程链接,感谢你对原创工作的支持!
> 本节课程所涉及到的问题均为Datawhale读者所遇到的实际问题将八爪鱼的操作知识点与实际问题相结合,本节中的方案均为作者整理和思考后的原创方案,在学习输出成笔记的过程中请附带课程参考链接,感谢你对原创工作的支持!
在完成了前面的boss直聘的数据抓取后我们根据数据采集中所遇到的实际问题增加了微博个人信息抓取的相关课程,其中课程中针对Xpath数据提取的情况进行了详细的介绍以期学习者能够在日常的学习和工作中能够实地使用。
在完成了上一节的boss直聘的数据抓取后我们根据数据采集中所遇到的实际问题增加了微博个人信息抓取的相关实践部分,该部分针对Xpath数据提取的情况进行了详细的介绍以期学习者能够在日常的学习和工作中能够实地使用。
## 5.1综合实践背景
小李是某高校的大二的学生在学校的课程项目中需要采集微博某个主题广场上相关用户的信息在Datawhale的公众号上看到了相关文章[《我用“觉醒年代”做数据分析》](https://mp.weixin.qq.com/s/f_euOxrMKEh5Db2ixVhTjw)后想了解个人用户信息是如何采集的
小李是某高校的大二的学生在学校的课程项目中需要采集微博某个主题广场上相关用户的信息在Datawhale的公众号上看到了相关文章[《我用“觉醒年代”做数据分析》](https://mp.weixin.qq.com/s/f_euOxrMKEh5Db2ixVhTjw)后想了解如何采集个人用户信息。
基于这个问题,本项目就详细的介绍如何使用八爪鱼进行微博个人信息的采集。
@ -110,7 +110,7 @@ icon_pf_male代表男生icon_pf_female代表女生
思考部分
1.对于微博个人信息数据的采集,这部分数据是属于个人隐私数据?如果是,在使用中应该做怎样的操作?如果不是,请说明理由。
1.对于微博个人信息数据的采集,这部分数据是属于个人隐私数据?如果是,在使用中应该做怎样的操作?如果不是,请说明理由。
**Task5 END.**