百度学生妹网站关键词排名(搜索排名)_好文分享

文章来源于萝卜大杂烩作者周萝卜

今天继续来分析爬虫数据分析文章，一起来看看网易严选商品评论的获取和分析。

网易商品评论爬取

分析网页

评论分析

进入到网易严选官网，搜索“文胸”后，先随便点进一个商品。

在商品页面，打开 Chrome 的控制台，切换至 Network 页，再把商品页面切换到评价标签下，选择一个评论文字，如“薄款、穿着舒适、满意”，在 Network 中搜索。

可以发现，评论文字是通过 listByItemByTag.json 传递过来的，点击进入该请求，并拷贝出该请求的 URL：

将该 URL 放入 Postman 中，逐个尝试 url query params，最后能够发现，只需保留 itemId 和 page 两个请求参数即可。

请求返回的是一个 JSON 格式的数据，下面就是分析该 JSON 数据了。

不难发现，所有的评论数据都存储在 commentList 中，我们只需保存该数据即可。

下面就是如何获取 itemId 的信息了，这个是产品的 ID，我们回到网易严选首页，继续分析。

产品 ID 获取

当我们在搜索框中输入关键字进行搜索的时候，同样能够发现在 Network 中有很多请求，此时可以观察各个请求，通过请求文件的名称（此处需要一些经验，守规矩的程序员都不会乱起名字），我们可以定位到搜索时展示搜索结果的请求。

搜索一般都是 search，所以我们就锁定了这个 search.json 的请求。同样把请求 URL 拷贝到 Postman 中，逐个验证传参，最后保留 page 和 keyword 两个参数即可。

该请求返回的数据较多，还是需要耐心的分析数据，也能够发现，在 result->data->directly->searcherResult->result 下面的 id 值，即为我们要获取的产品 ID。

以上，我们基本完成了前期的分析工作，下面开始代码的编写。

编写代码

获取产品 ID

我这里是获取了 page 为 1 的产品 ID，下面就是通过产品 ID 来获取不同产品下的评论信息。

通过前面的分析，我们可以知道，评论信息都是如下形式的，对这种形式的信息，我们可以很方便地存储进入 MongoDB，然后再慢慢分析数据里的内容。

对于 MongoDB，我们既可以自己搭建，也可以使用网上免费的服务。在这里我介绍一个免费的 MongoDB 服务网站：mlab，使用很简单，就不过多介绍使用过程了。

数据库有了，下面就是把数据保存进去了。

最后爬取完成之后，总共是七千多条数据，下面就可以根据个人需要做一些分析了。

爬取的数据 MongoDB 链接

商品评论数据分析

下面就到了激动人心的时刻了，一探妹子偏好！

偏好颜色

先来看看妹子们偏好的颜色

可以看出，黑色是遥遥领先的哦，这里你要做到心中有数！

再通过饼状图来观察下不同颜色的占比情况

那么这些颜色中，有你的她喜欢的吗？

尺寸分布

没有问题，75B 就是大多数妹子的尺寸了

如果你对这种罩杯尺寸没有研究的话，不要紧，贴心的我给你准备了对照表，拿走不谢

商品评论

最后我们再来看看妹子们对于商品的评价情况

就星级评价上来看，大多数都是五星好评，毕竟打着“严选”的名号，质量是必须有保证的。

再来看看在评论区，妹子最喜欢用什么词语来描述呢

舒服、很舒服，非常舒服；满意、很满意，非常满意。

仿佛进入了“夸夸群”，看来妹子们首要看重的就是舒服与否，毕竟是贴身的，质量最重要！

好了，看了上面的分析，单身的你是不是更加有了脱单的冲动？如果是已经有软妹傍身的你，是不是该下手讨好下身边的她了呢？

最后，我自己是一名从事了多年开发的Python老程序员，辞职目前在做自己的Python私人定制课程，今年年初我花了一个月整理了一份最适合2019年学习的Python学习干货，可以送给每一位喜欢Python的小伙伴，想要获取的可以关注我的头条号并在后台私信我：Python，即可免费获取。

本文链接：https://www.24zzc.com/news/169675641444523.html

百度学生妹网站关键词排名(搜索排名)

相关文章推荐

好文分享最新文章

蜘蛛工具

您可能感兴趣的文章

蜘蛛套餐

超级蜘蛛池优化

域名筛选工具

文本处理工具

百度学生妹网站关键词排名(搜索排名)

相关文章推荐

好文分享最新文章

蜘蛛工具

您可能感兴趣的文章