• 欢迎使用千万蜘蛛池,网站外链优化,蜘蛛池引蜘蛛快速提高网站收录,收藏快捷键 CTRL + D

怎么自己做文章链接赚钱(软文的文章如何生成链接)


#从今天起记录我的2023#


总目录:




文字(Text)选择器

如何用 1 分钟抓取 500 个文章标题?

https://www.zhihu.com/people/zhang-ji...

目标效果图

目录

02 问题检测清单

03 适用场景 04 小练习

(1)打开 web scraper (2)创建 Sitemap(网站地图)

(3)设置 selector(抓取规则) (4)开始抓取

(5)导出数据

(1)打开 web scraper

1 打开要抓取的网?

2 鼠标右键 —— 检查(审查元素)

(1)打开 web scraper

如果你以前使用过,这里会有一些信息

(2)创建 Sitemap(网站地图

(2)创建 Sitemap(网站地图 地址栏:这里可以看到网站,复制粘贴到下面 “4” 处

取个名字

要抓取的网址:可以从地址栏复制,粘贴到这里

点击保存

(2)创建 Sitemap(网站地图 注意点

Sitemap name 的格式:

1 字母 + 数字

2 字母开头

3 最少 3 个字符 4 不能重复

(2)创建 Sitemap(网站地图

(3)设置 selector(抓取规则 几个概念介绍

微信

包含

朋友

包含

朋友信息

web scraper

包含

Sitemap(s) 某个网站 包含

selector(s)

网站中的信息

增删改查

增删改查

好友信息

好友信息

名字

链接

好友信息

Sitemap

selector

点赞数

selector

年龄

性别

标题

爱好

评论数

好友信息 selector

selector

(3)设置 selector(抓取规则) 几个概念介绍

好友

乔布斯

知乎

(3)设置 selector(抓取规则 这里能看到“zhihu”,说明此刻是在 “zhihu” 这个Sitemap 里创建 selector)

(3)设置 selector(抓取规则

不用选,默认就好

根据抓取信息取个名字,格式要求和 Sitemap 相同, 选择 “text”:因为抓取的是“文字”

下一个PPT 如果要抓取多个信息,就勾选“Multiple”

上面全部设置好好,点击保存)

(3)设置 selector(抓取规则 4.2 点击第 1 个标题

这里一开始是空白, 执行 4.2、4.3 步后, 会出现结果

4.3 点击第 2 个标题 4.4 点击蓝色按钮

4.1 点击“select”,会弹出 4.4 处的工具栏

点击 4.4 蓝色按钮后,这里会出现一些字符,说明设置成功。 如果没有,说明 4.2、4.3 执行有误,可以从 4.1 重新操作)

(4)开始抓取 这里能看到“zhihu”,说明此刻是在操作 “zhihu” 这个Sitemap

(4)开始抓取

(5)导出数据

下载到电脑上的是一个 csv 文件,可以用 excel 打开。 文件名前缀 XX.csv,XX 就是 Sitemap 名字。

02 问题检测清单

如果抓取结果不对,可以按照下图清单,检查这几个选项是否正确。 如果不对,按照 01 节的方法修改一下。

02 问题检测清单

6 点击“Element preview”,标题应该全部变红,说明第 3 点选对了

02 问题检测清单 示例

02 问题检测清单 一个你可能会经常看到的警告 信息,是正常现象,不用担心?

比如,我点击“select”按钮, 选择标题后,又选择了作者介绍, 就会弹出提示,说明这 2 个信息, 不是同一类型

当出现这个提示,说明你选择的 2 个信息, 不是同一类型,应该点击“Select”,重新选择

03 适用场景

text 选择器,适用于抓取网?上的文字信息。

web scraper 最常用的选择器, 几乎抓取任何网站,都需要用到这个选择器。

经常不单独适用。

03 适用场景

我知道,可能你学完这节课,会跃跃欲试想要抓其他网站,例如:微博,公众号等。

但你大概率会失败,抓取的结果和想象中的不一致。

要么数据为 null, 要么不完整, 要么选不中。

这都是正常的。

因为这节课,我们只学了抓取一种类型信息,

其他网站不一定和这节的案例相同,或许你看起来一样,但其实有差异,后面我们会

学习更多类型抓取方式,学完后,你就能轻松应对各种网站了。

所以,不要着急。

想想看,如果你只学了 ABC,就去考英语四级,也会考不过吧。

03 适用场景 如何抓取多?数据?

04 小练习 用搜狗的微信搜索“不用写代码的爬虫课”,抓取结果的标题

下一节 链接(Link)选择器

如何抓取文章链接?




本文发布的内容仅为个人学习试用,请在下载后24小时内删除,不得用于任何商业用途,否则后果自负。如有侵权请及时联系我们处理。

本文链接:https://www.24zzc.com/news/169458346933517.html

相关文章推荐

    无相关信息