• 欢迎使用千万蜘蛛池,网站外链优化,蜘蛛池引蜘蛛快速提高网站收录,收藏快捷键 CTRL + D

百度蜘蛛抓取时间突然变长(蜘蛛抓取不存在的连接)


搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。而网页快照的时间理应和搜索引擎收录网页时的时间同步,但事实上站长朋友看到的快照时间并非如此。

针对目前百度搜索引擎出现快照异常的问题,柴潇总结了以下三点:一、快照时间更新慢;二、快照时间不更新;三、快照时间倒退。这三个问题是SEO人员经常纠结的问题,今天就针对这三个问题展开分析。

一、 快照时间更新慢

快照更新时间慢是一个很正常的现象。但可以简单的归纳为两种情况,1、网站不更新;2、快照更新需要时间。

1、网站不更新

一个网站的快照更新时间首先跟网站本身的更新时间有必然联系。如果网站不更新,那么搜索引擎蜘蛛爬取时没有看到新的东西,自然会掉头就走,索引库里的备份时间也不会更新。

2、快照更新需要时间

搜索引擎蜘蛛抓取了网页后,先会将索引库里的时间进行更新。而用户看到的网页快照 时间是展示到界面的时间,搜索引擎快照的更新有一定的延迟,并不是所有的网站都会在索引库更新后第一时间反应到快照上来。因此快照时间更新不及时,跟搜索 引擎的更新延迟是有关的。但是也跟网站本身长期建立起来的更新周期有一定的关系,如果你的网站一如既往的每日及时更新,那么搜索引擎对你网站的抓取更新周 期也会随之调整。

二、 快照时间不更新

快照时间不更新,同样简单的分两种情况:1、网站长期不更新;2、网站出现无法访问或者屏蔽等现象。

1、 网站长期无人打理,不更新,不用多说,搜索引擎即便再照顾你,也不会照顾到没有节操的地步。你网站最后一次的更新时间会一直保留,因此造成快照时间不更新的假象。

从上图中可以看出,该网站虽然说搜SEO这个词排名很好,但是快照时间并没有更新。通过查看页面内容就会发现,该页面作为一个固定的列表页,里面的内容发布于2008年,至今没有变化,是导致排名虽然很好,但是快照并么有更新的原因。

2、 如果网站在中途出现无法访问,或服务器关闭,或因为其他原因导致蜘蛛抓取异常等现象,会导致快照更新出现异常。

有时候会看到,网站在更新,或者网站可以正常访问,但是快照时间依然停留在很久以前。是因为搜索引擎展示给用户的时间,并不一定是最新更新的时间,而是会选择一个它认为比较合适的收录时间。

除了上述的情况为,还有一种因素会导致快照不更新。同样是因为网页访问异常所引起的。请看下图:

上图是SEO研究协会网的快照时间和首页部分截图。因为SEO研究协会网作为SEO行业新发展起来的一个网站,内容和网站运营等方面都是比较高质量的,文章收录都是很快的,但是首页快照一直保持在2014年1月10不更新。

经过调查才发现,SEO研究协会网因为曾被恶意攻击出现过几个小时无法访问的情况。而经过观察才发现,SEO研究协会网首页有一个固定的时间内容,正好是2014年1月10日。跟网站快照的时间恰恰吻合。当然仅凭这一点我们还不能下定论,继续下文。

三、 快照时间倒退

如果说前两种情况大家都可以理解的话,第三种情况可能就很少有人理解了。为什么呢?因为有些网站是2013年建的,快照显示时间却是2006年。这个时间差让人哭笑不得,甚至有骂百度脑残的冲动。这个问题在几次站长大会上一直有人向百度工作人员提出过提问,但是一直都没有正面回应,都是以第二个现象的答案来回答这个问题的。今天柴潇就对这个现象进行图文解析。首先我们来看一下下面这组图。

上图是柴潇的个人博客,这里显示的时间为2006-5-12,但实质上其博客是2013年建立的。因此看到这个快照时间后,非常难以理解,想知道这个时间是从哪里来的。经过一番研究后发现了这个秘密,请看下图:

当时打开网站进行查看,发现首页的内容摘要里显示了一个英文时间,这个时间翻译过来恰好就是2006年5月12日。经过回忆,而在这段时间,这个网站曾有一天因为服务器到期而无法访问。看到这些,问题迎仍而解。

原来百度快照时间除了会自己选择一个合适的收录时间作为快照时间来展示给用户之外,还有可能抓取网站内容中的时间作为快照时间展示出来。

也许还有人会觉得这是一种恰合,于是为了进一步证明,柴潇再次做了实验。请看下图:

前面提到的SEO研究协会网的快照是2014年1月10日。当我把网站页面的内容里的时间修改为2014年7月25日后,百度快照时间开始更新。更新后的快照时间和我修改的时间吻合。

因此,从以上的实 验中可以看出,百度快照时间的来源主要有三点:一、及时按照收录时间进行更新;二、系统在索引库里的备份时间里选取一个百度自认为相对适合的时间作为快照 时间进行展示;三、当网站服务器出现无法访问等情况时,网站快照时间容易出现异常,这事搜索引擎蜘蛛会抓取网站内容里面的时间作为快照时间进行展示出来。 当然以上只是柴潇总结出来的部分现象,并非全部,由于篇幅较长,所以不一一列举,今后将会在巨推学院的课程里依次进行分享。

下面是大家仅此遇到的一些关于SEO方面的问题,把柴潇个人的简介分享给大家:

Q :网站快照时间倒退如何解决?

A:首 先回忆网站本身在近期内有没有服务器无法访问的现象,或者临时关闭等。如果没有,请通过百度快照投诉或百度站长平台提交等渠道进行更新;如果近期服务器有 异常现象,请检查网站首页内容里是否有与百度快照时间相吻合的时间存在,如果有,请修改改时间,或者消除该时间,下次百度蜘蛛抓取时,发现原有时间不存在 后,会对快照时间进行更新。

Q :网页 URL 中出现关键词是否对 SEO 有帮助?

A: 从用户体验角度考虑,url可读是比较理想的状态,用户可以通过url即可简单判断页面主题内容,对于符合用户体验的百度当然提倡;从直接的角度来讲,没有明确指出有帮助的,但是从间接的角度讲,还是有作用的,建议如果能在URL中体现关键词或者关键词拼音即可尽量体现。

Q :拒绝外链的生效时间是多久?

A: 拒绝外链的生效问题,这里涉及了抓取、更新、计算的很多环节,最快生效时间也将在30天左右。另外考虑的一点,作弊站是需要增加作弊成本的,不可能拒绝后即生效,仍然有一段惩罚周期存在。

原文原创于巨推学院,由于篇幅问题,只提到了以上几种现象,更多的现象抽空在巨推学院的课程中分享或者在柴潇自媒体微信公众账号:chaixiao2020分享。柴潇私人微信:chaixiao8,有其他问题可以直接微信我。

本文链接:https://www.24zzc.com/news/169231984921214.html

相关文章推荐

    无相关信息