如何排除页面过多而没有及时处理的话会影响到内链分数值,所以还是需要针对相关的问题做对应的处理的。
1、已发现-尚未编入索引
这种情况通常有以下两种情况:
1)URL有问题
链接不规范造成的问题有可能是abc.com/vince写成了abc.com//vince,如果发现了这种链接那就可以使用robots进行屏蔽。
图片来源:万元户做谷歌SEO
遇到这种情况我们是需要写一个robots.txt的屏蔽协议,那么加入一个协议disallow://就可以了。
2)还没有抓取
就是最近提交的链接,根据优先级还没有抓取相关的链接。
图片来源:谷歌站长工具后台
综合以上两点,先看这个链接是不是规范如果不够规范根据规律robots屏蔽相关的不符点。如果没啥问题等一下再看是否有了收录就好了。
2、重复网页(无权威标记)
在说这个问题之前有必要给大家说一下什么是权威标记。
2.1权威标记是什么?
就是有几个相类似的页面,但是有一个最终的权威页面这时候就要使用canonical做标记,把相类似的页面加上这个tag指向权威页面。
图片来源:万元户做谷歌SEO
<link rel="canonical" href="数据源头url">。如果发现这种情况要及时处理,不然会有权重分散的情况。
这个要根据链接的实际情况来判断,如果手机端的链接没有做标记也会出现这种情况的,如果出现这种就把手机端页面<head>里面加一个canonical就好了。
然后wordpress和shopify是有插件可以支持这个标记的。
2.2关于301和canonical选择哪一个?
然后这个办法是相对来说安全有效的,但是301要谨慎的使用如果网站里面大量的使用301是容易造成搜索引擎误判的,如果误判就会造成降权。
如果降权了是很难恢复的,所以301要谨慎再谨慎的使用才好。301虽然是带权重跳转的但是周期和判断都很麻烦,所以基本上域名选择使用下,这种重复页面最好还是使用canonical。
2.3备用网页(有适当的权威标记)
这种情况一般来说就是做了几个相类似的页面或者完全相同的页面但是没有做好数据源头标记,就像之前的amp页面就会出现这种情况。如果做好了canonical那么检查一下,如果没有标记错那么就再重新提交一下就可以了。如果没有做或者标记的不是数据源头页面那么重新标记一下就好了,就像那个amp做一下标记到数据源头页面就好了!一般数量不是很多的话可以直接忽略,但是如果数量很大那么就要特别的重视了也有可能是代码写错了,原因可能很多具体要看实际情况。
3、出现404的情况
404页面出现在抓取异常页面就要针对性判断了。如果出现这种情况那么就再生成这样一个页面就好了。
图片来源:谷歌站长工具后台
抓取异常会有多次抓取,会随着时间而更新的。这样会浪费搜索引擎的抓取,需要及时处理这个问题。
图片来源:万元户做谷歌SEO
一般常用的办法是使用301重定向的,但是301使用的太多对于SEO优化会起到反噬的效果。建议是使用同样的链接做出来一个正常的页面,这样就可以完美的解决404问题了。