百度抓取链接有四种方式
1、自动推送
JS代码是百度站长平台最新推出的轻量级链接提交组件,站长只需将自动推送的JS代码放置在站点每一个页面源代码中,当页面被访问时,页面链接会自动推送给百度,有利于新页面更快被百度收录。
2、 Sitemap
可以定期将网站链接放到Sitemap中,然后Sitemap提交给百度。百度会周期性地抓取检查站长提交的Sitemap,对其中的链接进行处理。
3、主动推送
是最为快速的提交方式,将站点当天新产出链接立即通过此方式推送给百度,可以保证新链接可以及时被百度收录。
4、手动提交
如果你不想通过程序提交,你可以用这种方式手动提交链接到百度。
今天我们介绍自动推送,这种方式是我们最常用的,也是最方便的。
百度自动推送文章收录怎么做
百度站长平台提供链接索引,自动提交JS脚本已经有一段时间了。任何平台(浏览器、微信、微博)的页面安装代码以后,页面链接会很快被推到百度,从而提高站点新内容发现的速度。
代码:
<script>
(function(){
var canonicalURL, curProtocol;
//Get the <link> tag
var x=document.getElementsByTagName("link");
//Find the last canonical URL
if(x.length > 0){
for (i=0;i<x.length;i++){
if(x[i].rel.toLowerCase() == 'canonical' && x[i].href){
canonicalURL=x[i].href;
}
}
}
//Get protocol
if (!canonicalURL){
curProtocol = window.location.protocol.split(':')[0];
}
else{
curProtocol = canonicalURL.split(':')[0];
}
//Get current URL if the canonical URL does not exist
if (!canonicalURL) canonicalURL = window.location.href;
//Assign script content. Replace current URL with the canonical URL
!function(){var e=/([http|https]:\/\/[a-zA-Z0-9\_\.]+\.baidu\.com)/gi,r=canonicalURL,t=document.referrer;if(!e.test(r)){var n=(String(curProtocol).toLowerCase() === 'https')?"https://sp0.baidu.com/9_Q4simg2RQJ8t7jm9iCKT-xh_/s.gif":"//api.share.baidu.com/s.gif";t?(n+="?r="+encodeURIComponent(document.referrer),r&&(n+="&l="+r)):r&&(n+="?l="+r);var i=new Image;i.src=n}}(window);})();
</script>
百度自动推送文章收录原理
1、 它先是判断了目前的协议类型是HTTPS还是其他类型(如,HTTP,FTP等)
2、 然后下载了百度官方的一个JS文件
3、 然后通过生成脚本块将JS文件的内容插入到当前页中。
4、 最后会运行这个脚本块
这个js中的代码实际上是静态的,所以不必每次调用。另一方面,我们需要对r的值进行更改,将它更改为canonical URL的值。
这个脚本可以进一步查看页面的canonical URL,我们知道canonical属性表示该页面有千种URL的花样,请搜索引擎只认准href中给出的URL值,这样搜索引擎将不会为同一页面多次检查推送页面的内容。
自动推送是一种非常实用的方法,上手快,操作简单。但也存在一些小问题,本文仅为提高自动推送的效率和有效性提供了一条途径。