因为检索结果大量出现百家号的内容,百度又被摆在风口浪尖。批判百度仿佛又成了“言论正确”,但是,我必须要说但是,网络孤岛难道都是百度的错?
通过检索fgo的手办,使用谷歌在首页就可以得到大量的亚马逊结果。
百度能得到淘宝的结果吗?不能!淘宝早在2008年就屏蔽了百度的搜索,从百度早就已经无法得到具体的淘宝的商品信息。
除了百度之外,美丽说和蘑菇街也在2013年遭到了淘宝的先后封杀。但如果要说影响力,2013年11月淘宝封杀彼时还比较弱小的微信可以说将这种巨头间的对立上升到了最高潮,从此之后两大巨头基本是泾渭分明,淘宝和微信再也无法共通,在微信强大之后反过来把淘宝又封杀了。而淘宝不得不弄出一个淘口令来。
其实中文互联网企业之间互相屏蔽对方早就开始了,当年被QQ封杀后,四处喊冤的360忘了自己之前不久封杀了金山的网页保镖。加害者与受害者的角色转换往往就在一息之间。
在诸多网民看来不过只是一出出闹剧而已,却从未想到自己的网络体验正在变得越来越糟。对于只用抖音或者各种app刷新闻的普通人来说可能还不明显,但对经常需要查询各种资料的人群来说,这种恶化显而易见。
以笔者个人为例,今天在Oracle 12c遇到了一个问题。开发者都知道,Oracle12版本进行了重大的变化,以前正确执行的程序也会遇到各种各样奇形怪状的问题。【LRM-00104】,之前好用的程序突然出现了这个错误。
从百度来检索,检索不到。
从谷歌来检索,选中文环境,依然检索不到,只能搜索到英文结果。
从谷歌选择默认地区语言环境(笔者目前在日本工作),找到了结果,第一个就是解决方案。在Oracle中,errors的参数不能为负数,必须为正数。之前的-1改为足够大的正数就可以解决这个问题。
英语结果暂且不论,日语能找到结果,反而中文找不到,这说明什么?难道日本的软件从业者数目远远超过中国?如果是技术原因,为什么谷歌也检索不到中文结果?这只能说明很多网站选择禁止抓取内容,不但百度检索不到,谷歌也检索不到。这种情况恶化到一定程度会怎么样? 当我们真的遇到需要搜索解决问题的方案时,会发现根本就找不到。不是没有,而是找不到。所有的解决方案都被截留在一个个信息孤岛中,而你根本就无法找到。
了解爬虫原理的同学都知道,只要在robots文进行设定,就可以禁止搜索引擎抓取内容。所以淘宝的商品抓不到,微信的各种文章抓不到,头条再加上各种各样的新闻app的各种专属文章依然抓不到,百度能抓取到的变得越来越少,我们能看到的也就是今天这种千疮百孔的样子。
不要再说什么远见伟大之类的,小农意识在看起来包容的互联网依然无比盛行,我的就是我的,凭什么给你抓取到?思想上的落后,规模再大依然称不上伟大。