网站收录原理
不是什么网站都会被搜索引擎收录,网站收录是有一个流程的,首先是搜索引擎发现你的网站,从而被搜索引擎下载到数据库,最后搜索引擎将会拿你的页面和其他页面进行对比,筛选出来后形成索引,最后一步才是释放,释放出来后,你即可以直接在百度上输入你的URL查看是否成功收录。这么一个流程看起来简单,实际上搜索引擎处处都非常用心。
首先是搜索引擎如何发现你的网站,大多数情况下,搜索引擎发现一个网站都是通过三个渠道,其一是提交,第二是外链,第三是使用了搜索引擎相关的一些插件等。
提交就不多说了,大多数的网站做好了以后,都会主动提交到搜索引擎,那么这里小编要说一句了,一定要先把网站完全做好,并且填充部分内容,再提交,而不是先提交,然后一边修改网站一边发布文章,如果刚刚上线的网站,还在改版并且还没有一篇文章,那么很容易会被搜索引擎认为这是一个空白页面,最终延长收录时间,也就是常说的把你网站放入到沙盒。
第二点是通过外链来引蜘蛛,但你网站被收录了以后,你网站出现了一个外链,那么搜索引擎在抓取你网站的时候,会看到这么一个外链,然后去抓取外链的页面,那么这是外链引蜘蛛的一个方法,目前来讲搜索引擎机制非常完善,基本上不需要依靠外链来吸引蜘蛛了,而在2012年左右,发布外链是增加网站收录和排名最好的办法。
第三点是通过搜索引擎的一些插件,比如说你网站安装了百度统计、百度分享等相关的JS,那么但你网站被大家的时候,这些JS也就运行了,也就意味着你的网站被搜索引擎记录了。百度曾做过一个这样的实验,新建一个空白网站,里面随意写了几个文字,没有任何插件,仅仅是使用360浏览器打开一次,然而搜索引擎却收录了这个页面,坦率的说,就是360使用浏览器也在收集这一块数据。