BaiduSpider喜欢原创的东西,但是百度蜘蛛对于原创源址的判断目前还无法做到精准的地步,它并不能完全自主的判断某一篇文章它的始发点是哪里,当我们更新一篇文章,并且很快的被他人采集的时候,蜘蛛可能同一时间接触了到很多一摸一样的文章,那么它就会很迷茫,并不清楚到底哪个是原创的,哪些是复制的。因此,当我们的网站长期处于被采集的状态的时候,我们网站上更新的文章大部分都在互联网上存在一样的内容,而假如网站权重又不够高,那么蜘蛛就很可能将你的网站列为采集站,它更相信你网站的文章是采集自互联网的,而不是互联网当中其他的站是采集你的文章。
当蜘蛛这样的看待你的网站的时候,你网站可能就会碰到这么几种情况:
先文章页停止收录,然后整个网站不收录
这点是一定会发生的,因为被百度误判为采集站,所以你的文章页一定会被百度列为考察期,在这个期间,文章页是一定会停止收录的。当然这个停止收录不会只是影响你的文章页,它也会让那个百度重新审核你整个网站,所以其他的页面也会渐渐的开始不收录。笔者的网站曾有半个月没有收录过一个页面,原因就是因为这个导致的。
网站收录开始减少,快照停滞
正如前面所说,百度会重新对你的网站进行考量,这个时候,一定会发现你网站存在着一些页面和互联网当中存在类似,百度会毫不考虑的减少你这些页面的收录,所以很多人发现网站停止收录之后,慢慢的引起了网站整个收录的减少,就是这个原因。页面不怎么收录,百度对网站的信任度下降,最终,快照也会停滞一段时间。
排名并未有所波动,流量正常
当出现收录减少,快照停滞的时候,我们最关心的问题就是排名的问题,担心排名会有所影响。这点到是可以放心,因为文章被采集,导致自己站受到百度的考核,这个只是影响了百度对网站的信任度,并不会导致网站权重的下降,所以网站的关键词排名并不会受到影响。
改善之后,网站收录依然存在异常
假设我们发现自己网站被采集之后,我们对网站进行了一些改善,成功的避免了网站被采集,那么你的网站还会有一个适应期,整个适应期表现出来的症状为:网站渐渐的开始收录文章页,但是收录的并不是即时更新的文章,有可能是前天的或者大前天更新的。这样的症状大概会存在1周的时间,之后收录会慢慢的趋于正常,快照也会慢慢的恢复。
这一系列的现象都是当网站处于长期被他人采集的情况下会出现的,所以当你自己的网站存在这样的一些现象的时候,你首先要找的原因就是自己每天更新的文章是不是正在被别人采集。
如果你的网站确实是处于这样的情况,肯定是要想办法解决的,当然别人要采集你的文章,你不可能强制性的说不让别人去采集,所以我们能做的就是在自己本身上做一些改动。沧州网站制作公司为大家支招:
1、提升页面权重
提升页面的权重是可以从根本上解决这个问题的,多做一些这个页面的外链。
2、Rss合理利用
开发一个这样的功能也是有必要的,在网站文章有更新的时候,第一时间就让搜索引擎知道,主动出击,这样会很有助于收录的。而且Rss也能有效增加网站的流量,可以说是一举两得。
3、做一些细节,限制机器的采集
被人工采集还没什么,要是没人用工具定时、大量的采集你网站的文章,这确实让人很头疼,所以我们应该在页面的细节上做一些处理,至少能够防止机器的采集。比如页面不要设计的太传统、大众化;Url的写法要多变一些,不要成为默认叠加等设置。
4、被采集的时候,更新的文章多与自己网站有关
别人采集我们的文章,是因为他们也需要我们更新的内容,所以如果我们更新的都是与自己网站有关的信息,经常会穿插我们网站的名称,别人在采集的时候就会觉得我们的文章对他们并没有太多的意义,这也是很不错的避免采集的方式。
- 制作成功的网站必备的两个要求 (2011-11-17 17:18:26)
- 让平安时刻围绕百姓身边 (2011-11-16 16:31:24)
- 冬天来临 沧州动物园河马泡桑拿 斑马进暖房 (2011-11-16 16:24:50)
- 博川给做企业网站的几点建议 (2011-11-16 16:13:5)
- 网站制作环节在网站优化中的重要性 (2011-11-16 15:56:4)
- 网络推广意义何在 (2011-10-29 15:19:35)
- 沧州网站制作中标准化是未来的趋势 (2011-10-25 17:26:45)









