什么是网站信息采集,网站信息采集就是借助采集工具,从不同的网站上把信息大量采集到本地并发布到自己网站上的过程。有些站长发现访问ip突然增多,但是并没有增多注册人数和发帖数。不理解为什么,这其中有个原因就是被人采集了。怎样知道这是人为采集还是百度蜘蛛在爬呢?
判断是否是采集:
1,网页流量增大,而且增长的数量基本等于本站的页面数量.
2.看统计分析,分析下用户停留的页面,及访问的深度,再一个看IIS日志,通过查看BD蜘蛛爬行记录来判断。
3.如果之前收录过的。你的和它一模一样,就视为采集。
4.查看页面浏览记录,比如用51la统计,站长统计,雅虎统计等,你会看到几天内的页面浏览,如果每个页面都浏览了一遍,那就基本确定被人采集了
5.查看网站的关键词排名,通过排名连接,找到同样内容的网站,看他们的内容列表,内容页面是否跟本站相同.如果从内容上,列表上确定相同,那这个站就采集了本站内容.本站被采集过很多次,都是通过三中方法找到采集站的.