关注搜索引擎蜘蛛压力

以前在建站的时候,他们说蜘蛛来抓取的频率越多越好,因为蜘蛛来抓取说明了网站更新速度快,受搜索引擎的欢迎,但是在最近的网站统计中,发现很多蜘蛛爬取的频次非常的高,比如有的蜘蛛一天能来网站几万次,要知道网站的带宽是有限制的,比如很多网站的带宽只有几M,这就像一个大门一样,如果很多人往里面挤,肯定是挤不进来的,如果蜘蛛大量的访问,势必导致正常访问的用户被挡在门外,或者访问速度会受到限制,影响正常的业务访问。

因此,我们不能任由蜘蛛频繁的抓取,那么怎么办呢?一般情况下有这三种方案:

1、不想让蜘蛛抓取的目录,在robots里面屏蔽。

2、通过各大搜索引擎站长平台对蜘蛛的抓取次数进行限制,如果网站每天更新大量的内容,可以适当放宽蜘蛛的抓取次数,如果访问不高,可以限制在几千以内就可以了。

3、对于不想让某些蜘蛛抓取的,可以直接在robots屏蔽这个蜘蛛。

还有一些蜘蛛是假蜘蛛,他们会冒充真蜘蛛对网站进行大量的抓取,这个时候就要对网站部署合适的防火墙等,筛选出假蜘蛛进行屏蔽。

在做了以上的步骤以后,我们就能将蜘蛛的抓取控制在一个合理的范围,既不影响蜘蛛的抓取,也不影响正常的用户访问。

相关推荐
阿里云大数据AI技术21 分钟前
AI搜索的黑科技?DeepSearch 究竟“深”藏着什么秘密?
搜索引擎
h_k100862 小时前
当GitHub宕机时,我们如何协作?
大数据·elasticsearch·搜索引擎
SEO_juper11 小时前
SEO新手入门:什么是SEO及其作用
运维·服务器·搜索引擎·seo·数字营销·seo优化
程序员TNT11 小时前
开源商城 Shoptnt 的搜索引擎之心:基于 Elasticsearch 的高性能商品搜索实现
elasticsearch·搜索引擎·开源
在未来等你15 小时前
Elasticsearch面试精讲 Day 13:索引生命周期管理ILM
大数据·分布式·elasticsearch·搜索引擎·面试
Elastic 中国社区官方博客17 小时前
Elasticsearch:智能搜索的 MCP
大数据·人工智能·elasticsearch·搜索引擎·全文检索
一个儒雅随和的男子1 天前
Dockerfile构建容器需要注意的事项。
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客1 天前
介绍 Python Elasticsearch Client 的 ES|QL 查询构建器
大数据·开发语言·数据库·python·elasticsearch·搜索引擎·全文检索
SEO_juper2 天前
程序化广告快速上手:零基础入门第一课
搜索引擎·广告·数字营销·ppc
在未来等你2 天前
Elasticsearch面试精讲 Day 15:索引别名与零停机更新
大数据·分布式·elasticsearch·搜索引擎·面试