关注搜索引擎蜘蛛压力

以前在建站的时候,他们说蜘蛛来抓取的频率越多越好,因为蜘蛛来抓取说明了网站更新速度快,受搜索引擎的欢迎,但是在最近的网站统计中,发现很多蜘蛛爬取的频次非常的高,比如有的蜘蛛一天能来网站几万次,要知道网站的带宽是有限制的,比如很多网站的带宽只有几M,这就像一个大门一样,如果很多人往里面挤,肯定是挤不进来的,如果蜘蛛大量的访问,势必导致正常访问的用户被挡在门外,或者访问速度会受到限制,影响正常的业务访问。

因此,我们不能任由蜘蛛频繁的抓取,那么怎么办呢?一般情况下有这三种方案:

1、不想让蜘蛛抓取的目录,在robots里面屏蔽。

2、通过各大搜索引擎站长平台对蜘蛛的抓取次数进行限制,如果网站每天更新大量的内容,可以适当放宽蜘蛛的抓取次数,如果访问不高,可以限制在几千以内就可以了。

3、对于不想让某些蜘蛛抓取的,可以直接在robots屏蔽这个蜘蛛。

还有一些蜘蛛是假蜘蛛,他们会冒充真蜘蛛对网站进行大量的抓取,这个时候就要对网站部署合适的防火墙等,筛选出假蜘蛛进行屏蔽。

在做了以上的步骤以后,我们就能将蜘蛛的抓取控制在一个合理的范围,既不影响蜘蛛的抓取,也不影响正常的用户访问。

相关推荐
G皮T14 小时前
【Elasticsearch】映射:null_value 详解
大数据·elasticsearch·搜索引擎·映射·mappings·null_value
冒泡的肥皂1 天前
强大的ANTLR4语法解析器入门demo
后端·搜索引擎·编程语言
livemetee2 天前
一个完整的日志收集方案:Elasticsearch + Logstash + Kibana+Filebeat (二)
大数据·elk·搜索引擎
安审若无2 天前
Elasticsearch中的监控(Monitoring)功能介绍
elasticsearch·搜索引擎·全文检索
咸鱼求放生2 天前
es在Linux安装
大数据·elasticsearch·搜索引擎
@泽栖2 天前
ES数据聚合
elasticsearch·搜索引擎
Elastic 中国社区官方博客3 天前
Elastic 获得 AWS 教育 ISV 合作伙伴资质,进一步增强教育解决方案产品组合
大数据·人工智能·elasticsearch·搜索引擎·云计算·全文检索·aws
星星点点洲4 天前
【Elasticsearch】 查询优化方式
elasticsearch·搜索引擎
gs801404 天前
[闭源saas选项]Pinecone:为向量数据库而生的实时语义搜索引擎
数据库·搜索引擎
LaughingZhu4 天前
PH热榜 | 2025-06-05
前端·人工智能·经验分享·搜索引擎·产品运营