下载鸥 > 网站下载 > 网站运营 > 网站优化

网站抓取超时是什么原因,要怎么办?

475 2021-04-12 18:43:41

收藏

简述

云服务器服务商要选对 ,页面要做优化,带宽要够用,这样才能尽量避免抓取超时问题。
网站抓取超时是一个发生频率比较低的问题,大多数站点都不会遇到。但如果遇到了,就一定要重视。否则,如果经常性发生抓取超时的异常,降权就很有可能发生。
 

抓取超时的原因解析

1、DNS问题,无论是蜘蛛还是用户访问网站,首先就需要域名的DNS做了正确的解析,然而解析是解析了,你能确定DNS真的稳定吗?不少站点的错误,正是因为DNS不稳定而造成的。尤其是那些又做域名注册,又搞‘域名抢注’的平台,这样的平台,更容易出现DNS解析不稳定的情况,尤其是在抢注高峰期。具体哪些品牌,这个就不点名了,如果你的域名在这些平台中,建议最好是将其转出到其他稳定的平台。

2、页面太大,有一些网站的部分页面达到了5兆的以上情况,甚至还见过极少的网站出现过一个页面有10MB大小。这样的页面,更容易出现抓取超时的问题。正常情况,并不建议网站的页面大小超过3MB,同时建议网站服务器启用GZIP压缩。

3、带宽不足,这是一个很常见的情况,不少站点出现链接超时都是因为带宽不足而引发的。我们知道1M的带宽峰值下载是128KB,如果网站是1M接入,页面大小是256KB,如果同时2个人在打开页面,那么就需要4秒才可以下载完毕。如果带宽是2MB,页面大小是1024KB,一个人打开网站需要8秒,可如果是10个人同时打开呢?所以带宽这里,一定要做足。站长或者企业都应当观察一下站点的平均带宽,以及峰值带宽情况,如果经常出现‘带宽峰值’类型的访问,那么就一定要升级带宽了。

4、首字节时间太长,可能很多同学没有听说过这个问题,它指的是从发送请求到WEB服务器的时间+WEB服务器处理请求并生成响应花费的时间。有一些站点,首字节时间居然都可以达到5MS,这样的情况,网站还能正常吗?
 

抓取超时的解决方案

1、对于首字节时间这里,我们应当注意:避免网站与其他网站共享同一个服务器。这是因为,其他网站会占用自身网站服务器处理时间。

2、使用CDN。CDN的意义在于减少内容和访问者之间的“距离”,通过将静态内容分发到CDN,CDN的内容自动复制到各个位置,在地理上更接近用户,从而减少TTFB的时间。

3、避免网站使用虚拟主机系统、如网站在一段时间未有流量产生,系统会推迟或暂停虚拟服务器,当新访客进入时,将重新进行服务器备份处理(10s或更长时间);

4、后端优化软件性能减少服务器生成的响应到浏览器的时间,比如强化服务器端缓存等。
 

抓取超时问题总结

1、云服务器的服务商要选对,首选阿里云,其次华为云腾讯云也都很不错,尽量不要选择小型服务商,也不要使用虚拟主机。这样,抓取异常问题就会大大减少。
2、页面优化要到位,不要让页面文件过大,过大的页面会严重影响到抓取。
3、带宽要足够大,如果带宽不足,可考虑使用CDN加速。

本文地址:https://xzo.com.cn/operation/seo/107.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于网站优化


SEO(Search Engine Optimization)就是我们常说的网站优化、搜索引擎优化。是一种利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名的方式,目的是让公司网站在互联网上占据领先地位,获得品牌收益。

SEO不是采集,不是拼凑,也不是数据的堆积,其核心的思路其实还是在于更好的用户体验。当你的网站用户体验极佳时,也一定是SEO极好的。反过来说SEO做得很好的站点,用户体验也一定不差。

能否做好SEO,决定了网上获客的流量,也从一定程度上决定了公司的网上业务能够走多远。

推荐网站优化网站运营
网站怎样做百度霸屏优化?
网站怎样做百度霸屏优化?

百度霸屏的概念大家都多多少少听过,很多人以为百度霸屏是一种黑帽优化手法,其...

1 412
交换/留下高质量外链的三个方向
交换/留下高质量外链的三个方向

企业官网美观大方是一方面,做好网站的优化也是另一个重要的方向。外链作为网...

0 562
网站怎样通过图片调整提升优化效果?
网站怎样通过图片调整提升优化效果?

专业的SEO人员不会放过网站上任意一个可优化的细节,比如:网站图片优化,优化好...

0 475
怎样做好网站SEO优化排名的经验之谈
怎样做好网站SEO优化排名的经验之谈

任何一个站长都希望做好seo排名,但seo排名却并不容易获得,竞争的激烈谁都无法...

1 459
【百度专家专栏】什么内容容易被百度判断为优质内容?
【百度专家专栏】什么内容容易被百度判断为优质内容?

怎样做好百度的SEO优化,是许多人没日没夜琢磨的问题。但其实别人的经验都是...

1 491
网站进入沙盒期有什么表现,该怎么做才能尽快走出沙盒期?
网站进入沙盒期有什么表现,该怎么做才能尽快走出沙盒期?

很多站长在初次建站后因为百度没有收录而寝食难安,一遍遍的想确认自己是不是...

0 416
petalbot是什么蜘蛛?
petalbot是什么蜘蛛?

经常查看网站日志的站长会发现有个蜘蛛叫petalbot,看不懂,不知道是不是垃圾蜘...

0 1755
什么是百度token?
什么是百度token?

站长们或早或晚,都会接触到百度token这个数据。那么什么是百度token呢?...

1 1312
推荐插件
帝国cms智能自动审核按星期几审核指定栏目带推送插件
帝国cms智能自动审核按星期几审核指定栏目带推送插件

采集站的必备资源是自动审核,要做到日收录也离不开定时发布。而本插件的自动...

0 1414
帝国cms百度AI图像无损放大api接口对接插件
帝国cms百度AI图像无损放大api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像无损放大的功能。经过...

0 551
帝国cms访问统计ip地址链接与封禁插件下载
帝国cms访问统计ip地址链接与封禁插件下载

下载鸥开发了这款帝国cms封禁ip插件,自动记录访问情况,让我们可以更快的识别...

0 1223
帝国cms联想词搜索高级搜索插件下载
帝国cms联想词搜索高级搜索插件下载

帝国CMS自带的搜索功能虽然强大,但也有很强的局限性 -- 必须关键词完全匹配...

0 904
帝国cms纳米数据接口(足球比赛中最新数据)
帝国cms纳米数据接口(足球比赛中最新数据)

帝国cms 对接纳米数据(www.nami.com)接口,本接口主要接收、整理足球比赛实时数...

0 581
帝国cms自动生成文章新闻目录插件下载
帝国cms自动生成文章新闻目录插件下载

用户体验是我们的需求,百度蜘蛛的认可更是我们的需求。毕竟,没有收录排名,何来...

0 1264
帝国CMS内网用户静态站点文章访客统计插件
帝国CMS内网用户静态站点文章访客统计插件

本插件适用于内网用户,可查看单篇文章访问者ip地址。如果添加访问者ip组,可查...

0 666
帝国cms百度AI图像去雾api接口对接插件
帝国cms百度AI图像去雾api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像去雾的功能。经过实际...

0 550
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入