下载鸥 > 网站下载 > 网站运营 > 网站优化

网站抓取超时是什么原因,要怎么办?

334 2021-04-12 18:43:41

收藏

简述

云服务器服务商要选对 ,页面要做优化,带宽要够用,这样才能尽量避免抓取超时问题。
网站抓取超时是一个发生频率比较低的问题,大多数站点都不会遇到。但如果遇到了,就一定要重视。否则,如果经常性发生抓取超时的异常,降权就很有可能发生。
 

抓取超时的原因解析

1、DNS问题,无论是蜘蛛还是用户访问网站,首先就需要域名的DNS做了正确的解析,然而解析是解析了,你能确定DNS真的稳定吗?不少站点的错误,正是因为DNS不稳定而造成的。尤其是那些又做域名注册,又搞‘域名抢注’的平台,这样的平台,更容易出现DNS解析不稳定的情况,尤其是在抢注高峰期。具体哪些品牌,这个就不点名了,如果你的域名在这些平台中,建议最好是将其转出到其他稳定的平台。

2、页面太大,有一些网站的部分页面达到了5兆的以上情况,甚至还见过极少的网站出现过一个页面有10MB大小。这样的页面,更容易出现抓取超时的问题。正常情况,并不建议网站的页面大小超过3MB,同时建议网站服务器启用GZIP压缩。

3、带宽不足,这是一个很常见的情况,不少站点出现链接超时都是因为带宽不足而引发的。我们知道1M的带宽峰值下载是128KB,如果网站是1M接入,页面大小是256KB,如果同时2个人在打开页面,那么就需要4秒才可以下载完毕。如果带宽是2MB,页面大小是1024KB,一个人打开网站需要8秒,可如果是10个人同时打开呢?所以带宽这里,一定要做足。站长或者企业都应当观察一下站点的平均带宽,以及峰值带宽情况,如果经常出现‘带宽峰值’类型的访问,那么就一定要升级带宽了。

4、首字节时间太长,可能很多同学没有听说过这个问题,它指的是从发送请求到WEB服务器的时间+WEB服务器处理请求并生成响应花费的时间。有一些站点,首字节时间居然都可以达到5MS,这样的情况,网站还能正常吗?
 

抓取超时的解决方案

1、对于首字节时间这里,我们应当注意:避免网站与其他网站共享同一个服务器。这是因为,其他网站会占用自身网站服务器处理时间。

2、使用CDN。CDN的意义在于减少内容和访问者之间的“距离”,通过将静态内容分发到CDN,CDN的内容自动复制到各个位置,在地理上更接近用户,从而减少TTFB的时间。

3、避免网站使用虚拟主机系统、如网站在一段时间未有流量产生,系统会推迟或暂停虚拟服务器,当新访客进入时,将重新进行服务器备份处理(10s或更长时间);

4、后端优化软件性能减少服务器生成的响应到浏览器的时间,比如强化服务器端缓存等。
 

抓取超时问题总结

1、云服务器的服务商要选对,首选阿里云,其次华为云腾讯云也都很不错,尽量不要选择小型服务商,也不要使用虚拟主机。这样,抓取异常问题就会大大减少。
2、页面优化要到位,不要让页面文件过大,过大的页面会严重影响到抓取。
3、带宽要足够大,如果带宽不足,可考虑使用CDN加速。

本文地址:https://xzo.com.cn/operation/seo/107.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于网站优化


SEO(Search Engine Optimization)就是我们常说的网站优化、搜索引擎优化。是一种利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名的方式,目的是让公司网站在互联网上占据领先地位,获得品牌收益。

SEO不是采集,不是拼凑,也不是数据的堆积,其核心的思路其实还是在于更好的用户体验。当你的网站用户体验极佳时,也一定是SEO极好的。反过来说SEO做得很好的站点,用户体验也一定不差。

能否做好SEO,决定了网上获客的流量,也从一定程度上决定了公司的网上业务能够走多远。

推荐网站优化网站运营
SEO新人怎样做网站优化?
SEO新人怎样做网站优化?

一个网站不是做好了就可以,如果不做优化,网站没有流量就无法发挥出网站的价值...

1 348
做好网站优化,决胜互联网
做好网站优化,决胜互联网

互联网的商战早已变成了当今社会发展的必然趋势,不论是什么企业,只要要想紧跟...

3 282
怎样做百度搜索引擎下拉框联想词的优化?
怎样做百度搜索引擎下拉框联想词的优化?

有些品牌本身关注度高,就会自然产生下拉联想词,关注度的低的只能通过技术手段...

1 353
新手入门seo要怎样做优化?
新手入门seo要怎样做优化?

SEO不难,但很多人之所以做不好seo是因为没有掌握正确的方法,又没有坚持下去。...

0 444
养站是什么意思?怎样养出一个当天收录的好网站?
养站是什么意思?怎样养出一个当天收录的好网站?

只要接触seo长一点的人,基本都听说过养站的说法,但却未必都会养。养好一个网...

1 326
百度需要什么样的原创文章?
百度需要什么样的原创文章?

所有的网站优化人员都知道内容为王原创为王,但什么样的原创才是高质量的原创...

1 290
常见的垃圾蜘蛛名称与排查方式
常见的垃圾蜘蛛名称与排查方式

一个网站从上线之后数天起,就会开始有蜘蛛访问。即便没有百度收录的时候,也是...

0 371
网站备案有什么好处?
网站备案有什么好处?

任何一个站长在建站之初就会了解备案这个概念,而什么是备案,备案又有什么好处...

0 480
推荐插件
帝国cms多栏目多数据表自动审核推送插件
帝国cms多栏目多数据表自动审核推送插件

本插件基于帝国cms帝国cms每日自动审核插件,在自动审核指定条数信息的基础上...

0 779
帝国cms自动给正文关键词添加tag内链
帝国cms自动给正文关键词添加tag内链

帝国cms有自带的给关键词添加内链功能,但需要手动添加关键词,容易出现疏漏和...

0 656
帝国cms百度AI图像清晰度增强api接口对接插件
帝国cms百度AI图像清晰度增强api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像清晰度增强的功能。经...

0 419
帝国cms自动生成文章新闻目录插件下载
帝国cms自动生成文章新闻目录插件下载

用户体验是我们的需求,百度蜘蛛的认可更是我们的需求。毕竟,没有收录排名,何来...

0 972
帝国cms纳米数据接口(足球比赛中最新数据)
帝国cms纳米数据接口(足球比赛中最新数据)

帝国cms 对接纳米数据(www.nami.com)接口,本接口主要接收、整理足球比赛实时数...

0 162
帝国cms百度文字识别ocr接口对接插件
帝国cms百度文字识别ocr接口对接插件

许多网站会做一些小功能小插件给客户使用以增强用户黏性,比如图片转文字,这种...

0 362
帝国CMS内网用户静态站点文章访客统计插件
帝国CMS内网用户静态站点文章访客统计插件

本插件适用于内网用户,可查看单篇文章访问者ip地址。如果添加访问者ip组,可查...

0 451
帝国cms智能自动审核按星期几审核指定栏目带推送插件
帝国cms智能自动审核按星期几审核指定栏目带推送插件

采集站的必备资源是自动审核,要做到日收录也离不开定时发布。而本插件的自动...

0 1127
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入