下载鸥 > 网站下载 > 网站运营 > 网站优化

petalbot是什么蜘蛛?

1726 2021-04-25 21:20:29

收藏
经常查看网站日志的站长会发现有个蜘蛛叫petalbot,看不懂,不知道是不是垃圾蜘蛛。但其实,PetalBot 是Petal搜索引擎(华为花瓣搜索引擎)的自动程序。

petalbot是什么蜘蛛?
PetalBot的功能是访问PC网站和移动网站,并建立索引数据库,使用户可以在 Petal 搜索引擎中搜索您网站的内容。
 

PetalBot UA信息

可以通过分析 User-agent 字段来识别 Petal 的爬虫蜘蛛:

Mozilla/5.0 (Linux; Android 7.0;) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; PetalBot;+https://aspiegel.com/petalbot)
 

阻止PetalBot访问

PetalBot 符合 Internet 机器人协议。您可以使用 robots.txt 文件完全阻止 PetalBot 访问您的网站,或阻止 PetalBot 访问您网站上的某些文件。

注意:禁止PetalBot访问您的网站将使您网站上的页面以及 Petal 提供的所有搜索引擎服务在 Petal 搜索引擎中无法搜索。
 

PetalBot带给Web服务器多少压力

为了获得对目标资源更好的检索结果,PetalBot 需要保持一定程度的网站爬网。我们力求不给网站带来不合理的负担,我们将根据服务器容量,网站质量和网站更新等综合因素进行调整。如果 PetalBot 的访问有任何不合理的行为,请将您的疑虑发送至 search@aspiegel.com。
 

如何判断PetalBot爬行

您可以验证访问您的服务器的 Web 爬网程序是否真的是PetalBot。

验证 PetalBot 为呼叫者
1.使用 host 命令在日志访问 IP 地址上运行反向 DNS 查找。
2.验证域名在 aspiegel.com 中。
3.使用在检索到的域名上的主机命令,对在步骤 1 中检索到的域名运行正向 DNS 查找。验证它是否与日志中的原始访问 IP 地址相同。
 

统计petalbot及其他蜘蛛访问频次

使用下载鸥的网站日志在线分析工具进行蜘蛛抓取频次分析汇总。该工具还支持被访问页面访问频次汇总、ip汇总、404错误页访问频次汇总,是建站利器。

petalbot是什么蜘蛛?
网站日志在线分析工具截图
 

提交到petalbot站长平台

petalbot站长平台地址为https://webmaster.petalsearch.com/,目前似乎只有英文版本。如果担心看不懂,可以使用浏览器的右键翻译为中文。其提交网站认证、提交sitemap的方式与其他站长平台没有什么区别。

本文地址:https://xzo.com.cn/operation/seo/128.html

有帮助,很赞!

信息来源:下载鸥
导出教程 下载word版教程
发表评论 共有条评论
关于网站优化


SEO(Search Engine Optimization)就是我们常说的网站优化、搜索引擎优化。是一种利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名的方式,目的是让公司网站在互联网上占据领先地位,获得品牌收益。

SEO不是采集,不是拼凑,也不是数据的堆积,其核心的思路其实还是在于更好的用户体验。当你的网站用户体验极佳时,也一定是SEO极好的。反过来说SEO做得很好的站点,用户体验也一定不差。

能否做好SEO,决定了网上获客的流量,也从一定程度上决定了公司的网上业务能够走多远。

推荐网站优化网站运营
百度网站收录和快照更新慢怎么办?
百度网站收录和快照更新慢怎么办?

网站被搜索引擎收录后才有机会参与关键词排名,如果不收录,或者收录很慢,那可能...

1 527
网站关键词怎样置才能让网站流量更多、效果更好?
网站关键词怎样置才能让网站流量更多、效果更好?

网站上线后,如果不做SEO优化,则网站相当于白做了。网站建设中关键词应该怎么...

2 390
影响网站关键词优化排名的因素
影响网站关键词优化排名的因素

我们都知道网站关键词排名越靠前越好,但要怎样才能让关键词尽可能的靠前呢?影...

1 433
SEO的前世今生
SEO的前世今生

当下的互联网原住民听到SEO这个词也许并不生疏,但还有更多人其实并不清楚它...

1 485
百度需要什么样的原创文章?
百度需要什么样的原创文章?

所有的网站优化人员都知道内容为王原创为王,但什么样的原创才是高质量的原创...

1 409
蜘蛛爬取我的站点地图返回304是什么意思?
蜘蛛爬取我的站点地图返回304是什么意思?

蜘蛛爬取我的站点后抓取了sitemap.xml文件,但查看网站日志发现返回的不是200...

1 531
10个1000指数的短尾词和1000个10指数的长尾词哪个流量更高?
10个1000指数的短尾词和1000个10指数的长尾词哪个流量更高?

百度指数是我们日常优化参考的一个重要指标,指数越高往往代表着流量越高。许...

0 864
百度蜘蛛活跃时间段分析与定时审核
百度蜘蛛活跃时间段分析与定时审核

很多网站都做了定时发布的功能,通过定时发布的方式,培养蜘蛛抓取习惯达到日收...

3 626
推荐插件
帝国cms在线考试系统模板插件
帝国cms在线考试系统模板插件

一直没看到好用的帝国cms在线考试插件,所以自己开发了一款。在线考试插件用...

0 1385
帝国cms批量添加后台用户插件
帝国cms批量添加后台用户插件

使用帝国cms的企业用户、新闻资讯类站点的用户很多,此类站点很多时候需要有...

0 868
帝国cms百度AI图像去雾api接口对接插件
帝国cms百度AI图像去雾api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像去雾的功能。经过实际...

0 519
帝国cms百度AI图像清晰度增强api接口对接插件
帝国cms百度AI图像清晰度增强api接口对接插件

通过本插件,可以实现帝国cms网站对接百度云api实现图像清晰度增强的功能。经...

0 592
帝国cms自动给正文关键词添加tag内链
帝国cms自动给正文关键词添加tag内链

帝国cms有自带的给关键词添加内链功能,但需要手动添加关键词,容易出现疏漏和...

0 919
帝国cms纳米数据接口(足球比赛中最新数据)
帝国cms纳米数据接口(足球比赛中最新数据)

帝国cms 对接纳米数据(www.nami.com)接口,本接口主要接收、整理足球比赛实时数...

0 533
帝国cms网站会员登录与退出历史记录日志插件
帝国cms网站会员登录与退出历史记录日志插件

帝国cms默认只有上次登录时间与ip,没有一个记录清单,所以今天,我们分享这个帝...

0 478
帝国cms智能自动审核按星期几审核指定栏目带推送插件
帝国cms智能自动审核按星期几审核指定栏目带推送插件

采集站的必备资源是自动审核,要做到日收录也离不开定时发布。而本插件的自动...

0 1382
客服QQ:341553759
扫码咨询 常见问题 >
官方交流群:90432500
点击加入