搜索引擎蜘蛛照妖镜 - 快速识别真假搜索引擎爬虫IP,防止伪造User-Agent的恶意爬虫消耗您的服务器资源。
蜘蛛检测结果
四六啦工具查询 - 添加浏览器收藏夹,使用更方便 | |||
序号 | IP地址 | 反向解析 | 识别结果 |
1 | 220.181.108.80 | baiduspider-220-181-108-80.crawl.baidu.com | 百度蜘蛛 |
2 | 42.236.102.3 | hn.kd.ny.adsl | 360搜索蜘蛛 |
3 | 42.236.107.3 | hn.kd.ny.adsl | 不是搜索引擎蜘蛛 |
检测说明:
- 通过DNS反向解析验证搜索引擎爬虫IP的真实性
- 支持检测百度、谷歌、搜狗、360、今日头条、神马、雅虎、必应等主流搜索引擎
- 可有效识别伪造User-Agent的恶意爬虫程序
- 每次最多检测100个IP地址,避免服务器压力
- 帮助站长节省带宽资源,提升网站性能
搜索引擎蜘蛛照妖镜工具说明
目前支持识别的搜索引擎ip蜘蛛有8个:
谷歌搜索引擎蜘蛛 百度搜索引擎蜘蛛 360搜索引擎蜘蛛 搜狗搜索引擎蜘蛛 雅虎搜索引擎蜘蛛 神马搜索引擎蜘蛛 必应搜索引擎蜘蛛 字节跳动搜索引擎蜘蛛
使用场景
1、对于一个攻击者,或者采集者,伪装成搜索引擎,很容易躲过你的肉眼检查,兴奋的你还在为搜索引擎来访而洋洋得意的时候,其实是个假蜘蛛
2、如果你的站点对搜索引擎蜘蛛要求比较精细,你可以通过openresty的resty.dns.resolver模块+user-agent,在content_by_lua_file中实现精确的访客控制!
3、通过ip反向查询蜘蛛,可以让假引擎蜘蛛现行,直接扼杀在黑名单中!
4、识别出假蜘蛛处理的方法有很多,不再一一细说!
实现原理
部分官方已明确给出了确定真实蜘蛛的方法,比如百度官网所说,可以使用dns反向解析,可以确认正确的蜘蛛,比如:
E:\bugscansplit>nslookup 220.181.108.80 服务器: public1.114dns.com Address: 114.114.114.114 名称: baiduspider-220-181-108-80.crawl.baidu.com Address: 220.181.108.80
那么后缀为.baidu.com的就是真实的蜘蛛,其他同理,都有相应的反向域名后缀标志,通过收集这些后缀,就形成了这个工具!
工具亮点
1、搜索引擎蜘蛛照妖镜,是实时通过nslookup检测,具有很高的时效性和准确性!
2、另外因为本人能力有限,收集的蜘蛛IP还不足够多,对于未能检测出来的ip也不一定是假蜘蛛,对于检测出来的一定是真蜘蛛!
3、工具提供的结果只作为参考,请务用于真实业务场景
相关导航
本文暂时没有评论,来添加一个吧(●'◡'●)