MauiBot 不同于其他爬虫,这个爬虫连网站都没有,UA只显示一个邮箱:”MauiBot (crawler.feedback+wc@gm ail.com)“。神奇的是这个看起来是个人爬虫,竟然遵循robots协议,算得上垃圾爬虫的一股清流。
好在遵循robots协议,可以用robots.txt协议进行禁止。
协议如下:
User-agent: MauiBot
Disallow: /
MauiBot 不同于其他爬虫,这个爬虫连网站都没有,UA只显示一个邮箱:”MauiBot (crawler.feedback+wc@gm ail.com)“。神奇的是这个看起来是个人爬虫,竟然遵循robots协议,算得上垃圾爬虫的一股清流。
好在遵循robots协议,可以用robots.txt协议进行禁止。
协议如下:
User-agent: MauiBot
Disallow: /
aiHit蜘蛛
微软学术蜘蛛
ImageSift蜘蛛
有道蜘蛛
雅虎中国蜘蛛
网页爬虫
SEMrush蜘蛛
宜搜蜘蛛
即刻搜索
腾讯搜搜蜘蛛
Coccoc蜘蛛
Cloudflare蜘蛛