宝塔面板根据访问协议头屏蔽字节跳动爬虫

 262 2019-10-27 13:31:14 艾奇站长网

TAG:字节跳动爬虫协议头宝塔面板

最近,字节跳动搜索引擎的爬虫疯狂爬取全网资源,导致一些小网站服务器不堪重负,严重的直接使网站宕机。

我们有很多方法可屏蔽掉爬虫,比如 robots.txt ,但是貌似字节跳动旗下的今日头条爬虫比较流氓,他不遵守这个!还有一个通过屏蔽IP的方式,但是一般爬虫的IP地址比较多,这个也挺麻烦。

这里站长图库介绍一种方法,有一定的效果,如下:


nginx在站点的设置,配置文件中 server{ } 中添加

#禁止爬虫工具的抓取
if ($http_user_agent ~* "Bytespider|YisouSpider") {
    return 403;
}

注:Bytespider 为字节跳动爬虫的协议头


Apache:

在伪静态里设置 这里以ThinkPHP为例!

<IfModule mod_rewrite.c>
RewriteEngine on
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^(.*)$ index.php [L,E=PATH_INFO:$1]
 #禁止爬虫工具的抓取
RewriteCond %{HTTP_USER_AGENT} "^.*Bytespider.*|.*YisouSpider.*$" [NC]
RewriteRule ^(.*)$ - [R=404,L]
</IfModule>

以上,就是根据访问协议头屏蔽字节跳动爬虫的方法,希望能对大家有所帮助!


猜你喜欢
WordPress 指定分类显示指定文本

WordPress 指定分类显示指定文本

教程资讯 265 2019-10-02

获取分类ID 并进行判断和输出获取当前分类ID,进行if 判断当前分类ID 是否为指定分类ID 。根据这篇文章,设计了这...

TAG:WordPress指定文本

微信小程序实现邀请好友组队功能

微信小程序实现邀请好友组队功能

教程资讯 165 2019-10-19

微信小程序实现邀请好友组队功能battle.wxml<!--pages/battle/battle.wxml--&...

TAG:小程序组队

JS禁止F12和鼠标右键代码

JS禁止F12和鼠标右键代码

教程资讯 301 2019-09-27

一共两块代码 一个禁止F12和鼠标右键代码 代码可以禁止别人F12和鼠标右键代码 可以防止别人偷去你的代码和你的源码。话...

TAG:禁止右键鼠标右键

百度站长工具里的LOGO权限快速开启必有绝招

百度站长工具里的LOGO权限快速开启必有绝招

教程资讯 133 2019-09-30

无论是针对seo从业者还是普通用户,带有百度站点LOGO的网站和没有百度站点LOGO的网站,带有百度站点LOGO的网站都...

TAG:站长工具LOGO