首页 > 代码

用宝塔面板的网站,搭建把防爬虫及无效蜘蛛规则

用宝塔面板的网站,搭建把防爬虫及无效蜘蛛规则
建议你把防爬虫规则放在 /www/server/nginx/conf/blockbots.conf,宝塔的 Nginx 主配置通常在这个路径下加载额外配置。
一、打开路径: /www/server/nginx/conf/
在这个路径下新建个文件:blockbots.conf ,复制下面的代码进去保存。
————————————

# 通用防爬虫规则
if ($http_user_agent ~* "(Scrapy|Curl|HttpClient|AhrefsBot|MJ12bot|Bytespider|FeedDemon|JikeSpider|heritrix|MegaIndex|Sogou|Zoominfo|dotbot|python-requests|Wget|Java|^$)") {
    return 403;
}

if ($request_method !~ ^(GET|HEAD|POST)$) {
    return 403;
}

if ($http_user_agent = "") {
    return 403;
}

------------------------------------
二、在每个站点配置中 include 引入防爬虫规则
打开宝塔面板 → 网站 → 选择你的站点(如 gushu6.com)→ 点击【设置】→进入【配置文件】
在 server {} 代码块中加一行:
------------------------------------
include /www/server/nginx/conf/blockbots.conf;
------------------------------------
示例:


server {
    listen 443 ssl http2;
    server_name gushu.com www.gushu.com;

    include /www/server/nginx/conf/blockbots.conf;

    root /www/wwwroot/gushu6.com;
    index index.php index.html;
    ...
}

  • 服务器上mysql数据库很多,某个库把整台服务器拉爆了,如何定位找到罪魁?
  • 服务器上mysql数据库很多,某个数据库把整台服务器拉爆了,如何定位找到罪魁? 先在 MySQL 里把“正在烧 […]

  • 极速打包几百万文件成.zip,比传统方式快几十倍
  • 假如,一个文件夹里面有几十上百万张图片,要把这个文件夹打包成.zip,按传统的windows自带的工具压缩或普 […]

  • Rufus是什么?为什么很多人推荐
  • Rufus 是一个非常流行的Windows 平台下用于创建启动U盘(Bootable USB)的免费工具。官网 […]

  • 批量设置wordpress文章分类,把文章 ID 区间为 1256869 到 1257421批量设置分类为 ID =5
  • 将 cuwen.wp_posts 中 文章 ID 区间为 1256869 到 1257421(含) 的文章批量 […]

  • 同一台服务器里的两个wordpress数据库文章内容叠加复制
  • 问题:同一台服务器里的两个wordpress数据库,我要把名为temp数据库里的wp_posts的所有文章 全 […]

  • WordPress 如何在首页与内页用不同的菜单或header
  • 开发wordpress主题时,首页的header内容与内页的header内容希望不一样,这时就要用到WordP […]