首页 > 代码

用宝塔面板的网站,搭建把防爬虫及无效蜘蛛规则

用宝塔面板的网站,搭建把防爬虫及无效蜘蛛规则
建议你把防爬虫规则放在 /www/server/nginx/conf/blockbots.conf,宝塔的 Nginx 主配置通常在这个路径下加载额外配置。
一、打开路径: /www/server/nginx/conf/
在这个路径下新建个文件:blockbots.conf ,复制下面的代码进去保存。
————————————

# 通用防爬虫规则
if ($http_user_agent ~* "(Scrapy|Curl|HttpClient|AhrefsBot|MJ12bot|Bytespider|FeedDemon|JikeSpider|heritrix|MegaIndex|Sogou|Zoominfo|dotbot|python-requests|Wget|Java|^$)") {
    return 403;
}

if ($request_method !~ ^(GET|HEAD|POST)$) {
    return 403;
}

if ($http_user_agent = "") {
    return 403;
}

------------------------------------
二、在每个站点配置中 include 引入防爬虫规则
打开宝塔面板 → 网站 → 选择你的站点(如 gushu6.com)→ 点击【设置】→进入【配置文件】
在 server {} 代码块中加一行:
------------------------------------
include /www/server/nginx/conf/blockbots.conf;
------------------------------------
示例:


server {
    listen 443 ssl http2;
    server_name gushu.com www.gushu.com;

    include /www/server/nginx/conf/blockbots.conf;

    root /www/wwwroot/gushu6.com;
    index index.php index.html;
    ...
}

  • 用python批量提取wordpress文章标题关键词,再全自动给相关文章打标签
  • 文章很多,相关文章也很多,用标签相互关联起来,有利于访问者也有利于seo, 靠纯手工应对操作,会很快崩溃!所以 […]

  • 一次性清空所有wordpress标签,以及后续标签从新id开始
  • 要一次性清空 WordPress 所有标签(tags),并确保 后续新标签的 ID 从头开始(如从1开始),你 […]

  • wordpress关键词批量打标签工具
  • 举个栗子:我的网站里有很多关于刘亦菲的文章,现在需要给所有标题里含有“刘亦菲”的文章 打个(刘亦菲)的标签, […]

  • wordpress补全标签tag关联文章工具插件
  • 给同类文章加上了tag标签,可是依然有部分同类文章没加上或忘记加, 如果手动回去慢慢搞,量不多还好说,可是量一 […]

  • 极简!不用插件的高亮代码引用显示,直接调用jsdelivr的js和css
  • 首先,确定你不是一个喜欢装逼追求极致人的,要什么真正的高亮呀,要显示行号呀,要一键复制呀。说实在的,少用一个功 [&hell...

  • 将阿里云上的数据库直接导出到本地,突破100万限制
  • 前提背景:购买了阿里的数据库服务,网站数据几百万条,直接用阿里在线的DMS导出数据,只能导出100万条,超过了 […]