• 好朋友、和平奖可能人家抱了。 2019-05-20
  • 【北京荣祥月达车型报价】北京荣祥月达综合店车型价格 2019-05-20
  • 脸上长痘代表对应内脏有问题?专家:未发现相关性 2019-05-19
  • 和静县首届东归节6月23日开幕 2019-05-18
  • 太空监视飞行器相关新闻 2019-05-18
  • 警车化身“产房” 冰雪路上“生命接力” 2019-05-17
  • 百部网络正能量动漫音视频作品评选 2019-05-16
  • 初二少年与家长争吵离家出走 客运站人员发觉异样后拦下 2019-05-15
  • 陈海滢的专栏作者中国国家地理网 2019-05-14
  • 乐平市:开展流动党校“培训在基层”活动(图) 2019-05-13
  • 你遇到了吗用户吐槽升iOS 11.4后耗电过快用户吐槽升iOS11后耗电过快-行情资讯 2019-05-12
  • 兼容海量游戏外设 微软打碟机竟是万用控制器 2019-05-12
  • (原创)取消“份子钱”是出租车改革必须迈出的一步 2019-05-11
  • 京城“风筝赵”教你玩转北京风筝 2019-05-11
  • 埃及苏伊士运河大学孔子学院企业拓展训练营顺利举行 2019-05-10
  • 香港赛马会六和彩今期资料:Nginx服务器屏蔽与禁止屏蔽网络爬虫的方法

    香港赛马会网站惠泽社绝杀八码 www.mwcrz.tw  更新时间:2019年03月16日 10:35:28   作者:CODETC   我要评论

    今天小编就为大家分享一篇关于Nginx服务器屏蔽与禁止屏蔽网络爬虫的方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧

    每个网站通常都会遇到很多非搜索引擎的爬虫,这些爬虫大部分都是用于内容采集或是初学者所写,它们和搜索引擎的爬虫不一样,没有频率控制,往往会消耗大量服务器资源,导致带宽白白浪费了。

    其实Nginx可以非常容易地根据User-Agent过滤请求,我们只需要在需要URL入口位置通过一个简单的正则表达式就可以过滤不符合要求的爬虫请求:

    location / {
      if ($http_user_agent ~* "python|curl|java|wget|httpclient|okhttp") {
        return 503;
      }
      # 其它正常配置
      ...
    }

    注意:变量$http_user_agent是一个可以直接在location中引用的Nginx变量。~*表示不区分大小写的正则匹配,通过python就可以过滤掉80%的Python爬虫。

    Nginx中禁止屏蔽网络爬虫

    server { 
        listen    80; 
        server_name www.xxx.com; 
        #charset koi8-r; 
        #access_log logs/host.access.log main; 
        #location / { 
        #  root  html; 
        #  index index.html index.htm; 
        #} 
      if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot") { 
            return 403; 
        } 
      location ~ ^/(.*)$ { 
            proxy_pass //localhost:8080; 
        proxy_redirect     off; 
        proxy_set_header    Host $host; 
        proxy_set_header    X-Real-IP $remote_addr; 
        proxy_set_header    X-Forwarded-For  $proxy_add_x_forwarded_for; 
        client_max_body_size  10m; 
        client_body_buffer_size 128k; 
        proxy_connect_timeout  90; 
        proxy_send_timeout   90; 
        proxy_read_timeout   90; 
        proxy_buffer_size    4k; 
        proxy_buffers      4 32k; 
        proxy_busy_buffers_size 64k; 
        proxy_temp_file_write_size 64k; 
      } 
        #error_page 404       /404.html; 
        # redirect server error pages to the static page /50x.html 
        # 
        error_page  500 502 503 504 /50x.html; 
        location = /50x.html { 
          root  html; 
        } 
        # proxy the PHP scripts to Apache listening on 127.0.0.1:80 
        # 
        #location ~ \.php$ { 
        #  proxy_pass  //127.0.0.1; 
        #} 
        # pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000 
        # 
        #location ~ \.php$ { 
        #  root      html; 
        #  fastcgi_pass  127.0.0.1:9000; 
        #  fastcgi_index index.php; 
        #  fastcgi_param SCRIPT_FILENAME /scripts$fastcgi_script_name; 
        #  include    fastcgi_params; 
        #} 
        # deny access to .htaccess files, if Apache's document root 
        # concurs with nginx's one 
        # 
        #location ~ /\.ht { 
        #  deny all; 
        #} 
      } 

    可以用 curl 测试一下

    curl -I -A "qihoobot" www.xxx.com

    总结

    以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

  • Nginx反向代理websocket配置实例

    Nginx反向代理websocket配置实例

    这篇文章主要介绍了Nginx反向代理websocket配置实例,本文是项目需求配置成功后的总结,需要的朋友可以参考下
    2014-09-09
  • 修改Nginx与Apache上传文件大小限制

    修改Nginx与Apache上传文件大小限制

    这篇文章主要介绍了修改Nginx与Apache上传文件大小限制,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-10-10
  • 高并发nginx服务器的linux内核优化配置讲解

    高并发nginx服务器的linux内核优化配置讲解

    今天小编就为大家分享一篇关于高并发nginx服务器的linux内核优化配置讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • nginx 服务绑定域名的方法

    nginx 服务绑定域名的方法

    这篇文章主要介绍了nginx 服务绑定域名的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-09-09
  • 详解nginx服务器绑定域名和设置根目录的方法

    详解nginx服务器绑定域名和设置根目录的方法

    这篇文章主要介绍了详解nginx服务器绑定域名和设置根目录的方法,nginx服务器绑定域名以及设置根目录非常方便,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-06-06
  • nginx虚拟主机配置实例详解

    nginx虚拟主机配置实例详解

    这篇文章主要介绍了nginx虚拟主机配置实例详解的相关资料,需要的朋友可以参考下
    2017-06-06
  • 最新评论

    常用在线小工具

  • 好朋友、和平奖可能人家抱了。 2019-05-20
  • 【北京荣祥月达车型报价】北京荣祥月达综合店车型价格 2019-05-20
  • 脸上长痘代表对应内脏有问题?专家:未发现相关性 2019-05-19
  • 和静县首届东归节6月23日开幕 2019-05-18
  • 太空监视飞行器相关新闻 2019-05-18
  • 警车化身“产房” 冰雪路上“生命接力” 2019-05-17
  • 百部网络正能量动漫音视频作品评选 2019-05-16
  • 初二少年与家长争吵离家出走 客运站人员发觉异样后拦下 2019-05-15
  • 陈海滢的专栏作者中国国家地理网 2019-05-14
  • 乐平市:开展流动党校“培训在基层”活动(图) 2019-05-13
  • 你遇到了吗用户吐槽升iOS 11.4后耗电过快用户吐槽升iOS11后耗电过快-行情资讯 2019-05-12
  • 兼容海量游戏外设 微软打碟机竟是万用控制器 2019-05-12
  • (原创)取消“份子钱”是出租车改革必须迈出的一步 2019-05-11
  • 京城“风筝赵”教你玩转北京风筝 2019-05-11
  • 埃及苏伊士运河大学孔子学院企业拓展训练营顺利举行 2019-05-10