最近网站被河南郑州大批量爬虫,导致cpu和内存100%网站负载100%,剖析了网站访问日志,创造大量的爬虫采集程序访问网站,手段是通过采集插件或者爬虫软件对网站文章和路径大批量访问get要求。
适用场景:
单一城市代理ip地址重复get网站,可以针对某个城市的要求进行禁止,可以封锁一段韶光后不雅观察网站日志,选择得当的韶光放开即可。

(爬虫利用代理爬取网站文章和热词内容)
百度干系:(查询的大部分结果类似)
通过百度找到了大量的干系于该类的禁止办法和方法此办法已不再适用,干系代码展示如下:
<?php/test.php(屏蔽国家IP)/$verification='美国';//须要屏蔽国家的IPfunctionget_client_ip(){$ip=$_SERVER['REMOTE_ADDR'];if(isset($_SERVER['HTTP_X_REAL_FORWARDED_FOR'])&&preg_match('/^([0-9]{1,3}\.){3}[0-9]{1,3}$/',$_SERVER['HTTP_X_REAL_FORWARDED_FOR'])){$ip=$_SERVER['HTTP_X_REAL_FORWARDED_FOR'];}elseif(isset($_SERVER['HTTP_X_FORWARDED_FOR'])&&preg_match('/^([0-9]{1,3}\.){3}[0-9]{1,3}$/',$_SERVER['HTTP_X_FORWARDED_FOR'])){$ip=$_SERVER['HTTP_X_FORWARDED_FOR'];}elseif(isset($_SERVER['HTTP_CLIENT_IP'])&&preg_match('/^([0-9]{1,3}\.){3}[0-9]{1,3}$/',$_SERVER['HTTP_CLIENT_IP'])){$ip=$_SERVER['HTTP_CLIENT_IP'];}return$ip;}$ip=get_client_ip();//获取访客IP$antecedents=$_SERVER['HTTP_REFERER'];//访客来路地址$result=file_get_contents("http://ip.taobao.com/service/getIpInfo.php?ip=".$ip);//IP数据库来自淘宝。$address=json_decode($result,true);//判断访客是否属于美国,是否来自百度,是否来自谷歌if($address['data']['country']==$verification&&strpos($antecedents,'baidu')===false&&strpos($antecedents,'google')===false){sleep(10);//设置一个10秒等待。header('HTTP/1.1503ServiceTemporarilyUnavailable');header('Status:503ServiceTemporarilyUnavailable');header('Retry-After:3600000');exit;}?>
缘故原由是由于淘宝供应的api已经停滞了。
(源接口要求访问已无法正常打开)
(淘宝官方关照下线通知布告)
百度舆图:
思路:由于百度供应了干系的地址查询做事,不过须要自己注册和认证下。认证过后须要自己创建和申请创建运用:点我前往>>>
TIPS: 1、只有IP白名单内的做事器才能成功发起调用格式: 202.198.16.3,202.198.0.0/16 填写IP地址或IP前缀网段,英文半角逗号分隔如果不想对IP做任何限定,请设置为0.0.0.0/0 (谨慎利用,AK如果透露配额会被其用户消费,上线前可以用作Debug,线上正式ak请设置合理的IP白名单) 2、因新系统升级,自公告之日起,“做事端AK”不再支持浏览器端利用;在浏览器端利用,请选择“浏览器端AK”,例如JavaScript API只支持浏览器类型AK。 对付以前申请的做事端AK,不变更即不受影响,仍支持浏览器端利用;如更新老的做事端AK,再次保存,则按新创建AK处理,不再支持浏览器端利用。
利用方法:
可以将上面的代码要求地址改为:https://api.map.baidu.com/location/ip?ak=运用ak&ip={$ip} 须要将申请创建下来的运用ak填写在上面。
本站办法:
将下述代码放在主题的function.php下即可利用:(百度舆图api办法)