教程介紹

首先我們不得不感謝奶嘴大神給我們帶來的精心教程,來自 WordPress 禁止惡意 HTTP_USER_AGENT,防採集防部分攻擊的説明,小 2 覺得很使用,就轉載過來了,感謝奶嘴大神為 WordPress 方面所做出的貢獻,怪不得 WP.COM 要把奶嘴挖去做中國區域的維護人話。。。好啦,下面我們説説今天這個教程的主題內容吧

我們要想知道一個用户的訪問意圖,可以通過 HTTP_USER_AGENT 來獲取,而一般的正常訪客是 HTTP_USER_AGENT 表示也是很常規的,這裏就不説什麼了,我們要説的是,哪些 HTTP_USER_AGENT 是採集軟件或者惡意攻擊者所具備的標識呢?那麼下面的一串代碼就可以解決我們的疑惑

  1. $ua = $_SERVER['HTTP_USER_AGENT'];
  2. $now_ua = array('FeedDemon ','ZmEu','Indy Library','oBot','jaunty'); 
  3. if(!$ua) { 
  4. header("Content-type: text/html; charset=utf-8");
  5. wp_die('請勿採集本站,因為採集的站長木 JJ!');
  6. }else{
  7.     foreach($now_ua as $value )
  8.     if(eregi($value,$ua)) {
  9.     header("Content-type: text/html; charset=utf-8");
  10.     wp_die('請勿採集本站,因為採集的站長木 JJ!');
  11.     }
  12. }

將上面的代碼放到 WordPress 主題文件夾的 functios.php 裏面,即可,$now_ua 裏面的數組就代表着目前較為常規的惡意採集軟件類的 HTTP_USER_AGENT 標識!

User Agent 公佈列表

FeedDemon 內容採集
BOT/0.1 (BOT for JCE) sql 注入
CrawlDaddy sql 注入
Java 內容採集
Jullo 內容採集
Feedly 內容採集
UniversalFeedParser 內容採集
ApacheBench cc 攻擊器
Swiftbot 爬蟲
YandexBot 爬蟲
AhrefsBot 爬蟲
YisouSpider 爬蟲
jikeSpider 爬蟲
MJ12bot 爬蟲
ZmEu phpmyadmin 漏洞掃描
WinHttp 採集 cc 攻擊
EasouSpider 爬蟲
HttpClient tcp 攻擊
Microsoft URL Control 掃描
YYSpider 爬蟲
jaunty WordPress 爆破掃描器
oBot 爬蟲
Python-urllib 內容採集
Indy Library 掃描
FlightDeckReports Bot 爬蟲

大家可以根據上面的 User Agent 公佈列表自由的在代碼裏拓展所屏蔽的 User Agent 值!

最後還是感謝奶嘴大神的教程!