教程由來

很多小夥伴都在使用七牛 cdn 來加快網站的訪問速度,尤其是七牛的靜態文件鏡像功能更是非常方便的幫站長把網站本地的靜態文件同步到七牛的 cdn 服務器上,不過呢很多小夥伴在使用七牛的 cdn 鏡像一段時間之後都發現網站莫名其妙的被百度降權了,才發現原來七牛的鏡像功能會把網站的 html 內容也鏡像到七牛上,這樣一來就相當於七牛上存在一個鏡像站點,對於 seo 來説是非常不友好的,所以也就造成大量使用了七牛鏡像功能的網站被百度降權。

當時爆出這個問題的時候七牛官方給出了一個處理方法,就是上傳 robots.txt 來禁止爬蟲抓取鏡像站點,不過小 V 覺得這種方法完全是治標不治本的方法

處理方案:

通過 UserAgent 來屏蔽七牛鏡像爬蟲對網頁文件的抓取,代碼如下:

  1. ifstrpos($_SERVER['HTTP_USER_AGENT'],'qiniu-imgstg-spider') !== false) {
  2. echo '防七牛鏡像';
  3. exit;
  4. }

將以上代碼加到網站根目錄呃 index.php 文件的

加上以上代碼,七牛 cdn 的鏡像爬蟲再來鏡像網頁文件就會返回 503 狀態:

直接訪問鏡像站點,效果圖:

20141121150041

由於只是在 php 上做限制所以不影響其他靜態文件的鏡像加速~~。

使用了 WP Super Cache 插件的小夥伴請將七牛的 ua 加入到禁止緩存列表中,如下圖:

1221415854652

(PS:如果之前已經被七牛鏡像了,請先清空七牛的緩存,或者添加代碼後更新緩存~~)

問題衍生

綜上教程,如果發現,七牛二級域名的首頁還是被鏡像,可以訪問的話,那麼大叔這有個另類點的竅門哈,製作一個 403 、 503 等單頁面,在七牛還未鏡像前把它放到網站的根目錄下,然後訪問主域名看看自己的站是不是變成了 403 、 503 等報錯頁面,如果是,那麼 OK,下面再開始使用七牛的鏡像 (這裏可能有點迷糊,站都打不開了還怎麼用七牛?放心後台還是可以打開操作的,現在可以在 WP 後台設置七牛插件的參數,什麼 ACCESS KEY 啊、 SECRET KEY 等),如果已經鏡像了的,建議刪除七牛空間,重新配置個七牛空間名,然後讓七牛將你 403 的首頁進行一個鏡像,到這裏,我想大家也瞭解是個神馬意思了,現在再訪問下七牛的二級域名試試看?首頁、內頁鏈接是不是全都成了 403 報錯了,如是這樣,那麼可以放心使用七牛的媒體加速服務了!

最後整理了一些錯誤頁面給大家吧,下載點擊→ GO