問題描述

我的 WordPress 博客是完全克隆的。該克隆網站正在使用我的博客即時更新。我很驚訝,有人可以這樣做。

我應該怎麼做才能阻止我的搜索引擎排名中的有害影響?有沒有辦法告訴 Google 不要索引該網站?

最佳解決辦法

他們只是通過 server-side 腳本加載您的網站。所有您需要做的是通過.htaccess 阻止其服務器的 IP 地址。只需打開服務器的訪問日誌,打開他們站點上的克隆頁面,然後查看您的日誌中的新條目,您將擁有自己的 IP 地址。

向 Google 提交數位千禧年數字千年版權法案 (DMCA) 請求也不會受到傷害,但這並不是真的必要,因為一旦阻止他們的 IP 地址,內容將立即消失。

次佳解決辦法

(除了約翰的答案之外)

Is there any way to tell Google not to index that site?

相當好奇,雖然他們似乎已經克隆了所有內容 (包括您的 XML sitemaps * 1),但他們尚未克隆您的 robots.txt 文件。事實上,該網站上的 robots.txt 主動阻止了一切的爬行!所以在這方面似乎沒有什麼可做的。在該域上進行網站搜索只返回裸露的域和通知,指出它被 robots.txt 阻止。

(相當好奇他們的意圖是這樣做的?你也許可以假設他們犯了 robots.txt 錯誤 – 也許這樣 – 但這看起來更像是一個故意的例外嗎?)

此外,雖然您的 XML 網站 Map 被克隆,但它們並沒有更新其中的 URL(正如在主站點頁面上所做的那樣),因此它們仍然指向您的站點。

* 1 關於 XML 網站 Map 。在您的網站上,”sitemap.xml” 實際上是重定向到”sitemap_index.xml”,克隆的網站實際上克隆了重定向… 它重定向回您的網站! (肯定是一個錯誤。)”sitemap_index.xml” 只是一個索引,鏈接到其他 4 個站點 Map 。如果直接在克隆的站點上請求了這些實際的站點 Map 中的任何一個,那麼它們將被正確克隆,並且更新了 URL 。不過,我想説,由於”sitemap.xml” 的初始重定向,這些站點 Map 在克隆站點上是不可能找到的。 (?) 儘管如果他們直接提交了”sitemap_index.xml”,那麼這顯然會繞過重定向。

第三種解決辦法

如果網站產生反向鏈接到您,那麼使用 Google Disavow 工具非常重要,否則該算法會反對您,無論如何。

https://www.google.com/webmasters/tools/disavow-links-main

創建一個.txt 文件並添加:

domain:thedamnsitethatcloned.com

然後通過網站管理員工具將其上傳到 Google 。

這正是我要解決這個問題的步驟。我知道很多網站管理員面臨這個問題。我以前有這個問題,Google 似乎沒有一個直接的答案 (諷刺的是)(這就是為什麼我要幫助) 。 Matt Cutts 是你應該聽這些問題的花花公子,但是聽他説就像是試圖在一座燃燒的房子裏贏得一場超級計算機的棋牌 (沒有任何幫助) 。

短切片:

  1. 註冊 DMCA 並將徽章放在您的網站上。

  2. 收集所有複製的內容,將您的網站的前 60 個詞粘貼到 Google 和 submut VIA https://www.google.com/webmasters/tools/dmca-dashboard DMCA 請求將只接受永久鏈接。

  3. 拒絕已複製內容鏈接到您的每個網站。在您網站的每個頁面上執行此操作。

我的第一個答案是拒絕域名,但我忘了提到你需要拒絕:

  • 萬維網。和

  • 非 www 。

(Google 將其視為兩個不同的域) 。

參考文獻

注:本文內容整合自 Google/Baidu/Bing 輔助翻譯的英文資料結果。如果您對結果不滿意,可以加入我們改善翻譯效果:薇曉朵技術論壇。