问题描述
我的 WordPress 博客是完全克隆的。该克隆网站正在使用我的博客实时更新。我很惊讶,有人可以这样做。
我应该怎么做才能阻止我的搜索引擎排名中的有害影响?有没有办法告诉 Google 不要索引该网站?
最佳解决办法
他们只是通过 server-side 脚本加载您的网站。所有您需要做的是通过.htaccess 阻止其服务器的 IP 地址。只需打开服务器的访问日志,打开他们站点上的克隆页面,然后查看您的日志中的新条目,您将拥有自己的 IP 地址。
向 Google 提交数位千禧年数字千年版权法案 (DMCA) 请求也不会受到伤害,但这并不是真的必要,因为一旦阻止他们的 IP 地址,内容将立即消失。
次佳解决办法
(除了约翰的答案之外)
Is there any way to tell Google not to index that site?
相当好奇,虽然他们似乎已经克隆了所有内容 (包括您的 XML sitemaps * 1),但他们尚未克隆您的 robots.txt 文件。事实上,该网站上的 robots.txt 主动阻止了一切的爬行!所以在这方面似乎没有什么可做的。在该域上进行网站搜索只返回裸露的域和通知,指出它被 robots.txt 阻止。
(相当好奇他们的意图是这样做的?你也许可以假设他们犯了 robots.txt 错误 – 也许这样 – 但这看起来更像是一个故意的例外吗?)
此外,虽然您的 XML 网站 Map 被克隆,但它们并没有更新其中的 URL(正如在主站点页面上所做的那样),因此它们仍然指向您的站点。
* 1 关于 XML 网站 Map 。在您的网站上,”sitemap.xml” 实际上是重定向到”sitemap_index.xml”,克隆的网站实际上克隆了重定向… 它重定向回您的网站! (肯定是一个错误。)”sitemap_index.xml” 只是一个索引,链接到其他 4 个站点 Map 。如果直接在克隆的站点上请求了这些实际的站点 Map 中的任何一个,那么它们将被正确克隆,并且更新了 URL 。不过,我想说,由于”sitemap.xml” 的初始重定向,这些站点 Map 在克隆站点上是不可能找到的。 (?) 尽管如果他们直接提交了”sitemap_index.xml”,那么这显然会绕过重定向。
第三种解决办法
如果网站产生反向链接到您,那么使用 Google Disavow 工具非常重要,否则该算法会反对您,无论如何。
https://www.google.com/webmasters/tools/disavow-links-main
创建一个.txt 文件并添加:
domain:thedamnsitethatcloned.com
然后通过网站管理员工具将其上传到 Google 。
这正是我要解决这个问题的步骤。我知道很多网站管理员面临这个问题。我以前有这个问题,Google 似乎没有一个直接的答案 (讽刺的是)(这就是为什么我要帮助) 。 Matt Cutts 是你应该听这些问题的花花公子,但是听他说就像是试图在一座燃烧的房子里赢得一场超级计算机的棋牌 (没有任何帮助) 。
短切片:
-
注册 DMCA 并将徽章放在您的网站上。
-
收集所有复制的内容,将您的网站的前 60 个词粘贴到 Google 和 submut VIA https://www.google.com/webmasters/tools/dmca-dashboard DMCA 请求将只接受永久链接。
-
拒绝已复制内容链接到您的每个网站。在您网站的每个页面上执行此操作。
我的第一个答案是拒绝域名,但我忘了提到你需要拒绝:
-
万维网。和
-
非 www 。
(Google 将其视为两个不同的域) 。
参考文献
注:本文内容整合自 Google/Baidu/Bing 辅助翻译的英文资料结果。如果您对结果不满意,可以加入我们改善翻译效果:薇晓朵技术论坛。