因为现在很多人在做自己的论坛,为了对他们有些帮助,我打算把我优化这个论坛的步骤写下来。文章会分为好几篇来写,由于涉及的细节很多,我自己也是在边写帖子边给论坛做 SEO 优化,所以我也不知道会写到什么时候结束。

1,选择论坛程序和版本。

我选择的论坛程序是 Discuz!x1.5,语言版本是 gbk 版。为什么选这个版本呢?

首先 Discuz!x1.5 的用户体验要比 Discuz!7.2 好很多,大家慢慢用这个论坛就会发现这一点。然后 Discuz!x1.5 的 SEO 基础也要比 Discuz!7.2 好。

其实 Discuz!7.2 是有很多 SEO 上面的缺陷的,以前那个老论坛我想做一下 SEO 优化,但是发现要改的还真不少。但是 Discuz!x1.5 注意到了很多对 SEO 不友好的地方,如很多容易产生重复的链接就用 JS 调用等等。

显然 Discuz!x1.5 的开发团队做事非常用心,让我也对改这个论坛程序有信心很多。

那为什么要选 GBK 版本而不选 UTF8 版本呢? 这是为了让中文搜索引擎第一时间知道我网站上的内容是中文版本。

爬虫在 GBK 编码的网页,看到的是:

  1. <html
    xmlns="http://www.w3.org/1999/xhtml">
  2. <head>
  3. <meta http-equiv="Content-Type" content="text/html;
    charset=gbk" />

而在 utf-8 编码的网页看到的是:

  1. <html
    xmlns="http://www.w3.org/1999/xhtml">
  2. <head>
  3. <meta http-equiv="Content-Type" content="text/html;
    charset=utf-8" />

Utf-8 编码的网页,一时半会还真不知道这个网站里的内容是什么语言的,而且如果一个网页中有中文和有英文的时候,搜索引擎还要根据其他一些条件来判断网站的语言版本。而 GBK 版本一看就知道是中文的了。

大家如果去查看一下的话,Discuz 官方论坛用的就是 GBK 版本。

那已经在用 utf-8 的中文 discuz 论坛怎么办呢?  其实还是有方法解决的,可以定义一下 xmlns 属性,把 lang="zh-CN" 加在里面就可以了。 所以 utf-8 版本的代码变为:

  1. <html
    xmlns="http://www.w3.org/1999/xhtml" lang="zh-CN">
  2. <head>
  3. <meta http-equiv="Content-Type" content="text/html;
    charset=utf-8" />

Discuz 论坛很多文件都需要这么改,可以用 Dreamweaver 整站查找一下。很多其他网站也一样。这样改好后,搜索引擎能识别这个网页为简体中文版。

wordpress 程序之所以 SEO 方面表现很好,就是因为这些细节它都注意到了的。 可以看看我的博客 http://blog.weixiaoduo.com/,WordPress 程序默认都会定义这个标签的。

2,选择服务器系统

我是很早就不想用 windows 做服务器操作系统了,只要体会过 linux 系统好处的人恐怕都是如此。其实,选择什么样的服务器系统也能影响 SEO 效果
的。我最近给很多大中型网站做 SEO 顾问的时候据发现一个很有趣的规律:
凡是用 windows 类系统搭建的网站,SEO 方面的表现都是不太理想的,而且要优化起来难度也是大一些的。

原因是很多方面的,因为 windows 类主机不是很稳定,只要程序员不那么熟悉整个网站,要么被动的频繁当机、要么需要主动停机维护、要么数据库压力大以
及运行的代码先天不足导致服务器速度非常慢。 我观察过很多网站的爬虫访问情况,在同等条件下,windows 类主机的抓取量都是差一些的。

当然,这个问题在一个资深的技术人员手里都不是问题,但就是优秀的技术人员实在太难找到了。 (顺便广告一下:我们公司招 c++和 PHP 人员,有兴趣的联系
一下我。本广告长期有效。)

3,优化网站的访问速度

网页的加载速度对 SEO 影响比较大优化网站的加载速度,可以从以下几个方面来优化。

1)DNS
2) 服务器网络环境
3) 服务器硬件和系统
4) 网站程序或 CMS
5) 前端代码

这些因素不用去记的,基本上就是看爬虫从发起一个请求到返回数据,中间需要经过哪些途径,然后优化这些相关因素即可。

现在这个论坛只优化了 2 个地方,就是是 DNS 优化和网页打开 GZIP 压缩。因为用的是现成的程序,其他地方都不太差,暂时先解决一些基本的问题。

DNS 上的优化,就是启用了双线主机以及智能 DNS 。 为什么我要先做这个呢? 因为我想优化百度爬虫访问我网站的速度。

因为这是中文论坛,做 SEO 优化肯定要以百度优先。

因为很多人还是没有养成先看数据再来做 SEO 的意识,所以在优化速度的过程,有个问题没注意到的。这就是没有看看爬虫到底是从什么地方来访问的。

对于大部分中文网站来说,爬虫可能 90% 以上都是从北京联通 (网通) 访问过来的。这个时候就要特别优化北京联通 (网通) 的访问速度。

所以我用的双线机房有 2 个 IP,一个电信的 IP 和一个联通 (网通) 的 IP 。有了个 2 个 IP,还要做智能 DNS,这样当电信的用户访问论坛的时候,就解析到电信的 IP 上,联通的用户访问论坛的时候就解析到联通 (网通)IP 上。 这样,百度爬虫从北京联通访问我论坛的时候,速度就快很多了。

我用的智能 DNS 服务是 DNSPod(http://www.dnspod.com/) 提供的,设置的界面如下:

2011-1-3 11:44 上传

下载附件
(4.8 KB)

我在 DNSPod 里面的账户是免费账户,收费账户应该速度更好一点,但是 DNSPod 对于收费账户还要审核,我就一直没升级了。

设置好了以后,还要检查一下到底优化的效果如何。 可以用监控宝 (http://www.jiankongbao.com/

的工具检测一下。以前北京联通的响应速度是 1831 ms 。经过优化,速度确实会提高很多,如:

2011-1-3 11:45 上传

下载附件
(15.55 KB)

这里还列出了是哪方面影响速度的因素大。最好是长期监测这个响应速度,因为这个因素的变化能比较大的影响到 SEO 效果。可以注册成为这个网站的付费用户,
就可以每隔几分钟去检测一下网页的响应时间等等。

为了加快前端的速度,我启用了论坛自带的 gzip 压缩。 Discuz!x1.5 后台现在还没有启用 gzip 压缩功能的地方,需要手动设置:

打开 /config/config_global.php 文件,把

  1. $_config['output']['gzip']
    = '0';

改为

  1. $_config['output']['gzip']
    = '1';


可启用 gzip 压缩。

Discuz!x1.5 后台还可以做一些速度上的优化如启用 memcache 等等,但是这个相对麻烦点,留着下次来做。

4,静态化 URL

Discuz!x1.5 后台自带了一个静态化 URL 的功能,而且默认也写好了静态化的规则。但是这里有一个问题,就是帖子页面的静态化规则没有写好。

如默认的帖子页面规则是:

  1. thread-{tid}-{page}-{prevpage}.html

即规则为:

  1. thread-{帖子 ID}-{帖子翻页 ID}-{当前帖子所在
    的列表页 ID}.html

问题就出在 「当前帖子所在的列表页 ID」 这里,因为在论坛板块中,当一个帖子是最新发表或最新回复的时候,「当前帖子所在的列表页」 是第一页,url 中的数
字是
「1」 。当这个帖子很久没人回复沉下去的时候,「当前帖子所在的列表页」 就不知道是几了,可能出现在第二页,也可能在第十页。这样,每个帖子的 url 经常
在变化。会产生很多的重复页面,而且 url 经常变化,当前帖子积累的权重会丢失。

为了解决这个问题,可以重写 url 静态化规则。当然修改页面代码也能解决这个问题,但是不方便维护,因为修改后的文件以后可能会被升级文件覆盖,而且会丢
失部分功能。

论坛用的是 linux+apache,而且论坛是作为一个虚拟主机放在服务器上。 Url 静态化的过程就这么操作:

新建一个文本文件,文件名为 「.htaccess」,然后用 UltraEdit 编辑这个文
件,写入的规则为:

  1. # 将
    RewriteEngine 模式打开
  2. RewriteEngine On
  3. # 修改以下语句中的 RewriteBase 后的地址为你的论坛目录地址,如果程序放在根目录中,为
    /,如果是相对论坛根目录是其他目录则写为 /{目录名},如:在 bbs 目录下,则写为 /bbs
  4. RewriteBase /
  5. # Rewrite 系统规则请勿修改
  6. RewriteCond %{QUERY_STRING} ^(.*)$
  7. RewriteRule ^topic-(.+).html$
    portal.php?mod=topic&topic=$1&%1
  8. RewriteCond %{QUERY_STRING} ^(.*)$
  9. RewriteRule ^article-([0-9]+)-([0-9]+).html$
    portal.php?mod=view&aid=$1&page=$2&%1
  10. RewriteCond %{QUERY_STRING} ^(.*)$
  11. RewriteRule ^forum-(w+)-([0-9]+).html$
    forum.php?mod=forumdisplay&fid=$1&page=$2&%1
  12. RewriteCond %{QUERY_STRING} ^(.*)$
  13. RewriteRule ^thread-([0-9]+)-([0-9]+).html$
    forum.php?mod=viewthread&tid=$1&extra=page%3D$3&page=$2&%1
  14. RewriteCond %{QUERY_STRING} ^(.*)$
  15. RewriteRule ^group-([0-9]+)-([0-9]+).html$
    forum.php?mod=group&fid=$1&page=$2&%1
  16. RewriteCond %{QUERY_STRING} ^(.*)$
  17. RewriteRule ^space-(username|uid)-(.+).html$
    home.php?mod=space&$1=$2&%1
  18. RewriteCond %{QUERY_STRING} ^(.*)$
  19. RewriteRule ^([a-z]+)-(.+).html$ $1.php?rewrite=$2&%1

UltraEdit
写好规则后,按 F12,在文件另存为的窗口上,有个 「格式」 选项,选 「utf-8 -无 BOM
「保存。然后把 「.htaccess」 上传到论坛根目录。

然后在进入后台 --> 全局--> 优化设置--> 搜索引擎优化 。 其他保持不变,就把 「主题内容页」 规则改为:

  1. thread-{tid}-{page}.html
2011-1-3 11:46 上传

下载附件
(8.79 KB)

保存设置再更新一下缓存就可以了