这篇优化报告名为房地产网站优化实站,实际上其中方法对于大多数资讯类网站都适用,只是引入了房地产网站做为案例,并在大型房地产网站实践过而已。 大型资讯类网站的特点是频道数量众多,页面数量众多,使用大量的二级域名,通常拥有访问量和发帖量较大的论坛。2006年我加入南京某房地产网站以后就针对房地产网站的诸般特点进行了长期的优化。
一、网站架构
1、二级域名的使用
因为业务的地域性扩张或者内容的分割,对于大型网站来说,二级域名的使用是不可避免的。2006年我们做第一个分站时也分别讨论了两种方案,一种是先按业务划分,再按地域划分,如:http://wuxi.sell.housexxx.com ;另一种是先按地域划分,再按业务划分,如:http://sell.wx.housexxx.com ,这两种分法都都先例前一种是新浪房产在用,后一种是搜房在用。后来考虑到分站以后的业务扩展的差异性,使用了第二种方案。对于在各分站开展的各项业务也就顺理成章的变成三级域名。
众所周知,二级域名或者三级域名对于搜索引擎来说就是一个独立的网站。对于大型网站开通众多二级域名有什么好处呢。呵呵,好处是摆在明处的,链接啊,你有100个二级域名就相当于100个网站,相互的交叉链接,了不得啊。另外一个好处不能明说,就是可以开一些二级域名出来做测试域名,就算被K了也不会影响到主站。没有自己DNS服务器的小站长也不要遗憾,只要有自己服务器,加一个DNS服务是很简单的。使用虚拟主机的朋友,只能说抱歉了,国内包括很多大的域名注册商(比如万网)的二级域名解析都很慢,不用说其他的这些了。
2、多服务器架构下对搜索引擎的影响
对于大型网站来说,使用负载均衡技术相当普遍,常见的是基于LVS的Linux负载均衡技术,部分网站也可能是使用F5这样的专用设备。对于使用反向代理的网站,从外部访问就是一个IP,就不存在什么问题了。如果是采用双机热备方式的网站,一旦主服务器宕机,负载就自动切换到从服务器上,这样服务器的IP会变化,更尴尬的是有一段时间,我们的数据同步没做好,百度快照总是不对劲,我还以为是百度数据倒回,结果是我们自己数据倒回,真是汗啊。所以服务器的稳定对搜索引擎优化来说是一件很重要的事情。
3、目录的部署
大家都知道,目录的权重高于页面,那么用Rewrite把网站做全站伪静态就成了一个必然的选择。配置Rewrite很简单,只要在httpd.conf里面加上Mod_rewrite模块,然后写上你的规则就可以了,如果是Apache服务器通常是去掉前面的注释,具体操作网上有非常多的教程,就不赘述了。如果是虚拟主机用户,可以在网站根目录下加上.htaccess文件,文件里面写上你的规则,国外主机基本上都是支持Rewrite的,国内支持Rewrite的虚拟主机也越来越多了。
做完上面这些后,网站就变成全是目录这样的形式了,是不是挺清爽的。别急,下面是关键。当你做完这一切,你会发现,搜索引擎并不收录你修改过的页面,应该说Google还是逐步的更新链接的,而百度是很少更新的。用site命令看一下收录的页面,还是令人沮丧的.html文件,更糟糕的是还有一些动态文件。原因很简单,我们只是更改了页面的链接,而页面的内容和原来完全一样,并且原来的内容依然可以访问到,搜索引擎不会收录两张完全相同的页面,相似度100%的页面。因此网站的结构上线前就应该规划好,就省去了以后的很多麻烦,我个人的习惯是在网站上线前用Robots.txt把所有的搜索引擎都屏掉。如果发生了这种情况该怎么办?做一次全新的改版吗,大可不必那么费事,在文件头部加上301跳转就可以了。
具体代码:
if(strpos($_SERVER['REQUEST_URI'],”list.php”)!==false){ $id = intval($_GET["id"]);
Header(”HTTP/1.1 301 Moved Permanently”);
Header(”Location: http://newhouse.housexxx.com/list-”.$id.”/“); unset($id); }