Search Engine Friendly的URL设计_php基础

Search Engine Friendly的URL设计

版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明
http://www.chedong.com/tech/google_url.html
关键词:"url rewrite" mod_rewrite isapirewrite path_info "search engine friendly"
内容摘要:
此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。在Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小), 链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和按月归档的文档很容被搜的到),因此很多关于面向搜索引擎 URL设计优化(URI Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式:
比如可以将:
http://www.chedong.com/phpMan.php?mode=man&parameter=ls
变成:
http://www.chedong.com/phpMan.php/man/ls
实现方式主要有2种:

基于url rewrite
基于path_info
把URI地址用作参数传递:URL REWRITE
最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换:
这样几乎可以不修改程序的实现将 news.asp?id=234 这样的链接映射成 news/234.html,从外面看上去和静态链接一样。Apache服务器上有一个模块(非缺省):mod_rewrite:URL REWRITE功能之强大足够写上一本书。
当我需要将将news.asp?id=234的映射成news/234.html时,只需设置:
RewriteRule /news/(\d+)\.html /news\.asp\?id=$1 [N,I]
这样就把 /news/234.html 这样的请求映射成了 /news.asp?id=234
当有对/news/234.html的请求时:web服务器会把实际请求转发给/news.asp?id=234
而在IIS也有相应的REWRITE模块:比如ISAPI REWRITE和IIS REWRITE,语法都是基于正则表达式,因此配置几乎和apache的mod_rewrite是相同的:
比对于某一个简单应用可以是:
RewriteRule /news/(\d+)\.html /news/news\.php\?id=$1 [N,I]
这样就把 http://www.chedong.com/news/234.html 映射到了 http://www.chedong.com/news/news.php?id=234

一个更通用的能够将所有的动态页面进行参数映射的表达式是:
把 http://www.myhost.com/foo.php?a=A&b=B&c=C
表现成 http://www.myhost.com/foo.php/a/A/b/B/c/C。
RewriteRule (.*?\.php)(\?[^/]*)?/([^/]*)/([^/]*)(.+?)? $1(?2$2&:\?)$3=$4?5$5: [N,I]
通过URL REWRITE还有一个好处就是隐藏后台实现,这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,更本感受不到后台应用的变化。
比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用mod_rewrite甚至可以把请求转发到其他后台服务器上。
基于PATH_INFO的URL美化
Url美化的另外一个方式就是基于PATH_INFO:
PATH_INFO是一个CGI 1.1的标准,经常发现很多跟在CGI后面的"/value_1/value_2"就是PATH_INFO参数:
比如http://www.chedong.com/phpMan.php/man/ls,中:$PATH_INFO = "/man/ls"
PATH_INFO是CGI标准,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
注意:/myapp/servlet/Hello/foo的 getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()将返回的 /hello.jsp,从这里你也可以知道jsp其实就是一个Servlet的PATH_INFO参数。ASP不支持PATH_INFO,

PHP中基于PATH_INFO的参数解析的例子如下:
//注意:参数按"/"分割,第一个参数是空的:从/param1/param2中解析出$param1 $param2这2个参数
if ( isset($_SERVER["PATH_INFO"]) ) {
    list($nothing, $param1, $param2) = explode('/', $_SERVER["PATH_INFO"]);
}

如何隐蔽应用:例如 .php,的扩展名:
在APACHE中这样配置:
<FilesMatch "^app_name$">
    ForceType application/x-httpd-php
</FilesMatch>

如何更像静态页面:app_name/my/app.html
解析的PATH_INFO参数的时候,把最后一个参数的最后5个字符“.html”截断即可。
注意:APACHE2中缺省是不允许PATH_INFO的,需要设置AcceptPathInfo on

特别是针对使用虚拟主机用户,无权安装和配置mod_rewrite的时候,PATH_INFO往往就成了唯一的选择。

OK,这样以后看见类似于http://www.example.com/article/234这样的网页你就知道可能是 article/show.php?id=234这个php程序生成的动态网页,很多站点表面看上去可能有很多静态目录,其实很有可能都是使用1,2个程序实现的内容发布。比如很多WIKIWIKI系统都使用了这个机制:整个系统就一个简单的wiki程序,而看上去的目录其实都是这个应用拿后面的地址作为参数的查询结果。

利用基于MOD_REWRITE/PATH_INFO + CACHE服务器的解决方案对原有的动态发布系统进行改造,也可以大大降低旧有系统升级到新的内容管理系统的成本。并且方便了搜索引擎收录入索引。
附:如何在IIS上利用PHP支持PATH_INFOPHP的ISAPI模式安装备忘:只试成 php-4.2.3-Win32

解包目录
========
php-4.2.3-Win32.zip c:\php

PHP.INI初始化文件
=================
复制:c:\php\php.ini-dist 到 c:\winnt\php.ini

配置文件关联
============
按照install.txt中的说明配置文件关联

运行库文件
==========
复制 c:\php\php4ts.dll 到 c:\winnt\system32\php4ts.dll

这样运行后:会发现php把PATH_INFO映射到了物理路径上
Warning: Unknown(C:\CheDong\Downloads\ariadne\www\test.php\path): failed to create stream: No such file or directory in Unknown on line 0

Warning: Unknown(): Failed opening 'C:\CheDong\Downloads\ariadne\www\test.php\path' for inclusion (include_path='.;c:\php4\pear') in Unknown on line 0

安装ariadne的PATCH
==================
停止IIS服务
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆盖原有的c:\php\sapi\php4isapi.dll

注:
ariadne是一个基于PATH_INFO的内容发布系统,
PHP 4.3.2 RC2中CGI模式的PATH_INFO已经修正,照常安装即可。
参考资料:
URL Rewrite文档:
http://www.isapirewrite.com/docs/
http://httpd.apache.org/docs/mod/mod_rewrite.html
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html
搜索引擎友好的URL设计
http://www.sitepoint.com/article/485
说不定这个URL原来就是articel.php?id=485
一个基于PATH_INFO的开源内容管理系统
http://typo3.com/
Google没有索引什么?
http://www.microdocs-news.info/newsGoogle/2003/05/10.html
Google的PageRank说明:
http://pr.efactory.de/

时间: 2024-12-24 21:09:01

Search Engine Friendly的URL设计_php基础的相关文章

Search Engine Friendly的URL设计-搜索引擎技术

此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的.进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大.在Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的.由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小),链接地

基于PHP+MySQL的聊天室设计_php基础

笔者在网站开发中,采用PHP4.0+MySQL3.23.38建立了多种应用.下面,以一个简单的聊天室设计为例,介绍PHP+MySQL在网页开发中的应用. 1.总体设计 1. 1 构思与规划: 聊天室的基本原理,就是把每个连上同一网页的用户传送的发言数据储存起来,然后将所有的发言数据传给每一用户.也就是说,用数据库汇集每个人的发言,并将数据库中的数据传给每一个人就实现了聊天室的功能. 1.2 表设计 首先使用MySQL建立表chat用来储存用户的发言: 复制代码 代码如下: mysql> CREA

PHP 5昨天隆重推出--PHP 5/Zend Engine 2.0新特性_php基础

前言    今天突然想到PHP官方网站上一转,一眼就看到PHP5推出的通告.虽然以前看到过PHP5的预告,但还是仔细看了PHP 5/Zend Engine 2.0新特性一文,一股JAVA气息扑面而来...   特将该文试译出来,首发于CSDN网站,以飨读者. PHP 5/Zend Engine 2.0新特性徐唤春 译 sfwebsite@hotmail.comhttp://www.php.net/zend-engine-2.php 全新的对象模型PHP中的对象处理部分已完全重写,具有更佳的性能和

一个高ai的分页函数和一个url函数_php基础

这个分页函数非常高只能的 看看就知道了 function ppage($total, $page, $e_page = 15, $e_block = 10, $url = '', $color = '') { if(!strpos($url,'?'))    $url.='?'; else    $url.='&'; if($color<>'') {    $color   ='<font color='.$color.'>';    $colore  = '</fo

利用Yahoo! Search API开发自已的搜索引擎-php版_php基础

    美国东部时间3月1日,雅虎公司联合创始人之一的杨致远将宣布公司的搜索网络将进入Web服务.雅虎公司在www.developer.yahoo.com网站建立了Yahoo Search Developer Network,公司计划在此纽约举行的搜索引擎战略大会(Search Engine Strategies Conference)上推出这一计划.该网络将允许开发者在雅虎搜索之上建立新的应用程序,其中包括图像.视频.新闻以及地区搜索等内容.想要使用这项服务的会员必须先去http://api.

合理的网站url设计会让您的网站更利于seo

网站设计如果想实现优化的功能细节方面非常重要,从网站的域名选择到网站的url设计都关乎着您以后的网站是否有利于优化,佛山清风网站建设团队在设计网站的初期一直坚持着为客户着想,本着优化的原则为客户设计网站,那么网站的url如何设计呢? 一.网站导航url完全相关 1.如何实现url的导航相关:在设计网站的初期佛山清风网站建设团队会和客户确定模板,尤其是主要的栏目都要落实,比如企业网站的产品介绍,联系我们,那么我们都会用分来栏目来做导航/product/ /contact/ 用英文的方式或者用拼音的

网站的结构设计:网站的URL设计注意的八个问题

文章描述:设计网站的URL时应该注意的八个要点. 对于一个网站的结构来说,URL的设计也非常的重要,在URL设计时我们应该事先做好规划,应该从用户体验和搜索引擎蜘蛛体验出发,在总体上边应该做到URL清晰.友好.方便记忆,然后还要适当的考虑对于搜索引擎排名的影响,具体来说,URL设计时我们要从下边几点来着手: 1.URL越短越好 这样做主要是为了用户体验,其实对于搜索引擎来说,不超过1000个字母都没有问题,可是如果不考虑用户体验,确实真的用了非常长的URL的话,用户看起来就有些麻烦了,甚至会马上

设计观点:基础不好从事设计工作可以吗

长期以来,总是阶段性的有设计方面的学生或者入门小白在邮件.QQ.MSN等渠道发表一种焦虑:我的基础不太好,请问我能从事设计工作么?对于这样一个问题,我一般有两个反应,第一,我觉得这个问题太大了,有点自我否定的意思:第二,你自己都知道基础不好,就去补基础啊,跟我扯什么闲话.后来我发现这样想有点不仗义,首先对方也许是瞧得起我,想问问我该怎么办,其次他们可能觉得我的"基础"很好,以便取到真经,避免被某些混子骗去钱财.对于"基础"的定义,各人的理解是完全不同的,在设计上来说

网站优化之url设计应遵循的六大原则

UEO这个词相信大家也不陌生,中文意思就是用户体验.现在很多网站都注重用户体验,毕竟我们做网站最终是服务于用户,所以我们在网站设计和优化时也要考虑用户体验.用户体验的范围很广,这里主要讲述从用户体验的角度来分析网站的url设计,简单的说,url应该清晰友好,方便记忆.那么我们在网站建设中应该如何去设计url呢?下面就由笔者来讲述url设计的八大原则. 一.url月简洁越好 我们举个例子来说,假如你看到了一个非常长的url,给你的第一感觉是怎样的?同样,我们的用户面对着冗长的url地址,肯定也会产