如何使规范化过程趋于简化

  技术上讲,规范化是转换数据的一个过程,它由一种可能的表述变为标准化的规范性表述。搜索引擎运算法则包括数学相等,它比较对相似性的不同表述,计算明显的数据结构数量,发现一种有意义的、规范的排列次序。

  这听起来似乎很对?对于软件工程人员、计算机程序员和数学家来说,是这样。下面,我们还是把这种表述变得更为简单一些。

  坦白地讲,诸如Google一类的搜索引擎使用规范化程序,为用户提供短的、有益的URL.想一下,当搜索引擎为用户提供以下选择时,一般用户会最有可能点击哪个URL.——www.yourdomain.com;—— yourdomain.com/nasapp/index.jsp?

  ——http://www.yourdomain.com/home.jsp;jsessionid=UJ2LLSBRQH4VMCWQNWRSCOYK0BW0IIWE?

  _requestid=55555如果你相信Google的规范性选择可能是www.yourdomain.com,即使上述三个URL到达相同的目的地,你也可能会自豪地说,你懂得规范化的基本原则。

  下面,让我们进一步对主流搜索的规范性选择进行观察,看一看还有哪些因素会决定搜索询问结果中出现哪个URL.

  处于讨论之目的,我们在Google、雅虎和MSN中完成一次对“milwaukee brewers” 的搜索,并比较一下搜索结果。

  Google提供的搜索结果如下:The Official Site of The Milwaukee Brewers: Homepage Features scores, game schedules, roster, news, history and forums. brewers.mlb.com/ - 78k - Cached - Similar pages Schedule : 2007 Brewers Schedule - milwaukee.brewers.mlb.com/NASApp/mlb/s……

  Active Roster - milwaukee.brewers.mlb.com/……/roster_active.jsp?c_id=mil Ticket Center - milwaukee.brewers.mlb.com/……/ticketing/index.jsp?c_id=mil Help : Job Opportunities - mlb.mlb.com/NASApp/mlb/mlb/help/jobs.jsp?c_id=mil More results from brewers.mlb.com ?

  雅虎提供的搜索结果如下:Milwaukee Brewers Official site of the Milwaukee Brewers. Features up-to-date stats and results, player bios, minor league information, ticket and merchandise ordering info, player ……

  Category: Major League Baseball > Milwaukee Brewers www. milwaukeebrewers.com - 79k - Cached - More from this site MSN Live搜索引擎提供的结果如下:Milwaukee Brewers : The Official Site MLB Sites MLB.com Angels Astros Athletics Blue Jays Braves Brewers Cardinals Cubs Devil Rays Diamondbacks Dodgers Giants Indians Mariners Marlins Mets Nationals Orioles Padres Phillies Pirates Rangers ……

  www. brewers.mlb.com我们注意到,没有一个最先的搜索结果与其它的搜索结果有相同之处。上述所有的索引列表都引到了http://milwaukee.brewers.mlb.com/index.jsp?c_id=mil.为什么会是这样?在Google、雅虎和MSN中的一个域名会显示相同的结果?是否是Milwaukee Brewers使用临时的改变方面域名和多个域名对搜索引擎进行了嗅测?

  绝对不对。规范化处理过程只是调整搜索环境,一个搜索引擎与另一个搜索引擎的运算要素各不相同。Google在进行内部链接时,知道两个域名是相同的,并一视同仁地对待。通过使用询问排列命令,Google显示出它知道link:brewers.mlb.com和www.milwaukeebrewers.com有2200个链接。

  有许多SEO专家讨论过Google对于次域名的选择问题。这也证明网站是如何进行搜索和索引的。输入“site: brewers.mlb.com”,你会得到7880个网页。而输入“site:www.milwaukeebrewers.com”,就会得到“与任何文件都不匹配”的结果。

  为了给用户提供选择性结果,Google会把www.milwaukeebrewers.com转移到非指数化的无人地区。Google喜欢显示不错的次域名brewers.mlb.com ,作为其对“milwaukee brewers”最相关搜索结果。

  MSN Live搜索引擎在进行运算调整时表现得不是很完美。它索引了近1300页“site:brewers.mlb.com”和6页“site:www.milwaukeebrewers.com”。其运算法则为“link:www.milwaukeebrewers.com”提供了近14000个内部链接,为“link:brewers.mlb.com”提供了14000个内部链接。MSN Live搜索引擎通过在搜索结果中的非规范化URL,复制自己的搜索结果。

  MSN Live搜索引擎也有不错的创意,诸如次域名和临时搜索改道。MSN Live具有过滤功能,并把其设为“高级”以阻止垃圾信息和任何伪装的规范化信息。

  而雅虎的优先选择为forbrewers.mlb.com,而非次域名副本brewers.mlb.com.基于雅虎 Site Explorer提供的信息,brewers.mlb.com有735页索引和228个内部链接。同时,www.milwaukeebrewers.com有45页索引和6331个内部链接。

  如果网络管理人员想使用Google和MSN Live搜索引擎,他们是否需要对网站进行重新设计,把次域名包括其中?绝对不是。次域名并非是改善指数化的秘密武器。只有高级域名中的一小部分包含完整的独特性内容,并强调不同的主题时,次域名才有很大的作用。

  在主流搜索引擎中,通过测试来推动规范化进程是一件很有意思的事。高级域名是否要做为优先选择影响Google和MSN Live搜索引擎指数化?XML网站地图反馈是否会鼓励雅虎在自然的搜索结果中提供次域名?这些问题有待进一步研究。

  (原文首发于2007年2月14日;编译:靳生玺)

时间: 2024-11-10 00:31:54

如何使规范化过程趋于简化的相关文章

林立:引入绿鞋可以使价格发现过程更平稳

8月9日下午消息 光大银行纪委书记.首席审计官林立今日表示,该行此次发行实施绿鞋是引进国际惯例,顺应国内资本市场变化的发行方式的有效完善和补充,通过绿鞋的运用,可以使价格发现的过程更加平稳. 林立表示,绿鞋在国际资本市场股票发行中运用广泛,是发行人和主承销商为适应迅速变化的市场状况适当调节发行规模,减小新股上市波动而建立的一种技术安排. 绿鞋,即超额配售选择权,是发行人授予主承销商的一项选择权,获此授权的主承销商可按本次发行价格超额配售不超过初始发行规模15%的股份,即可向投资者配售共计不超过初

Team System:使用过程模板简化团队项目

本文使用以下技术: Visual Studio Team Foundation Server 2008 现在,您可以在 Team Foundation Server (TFS) 中收集和跟踪团队项目内部的所有工作和项目.团队项目仅仅是一个存储容器,用来存储和划分开 发项目期间所跟踪和使用的所有项目.使用 Team Foundation Client (TFC) 中的"新建团队项目 "向导可帮助您进行收集和跟踪. 此向导非常简单.单击"文件"|"新建 团队项

PHP设计模式之解释器模式的深入解析_php技巧

解释器(Interpreter)模式,它包括一个具有复合类分层结构的文法表现,规则是映射到类,跟随在文法后面的表达式可以被转换成一个抽象的语法树,除了复合模式的实例对象图外,没有别的内容. 树是一个抽象的名词,因为实际上大多数时候它是一个表达式的抽象表现,它忽略了可能有一个字符串,也可能有一个数据结构的具体表达式,(例如,在PHP中,"A"和"\x41"是相同抽象字面值的不同具体表现),通过逻辑规则解耦结果,使解释过程大大简化. 解释器不是一个很常见的模式,但对于简

新加坡《星期日时报》日前有一篇名为《中国宅经济方兴未艾》的文章

文中说,宅族属于一个日益增长的消费市场,该市场现在有"半个中国大".宅在家里的消费者爱上网,热衷网购,喜欢娱乐和信息交流,往往在晚上7时到凌晨2时最为活跃.随着更多的人接受"宅",通常家外面的消费转移到了家里,这将大大影响市场结构和品牌. "宅"如今已成为中国新兴市场现象,尚扬媒介在去年发布的<2012中国消费趋势前瞻>已经发现"宅"现象蓬勃发展的趋势,中国市场与媒体研究(CMMS)数据也佐证了这个现象:有49%的

一篇名为《中国宅经济方兴未艾》的文章

文中说,宅族属于一个日益增长的消费市场,该市场现在有"半个中国大".宅在家里的消费者爱上网,热衷网购,喜欢娱乐和信息交流,往往在晚上7时到凌晨2时最为活跃.随着更多的人接受"宅",通常家外面的消费转移到了家里,这将大大影响市场结构和品牌. "宅"如今已成为中国新兴市场现象,尚扬媒介在去年发布的<2012中国消费趋势前瞻>已经发现"宅"现象蓬勃发展的趋势,中国市场与媒体研究(CMMS)数据也佐证了这个现象:有49%的

交互设计经验:设计过程中存在太多的矛盾

文章描述:交互设计经验:设计过程中存在太多的矛盾. 在产品团队中经常听到有人表态:"我们要做简洁的用户界面",同时又有另外一种声音传来:"我们要做功能强大的产品".乍一听,简洁意味着用户界面控件精炼,然而少数的交互方式如何表达各类强大的功能?反之,强大意味着功能丰富强劲,必然拥有错综复杂的联系,如何让其界面保持简洁?两者似乎无法共存,这让我突然想到自相矛盾的故事,楚国商人夸耀自己的矛锐利万分,同时自己的盾又坚固无比, "以子之矛,陷子之盾,何如?"

ASP实现上一篇,下一篇过程代码

ASP实现上一篇,下一篇过程代码 Rem==上一篇== Rem====================================================== Rem= 参数说明: Rem= pid当前ID,prame:栏目前辍(如一般web_news表,字段时一般为wn_**,prame就代表wn) Rem= ptable(表前辍.如一般表名是:站点名_表名(shenzhe_news) ptable:就代表shenzhe) Rem= 说明:采用上面命名法,可使该过程达到通用 Rem

上一篇,下一篇过程代码

过程 Rem==上一篇==Rem================================================================Rem= 参数说明:Rem= pid当前ID,prame:栏目前辍(如一般web_news表,字段时一般为wn_**,prame就代表wn)Rem= ptable(表前辍.如一般表名是:站点名_表名(shenzhe_news) ptable:就代表shenzhe)Rem= 说明:采用上面命名法,可使该过程达到通用Rem==========

PL/SQL过程

     要想利用PL/SQL程序完成比较完整的数据库任务,需要进一步学习一些高级设计要素的内容.前面编写执行的PL/SQL程序,共同的特点是没有名称,只能存储为文件,然后通过执行文件的方式执行,因此称为无名块.与此对应的是在PL/SQL中也引入了高级程序设计的一些概念,其中最重要的就是过程.    过程就是高级程序设计语言中的模块的概念,将一些内部联系的命令组成一个个过程,通过参数在过程之间传递数据是模块化设计思想的重要内容. 创建过程     1. 过程的语法结构    完整的过程结构如下: