如何通过规范URL来建立与搜索引擎的友好

  URL的地位在SEO的过程中非常重要,也是SEOer所面临的一个基本问题,我们在以前的很多文章中都多次提到一个观点:

  SEO的流量产生于你排名比较好的页面,而这些页面有排名的前提是被搜索引擎收录。

  我们知道网络世界越来越庞大,内容的产生几乎可以说是无穷无尽的,这对于资源有限的搜索引擎而言,它们可以做的只能是尽可能快地收录新内容,所以说,网络中新内容的产生 > 被抓取收录的内容。而URL跟搜索引擎的关系,举个形象的例子,就好像你的地址跟速递员之间的关系,一个准确的以及便于查找的地址,将很大程度上提高速递员的投递。

  那么搜索引擎在抓取页面过程中,会遇到什么问题呢?

  一:URL的重复性。

  请不要忽略这一点,要讲的内容可能跟你想象中的不一样。我们假设有以下两个URL

  http://www.xxx.com/seo/888 http://www.xxx.com/seo.asp?id=888

  这两个页面产生的内容是一样的,前者可能是伪静态,也可能是真实的静态页面,但似乎前者比后者更好。但事实并非如此,首页,这两个URL的格式都是容易被抓取和收录的,我们很多时候之所以不用?这种动态的引入方式,就是为了避免可能产生的大量重复内容。但是前者这种模式同样可能产生大量的重复内容,比如搜索引擎可能会误以为这个888只是一个SessionID,在无法做到准确判断的情况下,前者这种模式的优势并不明显。

  可能有些人不太明白这段话了,首先要把URL和内容分开来,在理解上述话的时候,我们先简单说下搜索引擎对于重复性内容的判断:搜索引擎本身有个强大的数据库存放已经抓取进来的内容,判断一个内容是否有相似的,最佳做法是把即将抓取的内容跟数据库已有的内容做比较,但通过阅读《google网站质量指南》,我们发现这是个理解误区,反过来想下,这种在抓取的时候就进行内容对比的技术手段可行性也并不强,因为内容太庞大了。所以搜索引擎对抓取的URL分析就相当重视,我们要让搜索引擎认为我们的URL对应的内容在站内是不重复的,最佳的做法当然还是静态化URL,让搜索引擎认为网站本身的确有很多不同的内容,针对这种情况,最佳的URL写法应该是:

  http://www.xxx.com/seo/seo-url

  归根结底,就是保证URL的唯一性以及不和其他一些情况混淆掉。

  二:“无限空间”(无限循环)

  现在绝大多数博客上都会有一个日历控件,就是不管你点击哪个时间段,都会出现一个页面,既然找不到对应的内容,但产生的URL都是唯一的,这样一来,就形成无限空间的概念了,因为时间是无止境的,所以产生的页面也是无穷的,对于搜索引擎而言,这个是非常不友好的。

  可以利用nofollw属性做到有效的引导即可避免这种情况,相关文章:http://www.admin5.com/article/20120312/414377.shtml

  三:层级要符合逻辑。

  我们分析以下几个页面:

  1、http://www.xxx.com/seo/

  2、http://www.xxx.com/seo/url

  3、http://www.xxx.com/seo/url/weiyi

  如果说搜索引擎今天只能抓取其中一个的话,那从优先级上出发,它是先抓取第1个,那么这时又产生一个误区,如果我把页面都放在根目录下,就不存在层次的优先级了,如果层次优先级没区别,搜索引擎会进行同目录下的URL的优化比较,这也是为什么收录的时候会先抓取网站首页。所以最好的方式就是按照业务逻辑来建立子目录,内容跟内容之间的从属关系是怎么样的,在URL就用层次优化级方式来规划。

  四:重复内容的处理。

  


 

  上图是我从某知名网购平台上搜索笔记本时出来的筛选条件,我们做个数据分析,在这个页面中,品牌为16个,价格条件为5个,处理器为8个,屏幕尺寸为8个,硬盘容易条件为6,内存为6个,硬盘为6个,显卡条件为6个,那么最多产生的搜索条件结果有:

  16*5*8*8*6*6*6*6=6220800

  而我们看上图显示的产品为2471个,所以显然重复性的内容是非常多的,这里举的例子还不是非常庞大的数据,有些网站可以组合成几亿甚至几百亿的页面出来。有兴趣的朋友可以看下我之前写的ASP等动态语言网站在做SEO时,站内搜索应该注意的问题。

  【尊重原创,分享观点。来自芝麻开门网络科技原创文章,转载请标明文章来源 — http://www.51zmkm.com/news/25.html】

时间: 2024-10-30 15:58:21

如何通过规范URL来建立与搜索引擎的友好的相关文章

浅谈如何创建对搜索引擎更加友好的内容

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在互联网上让你的声音被广泛的听见并不容易.这可能就想你在一个拥挤的大街上即兴演讲,挥舞着双手来引起路人的注意.在你选择的主题中你可能是一位专家,有着过人的智慧,但是你要怎么让人们停下足够长的时间来听你的演讲?答案是找到在内容可读性和搜索引擎的友好性之间找到一个适当的平衡.这是必要,这样才能确保搜索引擎的蜘蛛和读者找你的网站.了解一些技巧可以在

分享如何让网站对搜索引擎更友好

大家做站都是想要一个好的关键词排名,我也不例外,最近通过自己的站发现一个规律,如果网站的设计比较友好搜索引擎的话,会给予不错的权重,相比下关键词排名会更占优势,所以今天和大家分享的主题就是谈谈对搜索引擎友好的网站该如何设计. 如果我们站在搜索引擎的角度去看待一个网页,那么在巨大的互联网数据面前应该如何去抓取.索引和排名呢?其实换位思考下,虽然我们未必完全理解搜索引擎的算法,但从整体上还是可以逻辑判断出符合搜索引擎的网页应该满足的几个方面,好了,开始今天的正文. 首先是蜘蛛来到网站:大家都知道,搜

SEOer值得了解的搜索引擎索引和分词技术

在网络公司做过程序开发的朋友都知道,我们通常用的数据库搜索技术就是把用户输入的词汇,跟数据库中的某个或多个字段里的内容进行比较,同样,搜索引擎的运行原理简单来讲也就是这样: 用户输入一个词汇,搜索引擎从他的数据库中找到匹配的内容,再以有序的排列展现给用户,搜索引擎每天就是不厌其烦地不断重复这些操作.看似一切很正常,我们用数据来分析问题-- 全球网民按20亿计算,全球所有网站的网页先假设是50亿个 按每人每天搜索1次(也就是1个关键词,假设都是不重复的) 那么搜索引擎每天要从50亿个网页中搜索比对

实例分析URL结构规划中常见的三种错误

我们的站点结构是有一系列的URL地址组成的.站点的URL结构关系到整个站点的优化命脉.或许很多seoer都会遇到内容质量已经够高,外链也不输人,但是偏偏就是页面不收录,或者收录得很少.其实很多的原因还是出在站点的URL结果上,本文中笔者将根据自身遇到的情况,分析三种常见的URL结构错误. 一:URL地址长度问题 我们的URL地址是否对搜索引擎优化,会直接影响到站点的收录量.URL地址可以分为动态.静态以及伪静态地址.除去动态页面,我们可以说静态和伪静态页面还是对搜索引擎相对友好的.而在这三种地址

关于B2C网站易用性和搜索引擎友好性的观点

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 网站易用性是从用户获取信息的角度描述网站设计;搜索引擎的友好性是从网站容易被搜索引擎收录并且获得好的检索效果的角度,说明网站设计应该关注的重要因素.搜索引擎友好意味着网站的网页内容更容易被搜索引擎收录,也就意味着用户通过搜索引擎获得网站信息的机会大大增加,搜索引擎友好的最终目的同样是为了用户可以更加方便地获取信息. 对于B2C网站而言最终的目

HAO123的迷思——谈谈SEO

都时兴WEB2.0了,我还打算谈SEO,确实有一点落伍.事情是这样的,我最近要写一个无聊的方案书,提纲已经拟了一个月了,就是懒得写正文.所以我决定把内容拆开了写,独立成章,这样可以发挥我离题万里的特性.如果万幸,我能写完这一系列文章,那每篇删去50%,就可以组合成那个方案书.这个方式如果多人合作来做的话,似乎就有那么点WEB2.0的意思了.好象说远了. HAO123的性质我以为应该是非常的明显,但后来发现即使是很多IT人士,甚至是高手都得出了错误的结论.当然这更大的可能是说明我错了,但我是那种死

emlog v4.0.1发布 功能强大的个人博客系统

emlog 是 "Every Memory Log" 的简称,意即:点滴记忆.是一款基于PHP和MySQL平台的http://www.aliyun.com/zixun/aggregation/17547.html">功能强大的个人博客系统(blog).致力于为您提供快速.稳定,且在使用上又极其简单.舒适的博客服务. 主要功能及特色: 支持日志url自定义,对搜索引擎更为友好 独有的碎语(微博)功能,让你用简单的文字记录生活 一键式更换模板,方便快捷打造个性博客 清爽的日

要让网站更稳定地发展,应该适当地减少不必要的收录

摘要: 在交换链接的时候,收录往往都是作为一个评判网站权重的一个标准.所以通过各种手段增加网站收录量也是各位站长一直努力的方向.但是,有些网站你会发现,收录量会经常大起大 在交换链接的时候,收录往往都是作为一个评判网站权重的一个标准.所以通过各种手段增加网站收录量也是各位站长一直努力的方向.但是,有些网站你会发现,收录量会经常大起大落,从而对网站造成了权重不稳定,关键字也是上上下下.造成这样的结果是因为,在网站收录中,有很多质量差的文章,搜索引擎只要调整了门槛,一下就能把全部去掉了.要让网站更稳

搜搜SoSo搜索引擎优化SEO规范

前言 搜索引擎优化,即SEO(Search Engine Optimization),指为了提升网站/网页在搜索引擎搜索结果中的收录数量和排序位置,为了从搜索引擎中获取更多免费流量.高质量用户,针对搜索引擎的检索特点.排序规律,合理调整优化网站设计和建设方法,使其符合搜索引擎的检索规则的网站建设.网站运营行为.除此之外,SEO工作还有利于搜索引擎快速收录新页面,提高收录覆盖率的效果. SEO是网络营销的重要手段,通过了解搜索引擎工作原理和用户需求,在尊重搜索引擎用户价值的前提下,对网站进行合理优