关于静态页和SEO的看法

  我们先来讨论一下,什么叫做“静态页”。有朋友说,放在硬盘上的htm或html文件便是一种静态页,Web服务器不需要做额外的处理,直接读取文件内容并输出就可以了,而这样的静态文件对于SEO是有帮助的。至于理由,是搜索引擎会对html结尾的文件给更好的权值(这好像还是结论,不是理由),而这是“常识”,“了解一点SEO的人都知道这个”,“人们普遍在使用的做法”,因此“它一定是正确的”。不过其实Google并不这么认为,百度倒没有给出专业说法。

  当然,我们已经重复强调,但还是需要不断明确的一点是,即使搜索引擎对于“静态页”有更好的倾向性,那也是因为其“URL样式”,而不是“在硬盘上放置了一个html文件”。请求方(也就是爬虫)只是向服务器端发送一个URL,并获取服务器端给出的内容。它不会关心,也无法了解服务器端究竟是如何得到页面内容的,对于客户端来说,世界上没有“静态”或“动态”页面之分。有些朋友可能还是会说“不会啊,html就是静态页面,像aspx之类的就是动态页面,前者不需要在Web服务器上运算,后者需要”。

  真是这样的吗?并非如此,因为html文件也是需要Web服务器来运算的。例如,您请求一个html文件,Web服务器至少做了几件事情:
  ◆如果请求包含缓存信息,那么处理缓存状态。
  ◆根据URL定位到磁盘上的文件。
  ◆进行用户认证和授权(如,是否匿名?)。
  ◆判断是否有权限读取。
  ◆读取文件。
  ◆根据文件类型设置MIME的值。
  ◆根据文件最后修改日期设置Last-Modified值。
  ◆根据文件内容及其他状态设置其E-Tag值。
  ◆如果文件内部有include标记,那么读取另一个文件填充进来。

  看,处理一个文件需要多少“动态运算”啊,这些可都是Web服务器(如IIS)加载一个html所做的事情。如果想观察这些过程,可以阅读一些 Web服务器源代码,或观察下ASP.NET中System.Web.StaticFileHandler类所做的事情,它也体现了Web服务器处理html时的关键之处。事实上,如果您在IIS中将html配置给ASP.NET ISAPI的话,或者使用VS自带的Web服务器,最后便是由StaticFileHandler来输出硬盘上的文件的。

  所以,虽然我们看起来Web服务器只是简单地读取了硬盘上的文件,但其实它还是不如我们想象的那么简单。不过对于客户端来说,这一切都是不可知的。例如 Squid,Nginx这样部署在前端的缓存或反向代理服务器,它们都不会关心后端Web服务器是Windows,Linux还是Unix,也不会关心是 IIS,Apache,Lightted甚至是我们自己写的高效或低劣的Web服务器。对于浏览器,爬虫,或前端负载均衡器来说,它们只知道TCP/IP 协议,它们只知道HTTP协议等东西,其他一概不知。

  不过,也有朋友坚持认为“生成静态页”来“进行页面缓存”对SEO有帮助。理由是,“进行页面缓存”能够提高网站性能,爬虫更倾向于访问速度更快的页面。从这个角度看来,这种说法的确有一定道理。只是我还是不喜欢这样的看法,因为这种说法没有把握事物关键。在这里,SEO的关键在于优化网站性能,而生成静态页只是一种手段之一。这并不是适用性最广的,也并非是最容易实现的。如果您直接把“生成静态页”与“SEO”联系起来,很有可能会对他人造成误解。

  当然,如果您的思路没有问题,“静态页”三个字的指代也足够明确,“静态页有利于SEO”这个命题毫无疑问是正确的。不过我们现在并没有讨论一个命题的逻辑是否正确,我们也不必纠缠于一个表达形式是否严谨,我们的目的是要说明道理。也正因为如此,老赵才会一遍一遍地写这么多内容。也就是说,这几篇文章的关键在于“说清道理”,我们把握它既可。

  最后,老赵再谈一下对SEO看法。

  从老赵与各SEO人员的接触感觉来看,他们总是有各种理由来说明“问题所在”,只是如果在改进问题之后还是没有效果的话,他们又可以找出各种理由来告诉你为什么没有效果——但是要知道SEO是一个实践性工作,它的唯一判断依据便是“效果”,而不是“理论”。SEO的理论很容易掌握,但是如果无法真切提高一个网站在搜索引擎上的表现,这一切还是白搭。老赵认为,一个好的SEO是需要了解网页制作,或者说网站开发的基本技术的,至少要有常识,否则基本上就是在扯蛋。老赵曾经接触过一个“专业”的SEO公司,那里的“SEO咨询师”给我留下了深刻的印象——负面印象。其“非专业性”从以下几个事件中便可见一斑:

  1.还是“静态页”的问题。由于把URL变为.html结尾之后并没有得到明显的效果,他询问我们的实现方式。在得知我们使用了URL重写,而不是在硬盘上放置html文件时他“惊呼”这种欺骗搜索引擎的行为是会起到反效果的。他强烈要求我们在硬盘上放置html文件。这个要求自然遭到了我们的拒绝,原因之一是我们是非动态的网站,很难实现这个需求,但是更重要的是,懂得一点技术的人就知道,Web服务器的处理方式对于搜索引擎爬虫时完全不可见的,我们是否真正放置html文件与搜索引擎没有任何关系。

  2.内容的位置问题。在SEO看法,搜索引擎会更倾向于把页面靠前的内容看的更重,而把页面靠后的内容权值放低。因此那位专业SEO咨询师指着我们的某张页面说,这部分内容太靠“下方”,很容易被搜索引擎忽略。请注意,他说的是“内容在页面显示的时候出现在下方”。您觉得这种说法有道理吗?如今页面布局往往使用XHTML+CSS的方式,而搜索引擎只会关注HTML的内容,而“位置”很大程度上是由CSS,甚至是由JS来控制的。出现在HTML内容前段的内容,在页面呈现时也可以出现在下方,这也和搜索引擎没有任何关系。可惜这一点也解释了半天。

  3.最后一条可以说是最可笑的。因为SEO效果不好,那位SEO咨询师觉得只能“来真的”了,于是向我们索要网站的IIS日志。分析日志对于SEO有些帮助,因为可以看出爬虫的抓取顺序,频率,甚至结果等等,因此查看日志的做法本没有问题。可惜问题在于,对方从MSN上给出一个邮箱,让我们把过去几个星期的日志发给他。当看到这个要求的时候,老赵几乎要破口大骂。从这点可以看出,这位 SEO咨询师缺少必要的尝试,他根本不知道一个中小型的网站,每天便要生成几百兆到几个G的日志。如此没有常识,为什么会有那么多“成功案例”?

  老赵的博客(也就是您正在看的这个)在搜索引擎上的表现也非常糟糕,即使是老赵经常写作的话题,在Google上也很难找到几篇文章,排名也不太靠前。如果不使用site:cnblogs.com进行限制的话,几乎没有一篇文章是找到我的blog,都是各种地方的转载。为此我也比较苦恼,咨询了一些专业搞SEO的朋友,做出一些修改之后还是没有太大改善。不过我相信那只是我没有遇上优秀的SEO人员而已,我的博客的潜力还远没有挖掘到底。

  如果您是一个专业的SEO人员,或者是专业的SEO公司,不妨给我一些SEO看法的建议——如果可以的话,我也不介意在这方面进行一点投资。不过,如果是一些“肮脏”的优化方式就不必了,例如去论坛上贴链接,发垃圾邮件。我也知道这些做法很有效果,但是我不想这样做。

时间: 2024-09-27 22:04:07

关于静态页和SEO的看法的相关文章

一起谈.NET技术,关于静态页和SEO的看法

我们先来讨论一下,什么叫做"静态页".有朋友说,放在硬盘上的htm或html文件便是一种静态页,Web服务器不需要做额外的处理,直接读取文件内容并输出就可以了,而这样的静态文件对于SEO是有帮助的.至于理由,是搜索引擎会对html结尾的文件给更好的权值(这好像还是结论,不是理由),而这是"常识","了解一点SEO的人都知道这个","人们普遍在使用的做法",因此"它一定是正确的".不过其实Google并不这么

关于网页*静态化*及SEO问题的一些看法

我们还是先来讨论一下,什么叫做"静态页". 我们还是先来讨论一下,什么叫做"静态页".有朋友说,放在硬盘上的htm或html文件便是一种静态页,Web服务器不需要做额外的处理,直接读取文件内容并输出就可以了,而这样的静态文件对于SEO是有帮助的.至于理由,是搜索引擎会对html结尾的文件给更好的权值(这好像还是结论,不是理由),而这是"常识","了解一点SEO的人都知道这个","人们普遍在使用的做法",因此

谈*静态页*(或网页*静态化*)

"静态页",在Web应用程序开发中是很常见的概念.只是我发现目前还是有相当部分的朋友,在这方面的存在一定的误区.因此现在独立写一篇文章,也想把一些问题讲讲清楚,以后在讨论的时候也好有个准. 不久前有朋友写了一篇题为<提供生成静态页核心代码>的文章,介绍了一种"向硬盘写入页面文件"的方式.这篇文章的内容在此并不多作讨论,这里引用一下作者给出的摘要: 网页生成静态Html文件有许多好处,比如生成html网页有利于被搜索引擎收录,不仅被收录的快还收录的全.前台

艾伟_转载:谈*静态页*(或网页*静态化*)

"静态页",在Web应用程序开发中是很常见的概念.只是我发现目前还是有相当部分的朋友,在这方面的存在一定的误区.因此现在独立写一篇文章,也想把一些问题讲讲清楚,以后在讨论的时候也好有个准. 不久前有朋友写了一篇题为<提供生成静态页核心代码>的文章,介绍了一种"向硬盘写入页面文件"的方式.这篇文章的内容在此并不多作讨论,这里引用一下作者给出的摘要: 网页生成静态Html文件有许多好处,比如生成html网页有利于被搜索引擎收录,不仅被收录的快还收录的全.前台

筱芳浅谈网站内页的seo设置

在互联网的初期网站的页面设置多是从美观角度考虑的,但随着网络优化时代的到来,网站页面的布局已经不仅仅是从审美角度考虑,更多是是从SEO的角度出发,要让搜索引擎喜欢,可以说,一个优秀的网站布局是网页设计者和SEO相结合的结果.在上一篇筱芳简单了分享了网站的主页(Home)如何布局,得到朋友们的赞赏.今天筱芳就来简单地说下网站内页的seo设置,同时网站页面布局系列将陆续更新,还望大家能多多关注,多多支持: 1.页面seo设置的第一要素就是标题,标题是整个页面的核心,是搜索引擎判断页面相关性的一大参考

phpcms v9 生成静态页

phpcms生成的静态页目录规则是按照URL规则生成的, 静态页 内容是ob_clean前台模板文件产生的phpcms\templates\default,静态页的调试 :修改静态页,重新生成静态页再看效果,也可以调用前台控制/index.php?m=openservice&c=index&a=openservice修改好前台模板再生成.只要是静态页的链接都要及时同步文件,防止死链接,数据错误 Java代码   1.   $urlrule = $site_info['domain'].'/

生成静态页大全[ASP/PHP/ASPX]_ASP基础

ASP生成静态网页的方法 随着网站访问量的加大,每次从数据库读取都是以效率作为代价的,很多用ACCESS作数据库的更会深有体会,静态页加在搜索时,也会被优先考虑.互联网上流行的做法是将数据源代码写入数据库再从数据库读取生成静态面,这样无形间就加大了数据库.将现有的ASP页直接生成静态页,将会节省很多. 下面的例子是将.index.asp?id=1/index.asp?id=2/index.asp?id=3/这三个动态页面,分别生成ndex1.htm,index2.htm,index3.htm存在

转静态页的几种可行方案_网站运营

注:本文大部分内容来源www.netvtm.com,原作者:linyupark 对于文献发布系统来说SEO显得十分重要,当然现在转静态页也不是唯一优化的方式,但对于低智爬虫来讲静态页的优势很明显.下面来分析一下几种方案. 1.制作模板替换关键字符法很多站,包括本站上一个版本采用的就是这个方法.好处就是复杂性不大,缺点也很明显,实时交互性低,要提交一个评论可能就得让服务器重新生成一次文件,这种适用于纯粹信息发布,对于交互讲究不大的站. 2.利用服务器的组件进行请求地址的重定位用老外的话讲就是IIS

PHP asp jsp asp.net 页面的SEO优化方法

PHP页面相比HTML静态页面进行SEO优化有或多或少的不同.一段时间,这些问题会想到许多网站管理员.如果我用我的网站PHP的发展会是搜索引擎教程优化兼容吗?而在PHP中如果使用POST方法,那么会是一个问题?我指的是搜索引擎将不会被困?是的,这将是搜索引擎索引.文件类型并不重要的排名; PHP和HTML平等对待. PHP是一种服务器端脚本语言,是搜索引擎兼容. PHP是完全兼容搜索引擎优化,据我所知这是因为搜索引擎会看到PHP的输出,而不是PHP的代码本身. PHP是一种服务器端脚本语言,在大