Google的奇怪规则:URL不能以.0结尾

  前两天SEOMoz发现和解决了一个很奇怪的Google收录问题。

  SEOMoz有一个网页,是关于他们举办的Web 2.0大奖(Web 2.0 Awards)。URL是:

  http://www.seomoz.org/web2.0

  这个奖在网上还挺受欢迎,链接很多,URL是PR7。而且一直以来在Google搜索”Web 2.0 Award”时都排在第一位。

  但前几天SEOMoz发现搜索Web 2.0 Award时,这个页面从Google消失了。排在最前面的是一个更深一层的页面。

  SEOMoz也弄不清是这么回事。所以Rand联系了Google里面认识的人,Google的人建议最好把URL改成不以.0结尾。

  注意看SEOMoz这个页面URL,后面没有跟着一个斜线/。在大部分情况下,URL结尾没有典型文件扩展名如.html,.php等时,URL会被当作目录,目录名后面没有斜线时,服务器会在后面自动加上一个斜线。比如SEO每天一贴,如果用户直接打开:

  http://www.chinamyhosting.com/seoblog

  或者有其他网页链接到上面这个URL,服务器都会自动做一个301转向到:

  http://www.chinamyhosting.com/seoblog/

  由于某种原因,SEOMoz的这个URL并没有做301转向自动在目录后加上斜线,也就是说URL还是以.0结尾:

  http://www.seomoz.org/web2.0

  浏览器和蜘蛛就把这个URL当作了文件名,这个文件的扩展名(或者说文件类型)是.0。而.0文件Google拒绝收录,就像.exe文件一样。

  SEOMoz做了很多调查,发现页面没被收录问题确实是因为这个以.0结尾的URL。在网上找不到以.0结尾的文件被收录在Google数据库中。像以下这些文件在Google都没收录,但雅虎有收录:

en.wikipedia.org/wiki/Windows_1.0 en.wikipedia.org/wiki/Web_2.0 http://en.wikipedia.org/wiki/Die_Hard_4.0 drupal.org/drupal-5.0 keznews.com/3799_Vista_Transformation_Pack_8.0_Final_-_VTP_8.0 en.wikipedia.org/wiki/BASIC_8.0 drupal.org/drupal-6.0 en.opensuse.org/OpenSUSE_11.0 www.shopping.com/xGS-Illustrator_11.0 www.mythtv.org/wiki/index.php/Opensuse_11.0 www.shopping.com/xGS-Suse_9.0 en.wikipedia.org/wiki/Mac_OS_X_10.0 en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0

  而非常相似的下面这些URL,Google就有收录:

en.wikipedia.org/wiki/Web_2 drupal.org/drupal-5.0-beta1 http://keznews.com/3799_Vista_Transformation_Pack_8_0_Final_-_VTP_8_0 drupal.org/drupal-6.0-beta1 www.mythtv.org/wiki/index.php/Opensuse_10.3 www.mythtv.org/wiki/index.php/Opensuse_10.2 en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3

  比较一下这两个URL,域名,链接深度等几乎都没什么区别,唯一的区别就是URL结尾的不同:

  en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3 收录
  en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0 没收录

  SEOMoz发现了这个问题后,发了一篇帖子。很快Matt Cutts也回了篇帖子,做出了回复和调整。Matt Cutts说,是因为连到URL

  http://www.seomoz.org/web2.0

  的链接足够多时使Google认为它是应该被收录的那个URL版本,但Google又不收录.0文件,所以SEOMoz的这个页面被删除了。

  Matt Cutts还提到一个小技巧,要检查某种文件名是否会被Google中被收录,有一个很简单的指令如:

  filetype:exe

  上面的搜索结果可以看到,没有直接以.exe结尾的URL被收录,也就是说.exe文件Google不收录。

  同样.0文件Google一直到两天前还都不收录。不过Matt Cutts看到SEOMoz的这个帖子后,与工程师重新审视了一下现在以.0结束的URL,肯定也不都是垃圾页面(可能以前大部分是),所以对Google收录算法做了一定调整,重新开始收录.0文件。其实很多网页以.0结束,并不是因为文件类型,而是像SEOMoz那样,在想写Web2.0时,很巧合的以.0结尾而已。

  现在搜索一下的话,已经可以看到SEOMoz的这个Web2.0奖网页已经重新被收录了:

  第一,这种细节问题,不碰到还真想象不到。

  第二,认识人好办事。

  第三,Google经常也从善如流。

  作者: Zac@SEO每天一贴

  原载: 中新
虚拟主机

时间: 2024-10-29 10:23:11

Google的奇怪规则:URL不能以.0结尾的相关文章

Google搜索从入门到精通v4.0

中介交易 SEO诊断 淘宝客 云主机 技术大厅 Google搜索从入门到精通v4.0  发布日期:2004-2-17 19:59:11   作者:   出处:     1,前言 2,摘要 3,如何使用本文 4,Google简介 5,搜索入门 6,初阶搜索  6.1,搜索结果要求包含两个及两个以上关键字  6.2,搜索结果要求不包含某些特定信息  6.3,搜索结果至少包含多个关键字中的任意一个 7,杂项语法  7.1,通配符问题  7.2,关键字的字母大小写  7.3,搜索整个短语或者句子  7.

Google 不推荐在 URL 里使用竖线

有人在Google Webmaster Help里问在URL里使用竖线(也就是"|",比如类似www.guao.hk/backup|you|forever这样的URL地址)是不是挺傻的,因为他发现在Google Keyword Tool里添加带有竖线的URL地址,Google会给他一个无效网站的错误提示.在Google里搜索inurl:|也是找不到任何东西的. Google的JohnMu回复了他: 我通常会抓取并索引所有可访问和有效的URL,也许你会在我们的索引里找到很多带竖线的URL

Google's text to speech for asterisk 0.2发布 AGI脚本

Google's text to speech for asterisk是一个AGI脚本,使用http://www.aliyun.com/zixun/aggregation/9827.html">谷歌翻译转换为文本语音和回放功能.它支持多种不同的语言,语音数据的本地高速5603.html">缓存,8 kHz和16 kHz采样率,以尽可能提供最佳的音质. Google's text to speech for asterisk 0.2该版本是首次公开发行版本,具有缓存机制功能

Google第四季度总营收为181.0亿美元

摘要: 截至12月31日的2014财年第四季度财报显示,Google第四季度总营收为181.0亿美元,比去年同期的157.1亿美元增长15%:按照美国通用会计准则,Google第四季度总净利润为47.6亿美元,比去年同期 截至12月31日的2014财年第四季度财报显示,Google第四季度总营收为181.0亿美元,比去年同期的157.1亿美元增长15%:按照美国通用会计准则,Google第四季度总净利润为47.6亿美元,比去年同期的33.8亿美元增长41%.Google第四季度营收和利润均未达到

Google不推荐在URL里使用竖线

SEARCH ENGINE ROUNDTABLE网站上曾发表一篇文章<Don't Use Pipes In Your URLS | Says Google>,提出Google不推荐在URL里使用竖线.谷奥网站提供了本文的中文翻译,现转载于此.全文如下: 有人在Google Webmaster Help里问在URL里使用竖线(也就是"|",比如类似www.guao.hk/backup|you|forever这样的URL地址)是不是挺傻的,因为他发现在Google Keywor

百度网站改版工具高级规则URL替换规则详解

网站随着规模.业务.技术的变化进行改版是在所难免的,但网站改版也有一定的风险,特别是网站链接结构的改变容易遭到搜索引擎的惩罚,轻则降权重则被K,为了最大限度的降低风险,站长们一般通过301永久重定向技术进行新旧链接的替换,不同的搜索引擎对301的反应速度是不一样的,GOOGLE作为目前世界上最成熟的搜索引擎,反应较灵敏,而百度在这方面反应较迟缓(有点老年滞呆的感),但日前百度终于推出了301改版工具,关于工具的使用,请参见百度站长平台资料, 网站改版的注意事项?http://zhanzhang.

也说Google卫星地图的URL地址的qrts编码算法

今天看到有人已经在讨论如何获取google卫星图片,见 http://www.cnblogs.com/tangf/archive/2006/07/23/457902.html? login=1&CommentID=1507040#Post的一篇博客,里面抄了JavaScript和delphi的代码过来,我在此 再重抄一遍免得大家找来找去. 算法思想如下:Google卫星图片服务器,由不同层次的256x256大小的jpeg图片无缝拼接而成,其编 码方式是按照qrst编码方法进行索引: zoom=1

Google搜索从入门到精通 v4.0(3)

■ 9.其他罕用语法9.1.搜索所有链接到某个URL地址的网页如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接.而"link"语法就能让你迅速达到这个目的.示例:搜索所有含指向华军软件园"www.newhua.com"链接的网页.搜索:"link:www.newhua.com"结果:搜索有链接到www.newhua.com的网页 . 共约有920项查询结果,这是第1-10项 . 搜索用时0.12秒.注意:"link&quo

google怎么看待“绝对URL”和“相对URL”?

绝对路径URL:使用完整的URL指向指定网页. 相对路径URL:使用自动的URL指向指定网页. 例如:对指定网页www.9lolo.com/page1/index.html为绝对路径 /page1/index.html 则为相对路径. 对于相对路径来说,浏览器会自动在该链接前加上"www.9lolo.com" Google对"绝对URL"和"相对URL"是否一视同仁? 调研内容如下: 数据1:用20个不同热门查询词语进行搜索,采集每次查询结果的前