教你创建Google网站地图Sitemap.xml

  Sitemap.xml是google搞出来的,也就是网站地图,不过这个网站地图是用xml写的,而且要按google的标准来写,并且要将写出来的这个文件sitemap.xml上传到自己的服务器空间中去。目前,Google, Yahoo, MSN都已经声明支持这种格式,Baidu还没有声明支持,但估计走这一步也是大势所趋。这将是向众多搜索引擎提供你网站信息的一种很好的方法。

  提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址,比如动态网页,包含大量AJAX的网页或者flash的页面。二是为搜索蜘蛛指明“工作方向”。Sitemap就是你网站上页面的列表,googlebot就按照这个去一个个的抓取收录页面,显然比它自己去找会效率高,而且要全。Google网站上有完整的关于sitemap.xml的详细说明:

  http://www.google.com/support/webmasters/bin/answer.py?answer=40318&hl=zh_CN

  但很多站长看后仍然不会操作,下面这个教程就是手把手教会你创建Sitemap.xml。

1.         Sitemap.XML 的格式

完整格式如下:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

<url>

<loc>http://www.yrtrip.com/default.asp</loc>

<lastmod>2008-07-17</lastmod>

<changefreq>daily</changefreq>

<priority>1.0</priority>

</url>

<url>

<loc> http://www.yrtrip.com/search2.asp?id=32003044&amp;sq=1</loc>

<lastmod>2008-07-17</lastmod>

<changefreq>weekly</changefreq>

<priority>0.9</priority>

</url>

</urlset>

下面,对以上标签分别加以解释

a)       <?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

这两行就相当于网页文件中的<html>标签一样的作用。不必管这两行什么意思,照抄即可。

切记:一个字符也不能错,即使多一个空格,google网站采集时也会报错。另外,千万别忘了在文件的末尾加上</urlset>标签。

  b) url:每个标签包含一个网页地址,是以下标签的父标签。

  c) http://www.yrtrip.com/default.asp

  这里是页面链接地址,也就是你希望蜘蛛访问的地址。

  切记:在地址中出现的某些特殊字符需要使用转义字符,否则,google也会报错。最典型的就是 & 号,经常在动态网址中出现,在提交地址中必须写成 & 如:提交http://www.yrtrip.com/search2.asp?id=32003044&sq=1,google管理员工具就会报错,而改为 http://www.yrtrip.com/search2.asp?id=32003044&sq=1提交后就没有问题了。我看到网上有人说sitemap.xml只能提交一个参数的网页的说法,其实多半是因为没有使用转义字符而导致出错的。其他的转义字符就不一一列出了,大家可以在网上查。

  d) lastmod:页面最后修改时间

  这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行 比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新 对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:

  年:YYYY(2008)

  年和月:YYYY-MM(2008-06)

  年月日:YYYY-MM-DD(2008-06-04)

  年月日小时分钟:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)

  年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)

  这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了

  切记:其他格式可能引起出错,比如将2008-08-08 写成2008-8-8就会出问题。

  e) changefreq:页面内容更新频率。

  这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了吧,光看单词的意思就明白了。

  f) priority:相对于其他页面的优先权

  定于0.0 - 1.0之间 。

  切记:建议将各类网页根据重要性给出不同的数值,以方便蜘蛛的采集,不要耍小聪明全部写1.0,google管理工具会报错的。

  2. Sitemap.xml制作方式

  制作方式无非两种,自动方式和手动方式。

  自动方式一般使用生成工具自动生成,只需输入自己的网址,就可以得到完整的xml文件。这种方式一般适用于静态网站,在此不再赘述。但需要提醒的是,网上的工具良莠不齐,生成的文件经常有错误,不一定能通过google的校验,使用者需认真辨别。

  手工方式则是由站长手工填写或写程序完成均可,代码很简单,大家可以到网上查找。

  3. 提交

  Sitemap.xml制作完成后,就需要将xml文件提交到相关搜索引擎。

  Google提交网址:http://www.google.com/webmasters/sitemaps/?hl=zh-CN

  Yahoo提交网址:http://sitemap.cn.yahoo.com/

  提交后,一般在几个小时之内,系统就开始下载处理了。

  4. Sitemap.xml的校验

  至于你的网站地图是否符合标准,最方便的手段就是使用google的管理员工具了。

  在他下载你的sitemap.xml后几天内,这个工具就会将详细的分析结果反馈回来,包括:sitemap.xml中包含了多少地址,google已将多少地址加入索引,sitemap.xml中出现了哪些错误,甚至蜘蛛采集过程中遇到的各种问题,比如哪些网页有404,500错误都会详细的罗列出来,非常方便。

  如果你提交的xml文件一切无误,那么接下来,你就是等着让它的搜索蜘蛛来爬了,sitemap的文件告知了文件更新的频率,这样搜索蜘蛛来得更勤快,页面被收录当然也就更快。

  5分半钟:Google网站地图 Sitemap.xml

时间: 2024-10-27 00:13:41

教你创建Google网站地图Sitemap.xml的相关文章

向GOOGLE提交网站地图(sitemap)的全过程

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 sitemap在网站收录过程中的作用不容忽视,他是保证你网站内页被收录的最佳助手.也许你会发出现,我的首页已经被GOOGLE收录了,但是内页好像没有什么大的变化,或者说内页的收录速度很缓慢.当你碰到期个问题的时候,就要向GOOGLE提交网站地图了.首先我们来认识下sitemap Google SiteMap Protocol是Google推出

提交网站地图Sitemap 百度、Google、Yahoo!经验总结

Sitemap协议讲解是指:Google SiteMap Protocol是Google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级.在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于Google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度.文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址.更新时间.更新频率和索引优先权. 向Google提交http://www.aliyun.

如何正确的向搜索引擎提交网站地图Sitemap

昨天我和大家分享了<如何有效的向百度提交网站地图(Sitemap)>,文章发布在我的博客上,百度提交网站地图的方法分享完了,今天我们主要来讲讲其他各大搜索引擎的网站地图sitemap的提交方法.大家可能觉得我做baidu排名的没必要去别的搜索引擎提交网站地图,其实在昨天我在文章中已经提到了,搜索引擎许多因素都是互相借鉴的,你在某一个搜索引擎当中获得较好排名后,一般情况下也会在别的搜索引擎当中慢慢的得到相应的体现,所以我们必须也要重视全部各大搜索引擎的优化,我们就从提交网站地图开始. 除了百度其

ASP.NET生成Google网站地图的代码_实用技巧

复制代码 代码如下: /// <summary> /// 生成google网站地图 /// </summary> /// <returns></returns> public static boolBuildGoogleSitemap() { try { string RootDirectory = AppDomain.CurrentDomain.BaseDirectory; XmlTextWriter Writer = new XmlTextWriter(

如何有效的向百度提交网站地图(Sitemap)

今天无锡可可SEO来分享关于网站地图向百度提交的问题,注意这里说的是提交网站地图(sitemap),而不是网站提交.一般做SEO的都知道网站提交,但是网站地图提交做百度的人会很少接触,但是做google的 人一定会很比较熟悉.因为在几大搜索引擎当中,google.bing.yahoo都有站长工具,站长工具里面都有网站地图提交的功能,可以方便我们提交 sitemap.虽然百度有站长平台,但是sitemap提交却还在内侧当中,百度官方需要邮件申请,但是从一般人申请经验来说,申请通过率微乎其微.但 是

网站地图的XML文件与搜索引擎的关系

网站地图又称站点地图,它就是一个页面,上面放置了网站上所有页面的链接.大多数人在网站上找不到自己所需要的信息时,可能会将http://www.aliyun.com/zixun/aggregation/12334.html">网站地图作为一种补救措施.搜索引擎蜘蛛非常喜欢网站地图. 大多数人都知道网站地图对于提高用户体验有好处:它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面.对于SEO,网站地图的好处就更多了: 1.为搜索引擎蜘蛛提供可以浏览整个网站的链接 2.为搜索引擎蜘蛛

Python3分析sitemap.xml抓取导出全站链接

最近网站从HTTPS转为HTTP,更换了网址,旧网址做了301重定向,折腾有点大,于是在百度站长平台提交网址,不管是主动推送还是手动提交,前提都是要整理网站的链接,手动添加太麻烦,效率低,于是就想写个脚本直接抓取全站链接并导出,本文就和大家一起分享如何使用python3实现抓取链接导出. 首先网站要有网站地图sitemap.xml文件地址,其次我这里用的是python3版本,如果你的环境是python2,需要对代码进行调整,因为python2和python3很多地方差别还是挺大的. 下面是pyt

利用Sitemap网站地图让百度google快速收录

一般来说,搜索引擎蜘蛛会跟着链接爬行到你网站的所有网页.但很多时候,由于种种原因,并不是所有网页都能被收录进搜索引擎数据库.比如说,你的网站是数据库动态生成的,URL中带有参数,一些网页离主页太远,你的网站PR值太低,新的网页可能过很长时间才有机会被抓取等等. Google http://www.aliyun.com/zixun/aggregation/9103.html">Sitemap就允许站长上传给Google一个网站地图,列出你所有需要被抓取的网页及重要性级别.据很多人证实,Goo

sitemap网站地图在线生成器使用介绍

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   网站地图又称站点地图,它就是一个页面,上面放置了网站上所有页面的链接.大多数人在网站上找不到自己所需要的信息时,可能会将网站地图作为一种补救措施.搜索引擎蜘蛛非常喜欢网站地图. 大多数人都知道网站地图对于提高用户体验有好处:它们为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面.对于SEO,网站地图的好处就更多了: 1.为搜索引擎蜘蛛提供可以浏览整个网站