linux 利用shell生成xml站点地图脚本

一些以静态页面为主的站点,可能不方便的没有生成sitemap 。而为了加快seo/seo.html" target="_blank">搜索引擎的收录,最好能主动做好sitemap,通过站长工具提交或写入robots文件,这样能加快百度、google等的收录。

下面以百度sitmap为例, 通过shell实现的代码如下:

 代码如下 复制代码

cd /data/www
find . -name *.htm > site.txt
sed -i 's/.//http://news.361way.com//g' site.txt
echo '<?xml version="1.0" encoding="UTF-8"?>' >sitemap.xml
echo  '<urlset>' >> sitemap.xml
cat site.txt|awk '{print "<url>""n"
"<loc>"$1"</loc>""n"
"<lastmod>""2013-10-28""</lastmod>""n"
"<changefreq>""always""</changefreq>""n"
"<priority>""0.6""</priority>""n"
"</url>"}'>>sitemap.xml
echo '</urlset>' >> sitemap.xml

以上使用到的参数,参考百度sitemap帮助页。

至于google sitemap也大同小异,而且google在收录方面更平民化一些。直接在google 站长工具页面提交站点地露天,一般三天左右的时候就可以收录。而百度只有所谓的优质用户才可以提交站点地图

时间: 2024-08-01 19:02:31

linux 利用shell生成xml站点地图脚本的相关文章

浅谈XML站点地图在大型网站中不可或缺的作用

网站地图是一个不陌生的词语,再通俗一点儿说网站地图就是一个页面,上面记录着网站所有网页的链接,但它不是访问别人网站时所看到的网站地图,它是帮助搜索引擎抓取你的网站的地图,是专门为搜索引擎蜘蛛而生成的. 我们所熟悉的网站地图一般分为两种:XML站点地图和HTML站点地图,很多新站长都以为XML站点地图和HTML站点地图是一样的,应为以前所报道的材料是也都显示XML和HTML是相似的站点地图,对搜索引擎的友好度也是相同的,其实两种站点地图还是有一些区别的,XML站点地图是给搜索引擎看的站点地图,HT

XML站点地图对网站排名影响

对搜索引擎的友好度也是相同的,其实两种站点地图还是有一些区别的,XML站点地图是给搜索引擎看的站点地图,HTML站点地图是增加用户体验性的站点地图,是给访问网站的用户看的.那么XML站点地图在大型门户网站中有什么作用呢?   一.XML站点地图能防止内容的重复 一个优秀的XML站点地图可以让你的网站更好地被搜索引擎抓取,如果这个XML站点地图可以帮助你消除网站重复内容的网址,这样你的网站就会非常的干净,而且网站还能获得应有的权重,网站主要的关键词在搜索引擎上也会有更好地排名. 二.可以更好的帮助

使用shell生成orabbix自动化配置脚本

在使用Orabbix监控Oracle的时候,本身和zaabix agent最大的不同便是使用Orabbix不需要对每个数据库实例都安装单独的agent,而是一个Orabbix实例可以对应多个数据库实例,Orabbix是基于JDBC的方式来实现的,基于此,配置的工作就尤为重要了. 对于一个数据库实例配置Orabbix,大体有下面三件事需要考虑. 网络的配置,防火墙中开放对应的端口,这个是在使用Orabbix agent的时候,为了使得Orabbix agent能够通过jdbc的方式访问到数据库,我

php生成百度站点地图sitemap类函数

公司网站是问答百科的网站.seo工程师提出需求说根据网站的问题来生成xml文件.每个xml文件包含5000条setmap格式数据.现在线上网站大约有70w条问题,所以说基本生成140个xml文件.还有一个索引文件.比如文件的名称以数字开头的.索引文件包含的内容就是每个xml文件的路径还有名称. 为什么要每个文件存储5000条数据呢,因为这是mysql的一个界限值.如果每次取多了以后可能会对线上用户访问造成影响,或者速度变慢.每个文件存储5000条数据,但是mysql selsect的时候不能每次

linux中shell生成随机密码示例

为了生成更加无序及相应复杂的密码,因此写了个生成随机密码的脚本,在此之前生成密码通常我是通过如下命令实现的 cat /dev/urandom | head -n 1 | md5sum | head -c 16 好了,不说所了,直接上脚本  代码如下 复制代码   [root@liufofu shell]# cat make_random_passwd.sh #!/bin/bash ######################################### # author       

linux下Shell中调用/引用/包含脚本文件方法

脚本 first (测试示例1)  代码如下 复制代码 #!/bin/bash echo 'your are in first file'   问)在当前脚本文件中调用另外一个脚本文件? 方法一: 使用 source 脚本 second (测试示例2)  代码如下 复制代码 #!/bin/bash echo 'your are in second file' source first   方法二: 使用 .  代码如下 复制代码 脚本 second (测试示例3) #!/bin/bash ech

Linux通过shell脚本创建SVN版本库简化创建过程

  Linux每次建立SVN版本库的过程都非常麻烦,如果将这些通过shell脚本来实现的话会简单很多,那么这个shell脚本要如何编译呢?下面小编就给大家介绍下Linux利用shell脚本创建SVN版本库的方法. 每次建立一个新的SVN版本库总感觉很繁琐,所以写了段脚本来把这个过程自动化,详细代码如下: #!/bin/bash # by www.111cn.net echo -n "Enter SVN name :" read svn_name /usr/bin/svnadmin cr

HTML和XML中站点地图Sitemap的区别

XML(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言).Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具.扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用.&http:

xml网站地图和html网站地图的区别

现在做网站优化!网站地图是个很是重要的部分.但是经常有人寻问网站是用xml sitemap,还是html sitemap?还是二者都用? 这是一个既有趣有较为沉重的问题! 首先让我们一起来看看这两种网站地图之间有何不同.HTML网站地图是传统意义上的网站地图,是写给网站用户看的.它相当于一个目录,给用户了解整个网站的网络结构,不至于迷路. XML 站点地图才是SEO领域说的真正意义上的Sitemaps,是写给搜索引擎看的,告诉搜索引擎哪个页面是重要的页面,相当于给了搜索引擎一个方向盘,以及更新的