大家都知道在网站优化过程中需要进行数据分析,而收录指标是众多数据里尤为重要的一个,并且很多时候我们不仅要查看网站每天更新的收录情况,还要查看整个网站更新页有哪些页面没有收录,而通过百度站长平台查看子栏目收录量或通过在百度利用site+inurl高级搜索只能查看更新栏目页的收录量,还是不能知道哪些没收录。一般情况下都是利用批量收录查询,但是这个问题来了,这个需要网址,大量的网址,如何快速获得网站更新页全部网址呢?今天木木seo就给大家讲一个方法。
接下来我们还是要用到火车头,上次在《如何快速获得百度前二页竞争对手标题?》一文中已经讲过一些火车头的用法,有重复的这里就不多说了。
一、打开火车头,新建一个名为“更新栏目网址”的任务。
二,点击起始网址框的添加按钮,如下图,选择“批量/多页”。这一步是最重要的了,我以木木seo博客为例,大家可以看到更新栏目页一共12页,地址基本一样,只不过是最后一个数字在等差递增,所以可以利用通配符和等差关系按下图进行设置,大家的网站更新栏目也肯定是有这个规律的,仔细看一下就可以进行设置。
三、点击多级网址获取的添加按钮,选择网址获取选项,按照头尾从选定区域提取网址,这里我用的这样的个头尾,为什么?因为查看博客源代码可以发现更新页的每页所有文章的网址都位于这2个注释代码之间,你的网站也一样,观察网站源代码,然后加入包含列表页的头尾代码或其他特征文字,点击保存
四、到这里可以说就完了,我们不用设置内容采集和发布,直接点击测试网址采集,在弹出的框里面点击导出一级节点就OK了,如下图。
好了,到这里就完了,在上图可以看到导出的一级节点网址一共566个,和博客总共的更新文章数量完全吻合。
写到这里了,赶紧去试一下吧,希望对你有帮助。
作者:木木seo 文章地址:http://blog.sina.com.cn/mumuhouzi