巧用EXCEL分析网站日志

  站长们都知道网站日志分析的重要性,但是当拿到网站日志后,面对里面一行行的代码,看的眼花缭乱却无从下手。今天我就给大家介绍一种用EXCEL表格详细分析日志的方法,希望对大家有所帮助。

  首先我们新建一个EXCEL文件,将日志文件导入到EXCEL表格中。

  在数据—>导入外部数据—>导入数据,打开选取数据源框,如下图

  

  然后找到网站日志所在目录,在下方的“文件类型(T)”处选择所有文件,这样你的日志文件就会显示出来了。

  

  选择你要查看的网站日志,直接打开文本导入向导。这里需要注意的是第一步,在请选择合适的文件类型处选择“分隔符号”,如下图

  

  选好后直接下一步,进入文本向导第二步,这里需要注意的是分割符号处要把对勾全部去掉。

  

  之后就一路下一步,直至完成。

  将日志导入成功之后,剩下的工作就是分析了。

  举个例子来说,我们想查看百度蜘蛛抓取了多少个页面。我们在EXCEL表格中选择数据—>筛选—>自动筛选,这样会在表格第一行出现一个带下拉框的小箭头,点击这个小箭头,选择“自定义”,打开“自定义自动筛选方式”,在第一行左边框选择“等于”,右边填写“*Baiduspder*”,确定就可以了。

  

  这样我们看到的就是百度蜘蛛抓取的所有内容了。

  对于一些稍微大一点的网站,百度蜘蛛抓取的内容也很多,看起来还是不方便,怎么办?呵呵,我们可以继续筛选啊。将上面筛选出来的结果复制到另一个表格中(如Sheet2中)。采取同样的方法继续筛选。比如你的网站有一个新闻栏目/news/,你想看看/news/这个栏目被百度抓取了多少次。方法依旧,选择数据—>筛选—>自动筛选,在第一行下拉框中选择“自定义”,在“自定义自动筛选方式”中上面左边框选择“等于”,右边输入“*/news/*”,这样就可以筛选出栏目/news/被抓取了那些页面以及被抓取的次数。如果有很多栏目,可以依次筛选。这样的话你就可以一目了然的看到每个栏目被抓取的内容和次数。如果有些栏目抓取次数明显偏少的话,你就需要有针对性的对这些栏目进行优化了。这就是我们分析日志的目的。当对某些栏目进行优化后,过一段时间(最少一个月),我们依然采取这样的方法,看看优化的这些栏目抓取量是否上升。这也是我们检测优化效果很实用的方法。

  当然了,我们通过EXCEL还可以筛选出很多我们需要的数据。比如可以筛选出某个ip地址的用户共浏览了多少个页面,都浏览的那些页面。这对于网站布局和页面设计都很重要。再比如可以查看某个搜索引擎的某个蜘蛛共抓取了多少个页面,抓取了哪些页面,抓取频率等待。长时间观察的话,你会发现很多蜘蛛抓取的规律,甚至能反推出蜘蛛的抓取规则。更多数据还请大家根据自己的需求来分析,这里就不做赘述了。总之,我们可以很方便的使用EXCEL表格从网站日志中筛选出我们需要的内容。

  本文由:网赚http://www.12651.net首发A5,转载请注明出处。

时间: 2024-11-01 12:14:27

巧用EXCEL分析网站日志的相关文章

手把手教你玩转excel分析网站日志

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在seo逐步普及的大浪潮下,许多所谓的seoer都将她简单归结为内容和外链,其实这个说法并没有错,内容和外链的确是做seo最为重要的两大手段,但这就好像某领导在某大会上发言:"我们要继往开来,我们要卓越进取!",继往开来是对的,卓越进取是对的,但靠什么继往开来.卓越进取就不得而知了.所以在这里我想说的就是科学的理性的看待s

网站日志里的秘密 分析网站日志有助于SEO

网站日志可以很好的记录访客和蜘蛛的访问情况,通过网站日志可以很好的了解网站的一些状况,这也是为什么现在很多SEO都会去分析网站日志的原因,但是分析网站日志的人不一定完全了解网站日志,下面我就浅谈一下网站日志里的秘密. 分析网站日志当然需要网站日志分析器,当然现在很多人使用免费的网站日志分析器,但是这些网站日志分析器分析出来的东西很有限,所以说很多网站信息也就被影藏了,下面我就以那种付费的网站日志分析器来阐述. 大家通过普通日志分析器一般都是看有没蜘蛛来过,什么蜘蛛,访问时间,访问哪些了页面.访问

SEO新手要学会查看和分析网站日志

作为SEO新手一定要学会查看和分析网站日志,因为从观看这些网站日志代码当中,可以分析出一个网站大体的状况. 网站日志中常见的代码: 网站日志记录了网民访问网站后返回的一些代码,其中常见的是200.304.404,返回代码200说明这个网站访问是正常的,返回代码404说明有一些错误的链接,已经访问不到链接的这个网页,这个情况大多数是站长删除了这个网页,如果返回是304说明这个网站已经很久没有更新了. 网站日志中常见的蜘蛛: 在网站日志中你可以看到一些搜索引擎的蜘蛛,常见的有:baiduspider

捕捉蜘蛛 教你简单分析网站日志

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 想要成为一名合格的SEOER,那么研究搜索引擎蜘蛛的行为就成为了你每日的必修课,所以这次我就来给大家简单的介绍一下如何去分析网站日志.既然是要分析网站日志,首先要满足的先决条件自然就是要有网站日志了,在这里我就不介绍如何去生成和获取网站日志. 因为一般情况下如果你用的是空间那么基本上绝大多数空间都有网站日志,通过都存放在空间的log文件夹下面

通过分析网站日志 了解搜索引擎变化

作为一名站长不但要懂得如何写原创,如何发外链,还要学会分析网站的日志.站长会分析网站的日志,就能了解你的网站在搜索引擎中是否比较重要.通过网站日志你能得到哪些重要的信息,下面来详细说明下: 一.看网站的抓取情况 1.新站刚上线,看看搜索引擎有没有来你网站抓取了; 2.网站收录异常,或者被k,通过日志可以了解搜索引擎是否还有来光顾你的网站; 3.对于网站的问题进行解决,必须要读懂日志; 二.怎么查找网站日志? 一般在FTP一个名为logs的文件夹,不同的服务器可能日志文件命名不一样,不过一定会包含

站长应该学会巧用Alexa分析网站流量来源

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 分析一个网站的流量来源是非常重要的一项数据分析工作,通过它的流量来源,我们可以知道这个网站用了什么样的推广手段.不过很多网站是不提供流量来源的,这时候用Alexa来分析网站流量来源就比较重要了.也许很多人只是看Alexa的排名,但很少接触它的其他功能,Alexa有个中文版,大家可以使用它来研究来路,下面我就以月光博客.卢松松博客.牟长青博客的

分析网站日志中百度蜘蛛返回304状态码的情况

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 最近遇到一个网站被百度蜘蛛抓取首页后大量返回304状态码的问题,以前遇到过301和302,就是没了解过304,刚好可以对这个情况进行一下分析和观察,以便比较深入的了解该问题的出现以及应对之策. 百度百科对304状态码是这么解释的:如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有

蜘蛛爬行时间的分析—网站日志分析感悟

很多站长经常对于蜘蛛的爬行时间以及收录时间都不太有把握.可能很多人认为蜘蛛爬行一天就来一两次,或者上午来一次或者下午来一次,所以很多站长更新自己的文章都会选择固定的时间来更新,认为这是对搜索引擎友好的一种表现.其实这种想法,有一定的道理的.但是一天的收录更新量最终反映的是一天的更新数据,很少有秒收的(当然不排除较好的文章以及网站).据笔者的分析来看,蜘蛛每时每刻都可能来我们的网站. 笔者以自己负责优化推广的站点-妇科在线咨询网日记文件分析数据来介绍一下.选择三组数据来演示一下. 图1 图一是凌晨

使用shell脚本分析网站日志统计PV、404、500等数据_linux shell

下面的脚本能统计出网站的总访问量,以及404,500出现的次数.统计出来后,我们可以结合监控宝来进行记录,进而可以看出网站访问量是否异常,是否存在攻击,一目了然.还可以根据查看500出现的次数,进而判断网站程序是否出现异常. 复制代码 代码如下: #!/bin/bash#purpose:count nginx or apache or other webserver status code using jiankongbao#how to:run the script every 5 minut