浅谈站内分析中不可或缺的一环:IIS日志分析

  对于每一个优化人员来说都需要具备一定的分析能力,分析用户的搜索行为、分析站点的数据流量等等。只有合理的分析好这一些数据才可以更好的制定我们的优化策略。其中在我们的站内分析中不可缺少的一项就是分析搜索引擎蜘蛛的抓取爬行行为。搜索引擎蜘蛛是我们肉眼所不能看到的,我们要如何分析它的爬行行为呢?我们可以通过分析我们站点的IIS日志。

  一:那么从分析IIS日志我们可以从我们的站点上得到什么信息

  1:在外链的建设中我们知道网站上的每一个外链都是搜索引擎蜘蛛进入我们网站的入口,对此我们可以观察日志上的蜘蛛的造访情况,就可以从另一角度查看我们的外链是否能够更好的吸引到蜘蛛,以此制定一个更加合理的外链建设策略。

  2:站点的空间问题是很多站长棘手的问题之一,站点打不开很可能使我们的站点一夜回到解放前。那么对于我们的站点来说如何最快最早的了解发现问题呢。对此同样可以通过分析该日志上的搜索蜘蛛爬行情况,因为站点空间除了什么问题的第一反应就是搜索引擎蜘蛛。

  3:通过该日志我们也可以分析蜘蛛对于页面内容的爬行情况。了解搜索引擎更加喜欢我们站点上的什么内容。我们可以根据这些数据在内容上的布局或者微调,是搜索引擎更加的爱上我们的内容。

  二:如何获得我们站点的IIS日志及IIS日志的设置

  首先,我们的站点空间需要支持站点的日志下载。对于这点我们在购买站点空间的时候可以先与空间商进行咨询,是否支持该功能,如果支持的话,一般日志文件置于weblog文件中,我们可以直接FTP到本地。对于IIS日志的记录设置,笔者认为一般如果站点的内容较多,结构较复杂的可以设置成一小时生成一次,而内容较少的话可以设置成一天更新一次,这样可以避免我们的IIS日志出现信文件过大的问题。

  三:如何分析我们站点的IIS日志

  1:对IIS日志文件的拆分分析

  我们使用FTP把日志下载本地后,可以通过记事本打开文件,同时搜索主要的搜索引擎蜘蛛名称,其中的百度的蜘蛛名为BaiduSpider、谷歌的蜘蛛名为Googlebot 。如下图所示

  


 

  百度蜘蛛

  


 

  谷歌蜘蛛

  我们可以分段进行分析

  2012-04-13 06:47:10 是指蜘蛛爬行该页面的具体日期和时间

  116.205.156.37 这个地址是指我们站点所在的IP地址

  GET 代表事件,跟在这个参数后面的是指蜘蛛所爬行的页面,而“/”代表的是站点的主页。

  220.125.51.130 这一IP是指搜索引擎蜘蛛的服务器的IP地址。当然这个IP地址并不一定就是真正的搜索引擎蜘蛛服务器的地址,因为有可能是有的人为了采集你的站点上的内容,而冒充搜索引擎蜘蛛来爬行你的站点,抓取你的内容。这种情况虽然没有什么大的影响,但是如果频率高的话将会消耗站点的资源。那么我们如何辨别呢?笔者分先给自己的一小方法。我们可以打开我们电脑的控制命令窗口。然后打入nslookup+IP地址的命令。如果是真的蜘蛛会有自己的蜘蛛服务器。我们就可以对假蜘蛛的IP进行屏蔽处理。如下图所示

  


 

  真蜘蛛

  


 

  假蜘蛛

  2:上文我们提到GET参数后跟的是搜索引擎蜘蛛爬行的页面,我们可以根据这一信息分析搜索引蜘蛛对我们站点上什么内容更青睐,然后对我们的站点内容做相应的微调。​

  3:我们通过日志可以发现蜘蛛对于我们站点页面的爬行抓取是根据页面的权重的递减分等级的,一般顺序为主页、目录页和内容页。​

  分析是我们优化工作中一项必不可少的工作,而我们身边可利用的数据也很多。合理的利用好这一些数据相信会为我们的优化助力不少的。本文由淘宝皇冠店http://www.jgdq.org 独家供稿,转载请留链接,谢谢!

时间: 2024-12-02 10:51:10

浅谈站内分析中不可或缺的一环:IIS日志分析的相关文章

浅谈站内优化中锚文本使用的注意事项

  锚文本相对与文本链接的功效,相比优化人员都深有感触.而锚文本的使用定义我们可以区分为站内锚文本的使用和站内锚文本的使用.对于站外锚文本我们会相对熟悉,而对于站内的锚文本设置的注意事项可能还是知之甚少.那么站内锚文本的使用有什么注意事项呢?笔者今天将就这一问题分享自己的几点心得. 一:控制锚文本的长度 笔者曾经看过一个博客的内容,发现这个博客中的内容经常在一整句话上习惯的加上锚文本,并且所有的都指向同一个页面.笔者搞不清楚这个博主为什么这样做,但是笔者认为这位博主的方法是不可取的.由此笔者联想

浅谈站内优化中內链建设的四个注意事项

  对于站内优化,这是每一个优化人员必修的功课之一.而且现在搜索引擎对于站内的优化也开始越来越重视,一个成功的站内优化对于站点的稳定排名及流量有着深远的影响.对于站内优化需要注意的问题会比站外优化来得多,例如站点的导航.结构.界面等等问题.而站点的內链建设起着最重要的影响,它不仅会影响着搜索引擎的索引,而且直观的影响着用户的友好性体验.那么在站点內链的建设中我们需要注意哪几方面问题呢?笔者将就这一问题分享自己的几点心得. 一:具有相关性的内容互链 一个成功的站点需要很多的高质量的内容,而要使用户

浅谈站内优化你我容易忽视的三点细节

随着搜索引擎对于算法的不断更新,我们可以看到一个很明显的信号,那就是搜索引擎对于站点内部结构越来越关注.对此如果你想要给搜索引擎留下一个好的印象,你不在只是做几个高质量的外链就可以的,你还需要有一个合理的站内内部结构做坚实的后盾. 我们在做站点的内部优化的过程中,我们不仅仅需要考虑到搜索引擎索引,同时我们还需要考虑到用户的友好体验度.我们在内链建设中需要注意来自各方面的细节,只有我们做好内链建设的细节,才能使优化达到我们想要的效果.那么笔者将在下文中分享自己的三点心得? 一:不要主导航栏目上安排

浅谈站内因素导致文章不收录原因分析

一篇文章是否被百度收录,除了要看文章的质量外,还需要看网站本身的一些因素,文章的质量包括,内容是否原创,重复率太高的文章一般百度是不会收录的,还要看文章的可读性和相关性,文章都是一些可读性非常差,甚至跟网站主题不相符的内容,搜索引擎肯定不会收录,即使收录了,存活的时间也不长,被剔除是意料之中的事. 除了内容质量外,其实还跟网站的的一些因素有关,我们不难发现网站里面的内容,有的被收录了,有的没有被收录,其实很多高权重的网站收录并没有做到百分百,就比a5站长网的文章,上次发表了一篇关于网站seo的文

浅谈站内优化的系统化操作 如何进行站内优化

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 这些天一直想写写站内优化的事,关注xiaohan的blog后发现,其写了不少;今天就谈谈自己的一点看法,希望更多seoer,博百优者指导批评; 1.什么是站内优化? 对网站内部的进行优化,就叫站内优化,简单理解!优化---让网站变得更优秀; 2.站内主要优化什么? 这是重点,网站内主要包括:内容优化.页面标签优化.程序附件优化.页面布局优化.

浅谈站内文章编辑的基本要点

近来和很多站长朋友聊天的时候,大家都提到站内文章编辑问题,都反映虽然网站已经有一定权重,但是编辑好的文章很多还是没有被收录;有些被收录的文章没有获得相应排名;有了排名跳出率又很高.经过大家讨论得出站内文章以下的编辑要点,仅供参考. 文章排版规范化 排版规范化主要是针对用户体验来说的,一篇有排版的文章明显要好过一些杂乱无章的文章,一个排版规范的文章讲究的是有头有尾有内容,正所谓虎头凤尾猪肚子,很形象的为我们解述了文章基本的排版标准. 网页颜色布置合理 也许你会感到不解,文章的质量和颜色有什么关系,

三个方面浅谈站内优化的重要性

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 网站的内部优化是大家老生常谈的一个问题,现在越来越多的站长也非常注意站内优化.在开始为你的网站更新内容.建设外部链接.做各种外部推广之前,请先停下脚步看看网站内部是否已经达到了合理.站内优化包括多个方面,比如URL优化.结构优化.图片和文字优化.内部链接优化等等.也有的站长说只要多花点时间把外部链接做上去,即使网站内部不做优化也不会有太大的影

浅谈js在html中的加载执行顺序,多个jquery ready执行顺序_javascript技巧

jQuery $(document).ready()执行顺序: 当页面DOM 元素全部加载完毕后就执行.ready().$(document).ready()是DOM结构绘制完毕后就执行,不必等到加载完毕. 如果在.ready()执行之前有javascript代码存在,那么javascript将怎么执行呢? 答案是先执行.ready()之前的javascript代码,然后执行.ready(). 多个$(document).ready()的执行顺序并非单纯的顺序执行,其与嵌套层级也有一定的关系.

浅谈在JAVA项目中LOG4J的使用_java

一.直接使用: //输出到项目文件夹下output1.txt文件中 ////////////////////////////// // DEBUG - Here is some DEBUG // INFO - Here is some INFO // WARN - Here is some WARN // ERROR - Here is some ERROR // FATAL - Here is some FATAL ////////////////////////////// package