谈谈怎么利用服务器日志来分析我们页面为什么不被收录

  很多人都在说原创,每天去采集,然后修改后,重新发到自己的网站上,但是不知道你木有想过一个问题,我们发的文章有没有意义,为什么不被收录,蜘蛛怎么去认为我们发的文章有没有意义。

  在这之前,我们得知道服务器日志在哪里寻找,服务器日志一般存在于FTP空间一个Log的文件夹下,并且是tor后缀结尾。将他下载后,解压后我们得到俩个文件,将有大小文件后缀名更改为域名.txt 然后打开。我们会得到一大串文字字符,不要担心从何看起,我们一条条的分析。但是我们首先得知道那些IP所代表的意思。下面我都列出来了。

  Baiduspider=Baiduspider蜘蛛

  Googlebot=Googlebot蜘蛛

  Sogou=Sogou蜘蛛

  Yahoo=Yahoo蜘蛛

  360Spider=360Spider蜘蛛

  123.125.68.=123.125.68沙盒

  220.181.68.=220.181.68沙盒

  220.181.7.=220.181.7预备抓取

  123.125.66.=123.125.66预备抓取

  121.14.89.=121.14.89新站考察

  203.208.60.=203.208.60网站异常

  210.72.225.=210.72.225巡逻

  123.125.71.106=123.125.71.106低权重

  123.125.71.95=123.125.71.95低权重

  123.125.71.97=123.125.71.97低权重

  123.125.71.117=123.125.71.117低权重

  123.125.71.=123.125.71低权重汇总

  220.181.108.95=220.181.108.95隔日快照

  220.181.108.92=220.181.108.92权重抓取

  220.181.108.91=220.181.108.91综合权重

  220.181.108.75=220.181.108.75内页权重

  220.181.108.86=220.181.108.86权重首页

  220.181.108.89=220.181.108.89权重首页

  220.181.108.94=220.181.108.94权重首页

  220.181.108.97=220.181.108.97权重首页

  220.181.108.80=220.181.108.80权重首页

  220.181.108.77=220.181.108.77权重首页

  220.181.108.83=220.181.108.83权重首页

  220.181.108.=220.181.108权重蜘蛛汇总

  我们就其中一条分析

  123.125.68.45 - - [24/Jun/2014 15:12:04 +0800] 'GET /xingyexinwen/129.html HTTP/1.1' 200 9107 '-' 'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.12) Gecko/20101026 Firefox/3.6.12 QQDownload/1.7'

  根据上面的定义分析:

  123.125.68.45 - - [24/Jun/2014 15:12:04 +0800] 'GET /xingyexinwen/129.html这句话代表的意思是谷歌蜘蛛在3721.html">2014年6月24号,15:12:04来我的网站抓取了xingyexinwen/129.html 这么一条URL,然后将其放到沙盒中(123.125.68.45 代表沙盒蜘蛛。)

  HTTP/1.1' 200 9107 '-' 'Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.12) '至于这个,其中的200是返回码,代表是正常,当然返回码还有301、404、302、304等等一些,可以去查一下代表的意思。其他代表是它访问电脑的属性,swindows操作系统等等。

  不知道看了这些,你晕了没有,当然我们一般习惯用exec表格去分析日志,将txt文件导入表格中,能够帮助我们更直观的去分析日志,知道蜘蛛在我们网站上抓取了哪些内容,然后将内容定义为什么。当然还可以利用日志分析软件来分析。

  关于更多,也可以搜索MOON虫博客www.croelhui.com,需要我介绍什么,欢迎大家给我留言。

时间: 2024-10-05 19:30:57

谈谈怎么利用服务器日志来分析我们页面为什么不被收录的相关文章

谈谈如何利用校内网日志进行网站推广

校内网刚建立的时候一个最重要的特点是限制具有特定大学IP地址或者大学电子邮箱的用户注册,这样就保证了注册用户绝大多数都是在校大学生.用户注册之后可以粘贴自己的照片,撰写日志,签写留言等.该网站鼓励大学生用户实名注册,上传真实照片,让大学生在网络上体验到现实生活的乐趣. 经过将近三年的快速发展校内网已经发展成为为整个中国互联网用户提供服务的SNS社交网站,给不同身份的人提供了一个全方位的互动交流平台,大大提高了用户之间的交流效率降低了维护用户之间交流的成本,通过提供发布日志.保存相册.音乐视频等站

一起谈.NET技术,服务器日志法网站分析的原理及优缺点

     [前言] 应朋友们的要求,我还是写一篇关于服务器日志法进行网站分析的原理以及它的优缺点是什么.请朋友们注意,网站服务器日志法并不容易进行,初学者,以及在绝大多数情况下,进行以用户行为分析为核心的网站分析,用不到服务器日志法.不过,作为网站分析历史不可分割的一部分以及重要的基础篇章,服务器日志法仍然值得一书.下面的这篇文章也是我要撰写的书中截取的内容(我要快马加鞭快快写了,已经辜负了太多朋友的重托,抱歉抱歉!).      [正文] 网站分析收集数据的方式其实有五.六种之多,我们最常见的

服务器日志法网站分析的原理及优缺点

[前言] 应朋友们的要求,我还是写一篇关于服务器日志法进行网站分析的原理以及它的优缺点是什么.请朋友们注意,网站服务器日志法并不容易进行,初学者,以及在绝大多数情况下,进行以用户行为分析为核心的网站分析,用不到服务器日志法.不过,作为网站分析历史不可分割的一部分以及重要的基础篇章,服务器日志法仍然值得一书.下面的这篇文章也是我要撰写的书中截取的内容(我要快马加鞭快快写了,已经辜负了太多朋友的重托,抱歉抱歉!). [正文] 网站分析收集数据的方式其实有五.六种之多,我们最常见的有三种,分别是:服务

基于服务器日志的可视化分析工具

在进行互联网用户浏览行为的定量研究中,阿里巴巴中国站用户研究小组开发了一个基于服务器日志的可视化分析工具(视频). 在进行互联网用户浏览行为的定量研究中,阿里巴巴中国站用户研究小组开发了一个基于服务器日志的可视化分析工具(视频). User Behavior Visualization Analyzer from oldj on Vimeo. 这个分析工具可以通过用户产生的服务器日志数据自动还原出网站结构,并按照页面流量阈值绘制站点地图,并将关键的页面流量数据及其他商业指标进行可视化处理,标注在

实例解析如何分析服务器日志

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 网站服务器日志分析对于一个网站具有比较重要的作用,通过分析该日志,我们可以知道搜索引擎爬行记录,这有利于我们针对搜索引擎的习惯进行交换.那么,今天我们便以SEO教程网为例,告诉大家怎么来分析网站日志吧: 1,我们到哪去找服务器日志? 一般我们使用的虚拟机都会有服务器日志,大都在logs文件夹下,如果你的空间没有,那么请联系你的空间服务商,他会

分析服务器日志救了我二个站

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 大家好,我是多喝了二两,这是第二次在站长网写东西,我知道自己的写作水平很丑,不能跟人家比,道理一套一套的,好了,废话少说. 如果看过我的<分析服务器日志及时防止被K>(地址:http://www.admin5.com/article/20080503/82818.shtml),可能会对我的二个网站有些熟悉,被百度K成了一个首页,那

分析服务器日志及时防止被K

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 今天酒喝多了,申明下,虽然在互联网混了近十年,但对做网站还是个菜鸟,老是潜水,今天憋不住了,很忧闷,有一个站(http://www.zhuoyueshudian.com)被k成几页了,今天给它动了大手术,就是全面改版啦,有些人会说,这对seo不利,嘿嘿!利与不利又有谁说得清呢!我一个月前的也一个站也碰到这个问题,被k成一个首页了,有些人看到这

Web 服务器日志工具点评

查看记录文件是很乏味的.记录文件令人厌恶,包含了太多的信息,经常使人非常头疼.幸运的是,这些枯燥的工作有代劳者,利用一些日志分析工具,不仅可以利用日志信息进行调试而且可以提供更多的内容.利用它们可以制作出有意义的各种报告.有很多用来分析服务器日志的工具.本文将重点介绍这些工具的和它们的发展方向. 在评估这些软件包之前,先确定你希望用它们来分析的日志类型.虽然大多数日志分析软件不仅仅支持Web服务器日志,但是,本文仅讨论web服务器的日志记录.记录分析软件能够显示从连接到服务器的IP地址到以饼图表

FortiAnalyzer集中日志和分析技术详解

对攻击的日志.报表.告警和内容归档 信息就是力量 随着对Web应用和多媒体信息.VOIP和VOD这类新服务的需求增长,企业的网络变得越来越庞大,越来越复杂.因此,部署和监控http://www.aliyun.com/zixun/aggregation/34129.html">安全策略,识别和阻断新型的混合攻击,遵守国家条例等等,都需要强大的日志和报表功能.实时地查看和记录网络流量.安全信息,对于发现和解决网络漏洞来说是非常重要的.网络事件.使用率和内容信息等日志对于进行预测分析和作为符合国