最新详细的百度蜘蛛爬行检测代码诠释

　　最近在网上看了篇有关百度蜘蛛的爬行代码的解释，发现和现在的爬行有些改变，已至于开始时看我的小游戏站www.zz.la这个站的日志看不懂

　　是什么意思，经过多次研究终于明白其中，所以今重新整理解释如下：

　　做seo的朋友都知道，研究se爬行规律对于网站优化意义重大，特别是对百度蜘蛛Baiduspider的研究。本文解释一下百度蜘蛛爬行后返回代码

　　代表的具体含义：

　　2xx 成功

　　200 正常;请求已完成。

　　201 正常;紧接 POST 命令。

　　202 正常;已接受用于处理，但处理尚未完成。

　　203 正常;部分信息 — 返回的信息只是一部分。

　　204 正常;无响应 — 已接收请求，但不存在要回送的信息。

　　3xx 重定向

　　301 已移动— 请求的数据具有新的位置且更改是永久的。

　　302 已找到 — 请求的数据临时具有不同 URI。

　　303 请参阅其它 — 可在另一 URI 下找到对请求的响应，且应使用 GET 方法检索此响应。

　　304 未修改 — 未按预期修改文档。

　　305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

　　306 未使用 — 不再使用;保留此代码以便将来使用。

　　4xx 客户机中出现的错误

　　400 错误请求 — 请求中有语法问题，或不能满足请求。

　　401 未授权 — 未授权客户机访问数据。

　　402 需要付款 — 表示计费系统已有效。

　　403 禁止 — 即使有授权也不需要访问。

　　404 找不到 — 服务器找不到给定的资源;文档不存在。

　　407 代理认证请求 — 客户机首先必须使用代理认证自身。

　　410 请求的网页不存在(永久);

　　415 介质类型不受支持 — 服务器拒绝服务请求，因为不支持请求实体的格式。

　　5xx 服务器中出现的错误

　　500 内部错误 — 因为意外情况，服务器不能完成请求。

　　501 未执行 — 服务器不支持请求的工具。

　　502 错误网关 — 服务器接收到来自上游服务器的无效响应。

　　503 无法获得服务 — 由于临时过载或维护，服务器无法处理请求。

　　比如说：

　　2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /log/ - 80 - 221.10.254.26 Baiduspider+

　　(+http://www.baidu.com/search/spider.htm) 200 0 0 21089

　　如果你的网址是www.zz.la这就意味着百度蜘蛛在2008-05-10 00:28:03 爬过http://www.zz.la/log/ 这一页，200 0 0 21089中的200协议代码

　　代表了请求已完成也就是它发现这页并以入库了。根据这个我们可以多查看iis日志，研究蜘蛛爬行的路径，找出自己网站存在的问题，进而改正。

时间： 2024-09-18 04:41:31

PHP写的获取各搜索蜘蛛爬行记录代码_php技巧

那么下面分享一款用php写的获取各搜索蜘蛛爬行记录代码支持搜索引擎如下可以记录Baidu,Google,Bing,Yahoo,Soso,Sogou,Yodao爬行网站的记录! php代码如下复制代码代码如下: <?php function get_naps_bot() { $useragent = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($useragent, 'googlebot') !== false){ return

php记录搜索引擎蜘蛛爬行记录代码

php教程记录搜索引擎蜘蛛爬行记录代码 <center> <form action="setup.php" method="post"> <table align="center"> <tr> <td>服务器:</td><td><input value="localhost" name="server" />&l

略析百度蜘蛛爬行

这几天一直在搞网站和产品推广,不懂的东西很多很多,但推广的那些事中,很多名词都非常的吸引我.首先是SEO,了解SEO的过程中,碰到了"外部链接",学习外部链接的时候又偶遇"蜘蛛爬行",一下子接收了那么多信息,感觉相当神奇,SEO的事也的确不简单. 而今天想跟大家谈谈"蜘蛛爬行"这个词.我相信我不是第一个提到它的,因为我是后来者,但我希望我的描述能让更多的人了解这个词,毕竟,很多专业的介绍都相当专业,正因为太专业,而让人觉得无法理解. 首先,介绍一

百度蜘蛛爬行IIS返回200 0 64终极合理解释

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅做网站之初就在A5论坛发现有人说关于蜘蛛爬行IIS返回200 0 64信息的相关文章,当时对这个根本不懂,所以没有去具体了解,直到08年底我才开对这个64有点想直到的欲望,所以也在网上找了不少这方面的文章来看,自己也一直分析其中的奥妙,截止11年6月22日凌晨4点左右,终于有了自己的结论,下面和大家分享: 首先分析一下网络上的一些说法: 1.

通过IP地址看网站日志寻找百度蜘蛛爬行规律

对于各位站长来说,百度的收录是关心的重中之重.了解百度蜘蛛的爬行规律从而更好的改善收录情况也是必须要掌握的.很多网站目前使用的都是虚拟空间,都能够提供日志. 日志是指在网站根目录下的logfiles文件夹里面日期.txt文本文件有很多介绍通过http查看返回命令的那种办法来查看蜘蛛,这里就不介绍了. 现在更多的网站是没有提供可以通过软件来查看的日志格式. 更多的是类似下面的日志格式,如下: 03:28:34 GET /goods.php 202.108.7.205 200 34696 390 第

通过网站日志来寻找百度蜘蛛爬行规律

中介交易 SEO诊断淘宝客云主机技术大厅对于各位站长来说,百度的收录是关心的重中之重,因为网站大部分流量都来自百度. 因此,了解百度蜘蛛的爬行规律从而更好的改善收录情况也是必须要掌握的. 很多网站目前使用的都是虚拟空间,都能够提供日志.从虚拟主机后台登录,点击下载访问日志. 日志是指在网站根目录下的logfiles或W3SVC文件夹里面日期.txt文本文件更多的是类似我的网站建站学习网www.3915.net的日志格式,如下: 开始几行: #Software: Microsoft Lo

百度蜘蛛解决内页收录难的问题

摘要: 网站内页收录也是衡量一个网站优化是不是达到合格水平的重要指标,如果一个网站的内页收录情况不理想,那么即使其主页排名到达了首页,流量也是寥寥无几的.但是收录内页的难网站内页收录也是衡量一个网站优化是不是达到合格水平的重要指标,如果一个网站的内页收录情况不理想,那么即使其主页排名到达了首页,流量也是寥寥无几的.但是收录内页的难度往往要比收录首页高很多,如果网站的细节做得不够好,网站的内页收录是非常艰难的. 当各位seoer还在苦恼你的网站内页为什么那么难收录的时候,可曾想到过,我们的收录的

从IIS日志分析蜘蛛爬行时间打造秒收网站及时保护原创内容

经常有站长抱怨高权重网站采集了自己辛辛苦苦的原创内容,导致自己的原创变成其他网站的了,今天我通过实例和大家分享如何解决这个问题. 大家可以想象一下现实生活中知识产权的认定,最简单的情况,如果A在杂志上发表了一篇原创文章,B看到后不加改变的抄袭并发表到其他杂志,A要起诉B者,法院很容易根据作品发表时间来判断B抄袭了A,因为A发表作品在先(如果B经过修改等二次加工手段再发表,那就要依据法院的鉴别和双方的证据了),回到网络世界,特别是回到由百度制定规则来判别谁是原创的体系中,假定百度已判定发表于两个不

WordPress博客如何记录搜索引擎蜘蛛爬行痕迹

WordPress博客记录seo/seo.html" target="_blank">搜索引擎蜘蛛爬行痕迹插件: 1.搜索引擎蜘蛛爬行记录器Spider Tracker插件可以记录百度.谷歌.雅虎.必应.搜狗.搜搜6种搜索引擎的蜘蛛爬行痕迹,并生成统计图表,可以清晰的看到,近6日的各种搜索引擎的蜘蛛数量,以及当日的哪些时间,蜘蛛来过站里,又抓取了哪些网址. 2.wp-log-robots 插件大小仅3KB,wp-log-robots是一个记录搜索引擎蜘蛛爬虫活动记录的W

猜你喜欢

Win7提示“英特尔(R)快速存储技术未在运行”怎么办

故障现象: 英特尔(R)RST 服务是英特尔快速存储服务,即 intel rapidst,该程序为配备 SATA 磁盘的台式机.移动电脑和服务器平台系统提供更高的性能和可靠性.当使用一个或多个 ...

基于ASP.NET AJAX技术开发在线RSS阅读器（上篇）

[注]本文测试环境:Windows XP专业版+Visual Studio 2005+整套ASP.NET AJAX框架+ASP.NET RSS Toolkit+SQL Server 2005. 一.R ...

CSS实现完美垂直居中

css 之前看到很多人一直都问这个问题,不过当时我没当一回事,因为在 CSS 中要垂直居中,多数是在有高度的情况下,或者容器高度不定的情况下才用,看上去比较舒服,而且实现的方法也不少,不一定要拘泥于和 ...

PS打造一个逼真的红色陶罐

从效果图看上去,陶罐的受光面有很多.一时之间好像是无从下手.不过仔细观察,就可以发现.其实陶罐由两个大的区块组成,瓶口及主体部分.思路清晰了制作就非常简单. 从效果图看上去,陶罐的受光面有很多.一时之 ...

C#以动画方式显示图像

PPT 以动画方式显示幻灯片是其一个很重要的特点,相信里边一定有您喜欢的动画方式,今天我就带大家认识几款以动画方式显示幻灯片的制作方法,由于是GDI+编程, 这里以图像代替幻灯片(其实原理是相通的)来 ...

[JAVA100例]022、分割一个面板

import java.awt.*; import java.awt.event.*; import javax.swing.*; import javax.swing.event.*; import ...

Fireworks制作一个水晶羽毛笔图标

效果图: 路径制作这么一个图形,然后拉渐变复制一个在上面,稍微偏移些,如图拉渐变加滤镜加高光:也是复制一份,用'刀'切割一半制作笔: 制作出笔尖与笔杆中间的骨线复制一个,用"刀&q ...

jQuery图片特效插件Revealing实现拉伸放大

本文给大家分享的是jQuery图片展示效果,使用的是jQuery Revealing插件,不点击的情况下,图片整齐排列成一行,当任意一个图片缩略图被点击的时候,该图片就放大显示,当点击关闭按钮时图 ...

Word2007中SmartArt图形颜色的修改

在平时我们编辑Word文档的时候,常常会使用颜色来重点突出,而图形也是一样的.在Word2007文档中SmartArt图形的整体颜色设置,我们可以利用Word2007中的颜色色板来进行着色.具体方 ...

JS实现仿百度输入框自动匹配功能的示例代码介绍

本篇文章主要是对JS实现仿百度输入框自动匹配功能的示例代码进行了介绍,需要的朋友可以过来参考下,希望对大家有所帮助现在很多网站都有这种效果,在文本框输入一个字符,下边会出来相匹配的内容,这个代码就 ...

兼顾视觉和速度网页字体设计奇幻之旅

(Shavaughn Haack著 Timmliu & Charrywang译 Sevenshao校正查看原文转载请注明出处) 第一印象通常就是一种持续印象.不管你是否意识到,你的版式能够 ...

内存条怎么正确安装到电脑主机上

内存条怎么正确安装到电脑主机上打开机箱,可以看见内存插槽,视主板不同也不一样,有的4个,两两同色,有的就两个,就这样插上去就可以的,一定要用力插紧,不然会开不了机,方向错了是插 ...

音速浏览器怎么样？

音速浏览器怎么样呢?功能有哪些呢?音速浏览器采用全新架构,双进程,低资源完美融入异步防假死模式,真正解决了浏览器崩溃和卡的问题;具体音速浏览器怎么样,我们一起来看看. 音速浏览器怎么样: 1.小巧 ...

路由器的设置网址是多少

说到路由器的设置网址也就是路由器的登陆网址,但是但是路由器的品牌种类很多,所有不同品牌的路由器登录网址是不一样的,就你目前销量最好市场占有率最高的TP-LINK(D-LINK)来说,它的登陆地址192 ...

使用maven镜像

综述用maven做项目,最郁闷的莫过于某些依赖库下载不了.被墙了,你懂的.使用maven镜像仓库及其重要,特别是国内的镜像,可以有效缓解被墙疼痛. 常用的镜像国外镜像 ibiblio.org &l ...

android-Android-转换日期到int

问题描述 Android-转换日期到int 日期: 02/06/2013 22:34 像转换成日期为int. 类似这样:23123123 (数值是int或者long类型) 谢谢解决方案 Simple ...

[Unity]AssetBundle资源更新以及多线程下载

前言此文章适合不太了解资源加载的萌新,有了入门基础之后再去github上搜大牛写的专业的资源加载方案才能得心应手,不然的话会看的很吃力或者说一脸懵逼.Unity里面关于资源加载我们都知道是下载更新A ...

用java写一个文件夹浏览器

问题描述如何用java编写一个文件夹浏览器解决方案解决方案二:楼主好,我是今年毕业参加工作的,刚进公司的时候,就用java实现了一个文件浏览器,我这还有源码呢.java写文件浏览器可以使用swi ...

Atlassian Confluence 4.2发布企业知识管理与协同软件

Confluence 是一款实现技术团队之间协作的企业知识管理软件,即是一个专业的维基百科.其功能包括:知识管理(创建.更新和分享知识,发表观点).文件管理.规格设置.实体模型.图表和项目管理.是一个 ...

陌陌币怎么充值?陌陌币可以干什么?

陌陌币有什么用? 陌陌币主要是用于"尊贵的VIP会员"等级,还有各种搞怪卖萌的表情.其他还包括专属会员标识.个性化资料页面.聊天信息同步等.后来陌陌游戏平台上线,自然的就又成为了游 ...

Linux基础命令：搜索文件

我们先来学习一下如何搜索文件,特别是刚开始学习Linux的时候,自己建立的文件不知道放在哪里了,常有发生.如果知道文件名,却不知道文件在那个目录下面了,我们就可以使用locate命令来搜索文件.看如下 ...

请问,Java用何种技术架构编写服务端，能让VB客户端访问？

问题描述各位大哥大姐,小弟菜鸟一只,只会点JAVA和VB.今日心血来潮,想向各位请教个问题.Java用何种技术架构编写服务端,能让VB客户端高效安全的访问?Webservice,COM+,CORBA ...

sql 语句中where 1=1 1=2作用

写一个1=1是为了后面的条件.这个SQL应该是在程序中拼出来的,程序中首先不能肯定后面的条件是否肯定会有,为了程序简单先加上where 1=1,后面的就可以直接拼接.如果不这样处理就需要在拼接后面的每 ...

【高考40周年】机器人数学考了134分，要上清华北大NLP是最大难关

2017年6月7日,高考恢复后的第40届高考如期而至.40年前,人们为新时代的开启欢呼雀跃.40年后,从高考走出的一代又一代学子正在不断探索科技的新前线--在人工智能领域,科学家们正在努力让机器通过& ...

大数据技术奖成为数十亿美元的全球机会

根据国外的媒体报道显示,市场研究公司IDC最新发布的一次研究报告称,大数据技术和服务市场从目前到2017年的复合年增长率预计将达到27%,增长速度是整个信息和通讯技术市场增长速度的6倍,到2017年的 ...

如何把网站数据库考到其它文件夹里？

问题描述我在本地做了一个asp.net的网站,数据库是SQL2005做的,我想把整个网站连同数据库考到U盘上,可是,我创建的网站数据库怎么考进来啊,我以前在网上下载过其它的asp.net网站,然后把 ...

关于SEO的研究和坚持的道路

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅针对网站优化相对来讲进而不可急,半 ...

http配置后找不到本地文件

问题描述 http配置后找不到本地文件在网页中输入主机IP和文件,可是总说无法找到该文件,查过配置文件确定document root的路径是文件所在路径文件及目录权限也也是root且都有可读可执行 ...

ie6 文字溢出bug(注释bug) 双倍边距(margin)的bug 宽度100%问题解决方法

1.在以下情况下将会引起文字溢出bug 一个容器包含2两个具有"float"样式的子容器. 第二个容器的宽度大于父容器的宽度,或者父容器宽度减去第二个容器宽度的值小于3 在第二个容 ...

客户端消息保存在服务端，后台商家能够查看各自消息记录

问题描述需求是这样:后台有很多商家,每个商家都有自己的聊天群.私人群.点对点聊天:现在需要把客户端中所有的聊天信息保存在服务后台,各个商家查看自己的聊天群.私人群.点对点中的聊天记录解决方案你 ...

热搜

最新详细的百度蜘蛛爬行检测代码诠释

最新详细的百度蜘蛛爬行检测代码诠释的相关文章