php记录搜索引擎蜘蛛抓取页面代码

php教程记录搜索引擎教程蜘蛛抓取页面代码
error_reporting(E_ALL & ~E_NOTICE);

$tlc_thispage = addslashes($_SERVER['HTTP_REFERER'].$_SERVER['PHP_SELF']);/*($_SERVER ['HTTP_HOST'].$_SERVER['PHP_SELF']);($_SERVER['HTTP_USER_AGENT']);*/
//添加蜘蛛的抓取记录
$searchbot = get_naps教程_bot();
if ($searchbot) {
@mysql教程_connect('localhost','root') or die('不能链接数据库教程'.mysql_error());
@mysql_select_db('spider') or die('不能选择数据库'.mysql_error());

mysql_query("UPDATE bot SET botcount=botcount+1, botlast=NOW(), botlasturl='$tlc_thispage' WHERE botname='$searchbot'");
}
mysql_close();

function get_naps_bot()
{
        $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);

        if (strpos($useragent, 'googlebot') !== false){
                return 'Googlebot';
        }

        if (strpos($useragent, 'msnbot') !== false){
                return 'MSNbot';
        }

        if (strpos($useragent, 'slurp') !== false){
                return 'Yahoobot';
        }

        if (strpos($useragent, 'baiduspider') !== false){
                return 'Baiduspider';
        }

        if (strpos($useragent, 'sohu-search') !== false){
                return 'Sohubot';
        }

        if (strpos($useragent, 'lycos') !== false){
                return 'Lycos';
        }

        if (strpos($useragent, 'robozilla') !== false){
                return 'Robozilla';
        }
if(strpos($useragent,'msie 6.0')!==false){　　//这条是我自己测试用的（我的浏览器就是ie6.0）
    return 'MSIE 6.0';
}
        return false;
}

?>

</body>
</html>

时间： 2024-10-28 00:20:57

php记录搜索引擎蜘蛛抓取页面代码的相关文章

页面被蜘蛛抓取后将被如何建立索引？

搜索引擎的数据库,是一个庞大复杂的索引数据库.你想知道你的网站页面被蜘蛛抓取后,会被怎样索引,搜索引擎为你的这个页面建立什么样的页面文件吗? 请你细细阅读: 1首先,你的页面是"新"的,也就是原创与伪原创. 2搜索引擎蜘蛛抓取了您的网站后,读取页面编码,作者,创建时间等属性信息. 3抓取网站内容信息,及我们常用的搜索引擎抓取模拟工具得出来的文字内容. 不知道这里能不能贴那么多抓取信息,这里就不给出来,大家可以到http://tool.chinaz.com/Tools/Robot.asp

蜘蛛抓取网页过程的四步曲

随着搜索引擎的不断发展与升级,搜索引擎所派出的蜘蛛也变得越来越智能了,所以为了要弄清楚蜘蛛的工作原理,为了更好的优化自己的网站我们就必须不断的去研究蜘蛛.下面,我就和大家简单的聊聊蜘蛛的基本工作原理吧: 蜘蛛工作的第一步:爬行你网站的网页,寻找合适的资源. 蜘蛛它有一个特性,那就是他的运动轨迹通常都是围绕着蜘蛛丝而走的,而我们之所以将搜索引擎的机器人命名为蜘蛛其实就是因为这个特性.当蜘蛛来到你的网站之后,它就会顺着你网站中的链接(蜘蛛丝)不断的进行爬行,因此如何让蜘蛛能够更好的在你的网站中进行爬

php记录搜索引擎蜘蛛爬行记录代码

php教程记录搜索引擎蜘蛛爬行记录代码 <center> <form action="setup.php" method="post"> <table align="center"> <tr> <td>服务器:</td><td><input value="localhost" name="server" />&l

php抓取页面与代码解析推荐_php技巧

得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来.下面先简单说一下本文的主要内容: 一. PHP抓取页面的主要方法: 1. file()函数 2. file_get_contents()函数 3. fopen()->fread()->fclose()模式 4.curl方式 5. fsockopen()函数 socket模式 6. 使用插件(如:http://sourceforge.net/projects/snoopy/) 二.PHP解析html或x

asp抓取页面的代码

<% if trim(request.form("url"))<>"" then dim VBody:VBody=GetResStr(trim(request.form("url"))) dim Res:Res=VBody dim code:code=GetCode(VBody,"charset= {0,}([^ ]+) {0,}""") end if

WordPress博客如何记录搜索引擎蜘蛛爬行痕迹

WordPress博客记录seo/seo.html" target="_blank">搜索引擎蜘蛛爬行痕迹插件: 1.搜索引擎蜘蛛爬行记录器Spider Tracker插件可以记录百度.谷歌.雅虎.必应.搜狗.搜搜6种搜索引擎的蜘蛛爬行痕迹,并生成统计图表,可以清晰的看到,近6日的各种搜索引擎的蜘蛛数量,以及当日的哪些时间,蜘蛛来过站里,又抓取了哪些网址. 2.wp-log-robots 插件大小仅3KB,wp-log-robots是一个记录搜索引擎蜘蛛爬虫活动记录的W

PHP记录搜索引擎蜘蛛访问网站足迹的方法_php技巧

本文实例讲述了PHP记录搜索引擎蜘蛛访问网站足迹的方法.分享给大家供大家参考.具体分析如下: 搜索引擎的蜘蛛访问网站是通过远程抓取页面来进行的,我们不能使用JS代码来取得蜘蛛的Agent信息,但是我们可以通过image标签,这样我们就可以得到蜘蛛的agent资料了,通过对agent资料的分析,就可以确定蜘蛛的种类.性别等因素,我们在通过数据库或者文本来记录就可以进行统计了. 数据库结构: 以下为引用的内容: # # 表的结构 `naps_stats_bot` # CREATE TABLE `na

分享如何通过robot灵活控制蜘蛛抓取

做SEO没有人不知道蜘蛛吧,robot.txt文件就是和蜘蛛交流的文件,很多人都会说介绍要怎么让蜘蛛来爬行,却很少人知道用robot.txt去操控蜘蛛,robot.txt用得好的话蜘蛛可以为你所用.下面我来介绍一下如何操控蜘蛛. 一. 屏蔽相同页面搜索引擎是个喜新厌旧的东西,不会去收录重复的也或者已有的页面,即使收录了后期也会被删掉,所以一开始我们可以打开robots文件,写入禁止蜘蛛来读取这个页面的代码,给蜘蛛来下个好印象,反之印象分会大大减分,影响将来蜘蛛来爬行网站. 二.维护网站安全利

卢松松：搜索引擎如何抓取你的网页

搜索引擎优化(SEO)是搜索引擎有好的收录网页的过程,适当的SEO有利于蜘蛛爬行你的网站,使你的内容符合搜索引擎算法,以便确认它与关键词高度相关. 优化的目的就是使网页的内容便于蜘蛛理解,下面我就以百度新收录的一篇内容来进行说明,我以一个完整标题进行搜索,其目的是能反映出更多关键词在百度自然搜索的结果页面,能更好的说明搜索引擎是如何抓取你的网页的. (图一:百度最常见的自然搜索结果列表) SEOer通常关注的是网页主体部分的自然搜索结果,百度和Google搜索结果页面大致相同,搜索结果页面通

猜你喜欢

好压压缩软件需要注意的使用细节

熟悉好压的朋友应该都对这款软件不陌生吧,它是一款小巧实用的国产免费压缩软件,不管从用户界面.软件功能或者是实用工具方便,都不输给任何一款国外压缩软件. 您可别小看了解压缩软件哦,它已经成了我们的装机必 ...

jQuery Mobile教程:dialog组件close的api

文章简介:本文主要看一下jQuery Mobile体系中的dialog组件. 本文主要看一下jQuery Mobile体系中的dialog组件: 它开放了一个close的api 1.如何关闭dialo ...

FileExists 方法

如果指定文件存在返回 True ;否则返回 False . object.FileExists(filespec) 参数 object 必选项. 应为 FileSystemObject 的名称. ...

Flash中卡通人物的急速跑步的制作

卡通人物的急速跑步人物背面侧跑

IBM iNotes 9企业协作新功能:与IBM connections Files和IBM Docs的整合

与 IBM Connections Files 和 IBM Docs 整合是 iNotes9.0 中提供的一个闪亮新特性.IBM Connections Files 是一个企业级信息共享,团队协作的平 ...

dySE：一个Java搜索引擎的实现，第1部分

自己动手写一个搜索引擎,想想这有多 cool:在界面上输入关键词,点击搜索,得到自己想要的结果:那么它还可以做什么呢?也许是自己的网站需要一个站内搜索功能,抑或是对于硬盘中文档的搜索 -- 最重要 ...

PS照片局部提亮技巧、方法介绍

这篇教程像三联网的朋友们介绍PS照片局部提亮技巧和方法,教程很简单,适合刚刚接触PS照片处理的朋友学习,同时也适合运用到我们开网店的朋友在处理偏暗的模特照片,好了一起来看看效果对比图先: 1.这是原图 ...

Excel打开csv格式文件并生成图形功能实现方案

在UNIX/LINUX服务器端生成了csv格式文件之后,有时需要根据csv文件的数据画图.这时可以把csv格式文件传输到windows端,然后再用Excel来处理. 直接用Excel打开时,所有数据都 ...

php判断数组元素中是否存在某个字符串的方法

方法一:采用in_array(value,array,type) type 可选.如果设置该参数为 true,则检查搜索的数据与数组的值的类型是否相同. .代码如下: $arr = array(' ...

Windows8值得做的十多项简单优化

根据我们之前的测试来看,Windows8 的性能和速度确实要比 Win7 要强些 (参考性能对比评测1.评测2),实际使用过的同学可能都已体会到了.不过谁会嫌自己的电脑太快呢?只要你的硬件不是特别 ...

利用驱动人生解决扫描仪驱动无法安装的问题

在我们的生活中,使用到打印机的时候比较多,但如果是在办公中,那么扫描仪也是比较常见的,通常情况下我们会使用扫描仪对证件或相关文件扫面成图片,不过有部分用户反映在链接扫面议后,出现驱动安装失败的问题 ...

Beyond Compare 4文本比较搜索功能使用方法

打开Beyond Compare软件,选择文本比较会话,打开会话操作界面,单击"浏览文件"按钮,选择需要比较的文本文件.单击工具栏"搜索"按钮,在展开的菜单 ...

java http从同一个服务器多次请求不同文件时，能否重用同一条连接？

问题描述 java中一般建立http连接是这样的:url=newURL("http://localhost:8080/aaa");httpURLConn=(HttpURLConne ...

ASP.NET笔记之图库权限设置的方法_实用技巧

1.通过一个实例来介绍图库权限,其中涉及到数据库的应用,在visual studio 2010 连接到数据库中创建数据集及数据表可能会出现无法远程连接的错误,具体ide解决方案可以参考 SQL ...

wsdl的自定义修改

问题描述在C++中,typedefshortsimple,那么在wsdl中如何描述了?用MyEclipse的xfire开发webservice,那么java代码中如何实现typedef这种语法,使自 ...

双网卡绑定

原文转自:http://hi.baidu.com/xsy86110/item/7d03c4d8e4529918d78ed0b5 为什么要用双网卡呢?用双网卡有什么好处?所谓双网卡,就是通过软件将双网卡 ...

python的unicode处理关系

本文主要参考网上文章 Python Unicode Objects之前在编码上绕过些弯路,经常碰到illegal ASCII character一类的问题,就在这儿用图捋一下.unicode编码与其他 ...

jq-JQ特效在IE9以下无法接受

问题描述 JQ特效在IE9以下无法接受我写了个特效在IE9一下接收不到请问一下有什么方法可以判断那段代码在IE里面能接受的到呀! function initHoverApply() { $(&qu ...

reveal.js实现html播放ppt的炫酷效果

演示地址: http://meiyouwumai.github.io/reveal/ <!doctype html> <html lang="en"> &l ...

向memcache中写入时有必要lock吗？

问题描述没有这方面经验老大让写个缓存操作类说最好写的时候加上lock对吗这种观点解决方案解决方案二:除非你能百分百保证不对统一内存发生写入冲突,或数据破坏,否则还是加锁解决方案三:引用1楼bdm ...

使用Lucene.Net实现全文检索

原文:使用Lucene.Net实现全文检索目录一 Lucene.Net概述二分词三索引四搜索五实践中的问题一 Lucene.Net概述 Lucene.Net是一个C#开发的开 ...

ios 视频边下载边播放

问题描述 ios 视频边下载边播放现有的思路是这样的: 1. 在本地搭建一个http服务器 2. 开始下载.mp4文件,然后把文件存放在http服务器中 3. 将video播放地址指向本地服务器,开 ...

备案其实不难难的是你要用心填写

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅现在很多人说备案怎么样难,我要说的 ...

MySQL 5.7 新时代

内容来源:2017年2月26日,叶金荣在"OSC源创会福州站"进行<MySQL 5.7新时代>演讲分享.IT大咖说作为独家视频合作方,经主办方和讲者审阅授权发布. 阅读 ...

java新手求解关于大量数据的循环问题

问题描述现在又20W+的数据要通过循环,要怎么样对这些数据进行分批循环???也就是先循环这些数据的前1000条,之后再循环后1000条,如此下去~~ 问题补充:就是从excel中读取20W+的邮件地 ...

类的实例化-A_const m= new A_const();

问题描述 A_const m= new A_const(); A_const m= new A_const();是什么意思,具体说明一下,谢谢!A_const m= new A_const();是什么 ...

mysql-mmm高可用架构

原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任.http://navyaijm.blog.51cto.com/4647068/1230674 一 ...

图文混排怎么实现？

问题描述本帖最后由独孤求败于 2015-2-27 14:50 编辑图文混排怎么实现解决方案自定义的将图片,username以及自己想要显示的其他内容(通过扩展属性message.ext)一 ...

JavaScript判断变量是否为空的自定义函数分享_javascript技巧

JavaScript本身没有判断一个变量是不是空值的函数,因为变量有可能是string,object,number,boolean等类型,类型不同,判断方法也不同.所以在文章中写了一个函数,用以判断J ...

javascript屏蔽右键代码_javascript技巧

javascript屏蔽右键复制代码代码如下: <span style="font-size:18px;color:#ff0000;"><strong> ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.031 s.