搜索引擎的搜索深度

     搜索引擎可以搜索到网站的任何一个级别层次的页面。但在实际搜索过程中,搜索Spider对于通过首页需点击3次及更多次才能进入的页面(三级页面及更深入的页面)不再重视,从而减慢、停止搜索。

     也就是说,如果你的网页在网站的链接结构中深入到第4层,象下面的例子:
yoursite.com/dir1/dir2/dir3/dir4/deep-page.htm
这样的网页,在首页和次级页面都找不到链接,人们只有通过点击三级页面上的链接才能进入浏览,往往就被深埋于网站不为人知。同样,搜索Spider在快速搜索完主要页面后,很少费事去搜索更深入的网页。因此,它们被搜索到的可能性很小。
     但是,如果在首页上增加一个通往该页的链接,虽然从内容结构的角度这一页仍属于第4级的地位,但由于可以直接通过点击首页链接到达,搜索Spider还是可以轻易地找到它。
     有一些例外的情况,让深于4级的页面也容易被搜索到。就是如果有其它网站在它们自己的顶级页面上链接了这一页,其效果就好似你在自己的首页上做了该链接。但是,显然谁都没法掌控别人做这样的链接,因此现实中这是无法操作的。如果你有一个深度页面经常更新,你要确保更新后的页面易于被搜索到。
     最好还是避免网页层次超过4层。
     还有一个方法就是创建网站地图,其中列出所有页面的链接,然后将网站地图链接到首页上(这也合符规范)。这样,所有的页面都可以通过次级页面就搜索到了。

时间: 2024-09-17 04:21:27

搜索引擎的搜索深度的相关文章

感染百万台设备的僵尸网络劫持了搜索引擎的搜索结果页面

据外媒报道, 罗马尼亚安全公司Bitdefender今天透露,一个称为Redirector.Paco 的大规模点击欺诈的僵尸网络已通过本地代理成功"指派"(入侵)百万台设备并劫持了各大搜索引擎的搜索结果页面.这个僵尸网络对这些设备的感染主要通过下载或安装WinRAR. YouTube Downloader. Connectify.KMSPico或Stardock Start8等常用软件来完成. 当用户的设备被感染后, Redirector.Paco将修改计算机的本地注册表,并将加入的两

五个方面浅析搜索引擎如何处理搜索词

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 搜索引擎其实也是WEB2.0的典范,因为需要处理用户输入了数据,所以能很好和用户产生交互.但对于搜索引擎而言,并不会把用户输入的所有词语都直接用于排名,而是首先会经过自己的处理,这次处理之后的词语才能直接用户排名.本文根据自己的总结和大家分享搜索引擎是如何处理我们输入的搜索词.如果不对的地方,也欢迎大家指正. 第一.首先分词:分词是一大特色,

给我30秒教你轻松获得新闻、论坛或搜索引擎的搜索结果

只需要不到30秒时间即可轻松完成一个常规采集项目的精准采集设置.而且不需要你懂网站技术,不需要关心网页源码,不需要你使用正则表达式技术,能够熟练上网的人即可轻松实现. 站长几乎都认识采集软件,但却极少有人认识熊猫采集软件,原因很简单,熊猫是新软件,同你见过的任何采集软件都极不相同!操作异常简单,但功能却非常强大.全面,且不需要专业技术即可轻松操作.是复杂采集需求的必选,也是采集新手的首先. 在熊猫采集软件里面,采集常规的http://www.aliyun.com/zixun/aggregatio

龙俊:活用搜索引擎的搜索指令分析网站

大家好,我是龙俊.很多站长看了我这篇文章的标题,也许会觉得我在小题大做,这些指令都是站长每天都会用的,熟悉得不能在熟悉了,无非就是"site:"和"domain"指令.其实不然,这些高级搜索指令还有更具体的用法,很多站长不知道而已,大部分只知道查询下自己网站被百度收录的所有页面数量,和所有被百度收录页面中含有相关域的数量,仅此而已.今天长沙seo为大家分享下这些高级指令的进一步拓展,让SEOer完全掌握自己和竞争对手的网站,方便做更深入的研究.分析. 一.站长必备之

互联网搜索引擎个性搜索系统

    Google等的巨大成功推动了整个行业的竞争者把搜索技术提升到一个更高的水准,而个性化搜索将是其中最迫切的一次技术变革 2003年2月,Google 收购了全球最大的Blog 服务之一Blogger.com 的提供商Pyra Labs:2003年9月,Google收购了一家制作个性化和上下文关联搜索工具的新兴企业Kaltix:2003年10月,Google收购在线广告网络公司Sprinks:2004年7月,Google宣布收购加州的数字相片管理商Picasa:2004年10月,Googl

识别真假搜索引擎(搜索蜘蛛)方法(baidu,google,Msn,sogou,soso等)

http://www.useragentstring.com/pages/useragentstring.php   今天分析研究了两个网站的 Apache 日志,分析日志虽然很无聊,但却是很有意义的事情,比如跟踪 SPAM 的 User Agent.顺便整理出一些搜索引擎爬虫的 User Agent,在这里分享一下,也欢迎补充. 微软 "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)"msnbot,大多数已经被bingbot替

三大搜索引擎巨头 搜索结果对比体验

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   搜索引擎(search engine)是指根据一定的策略.运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统. 从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表. 互联网发展早期,以雅虎为代表的网站分类目录查询非常流行.网站分类

如何把把搜索引擎中搜索到的结果抓取到数据库中

问题描述 各位老师:请教下怎样才能将搜索引擎搜到的结果抓到一个数据库里保存起来啊.比如,我利用google搜"ASP",怎样才能把搜到的所有相关网页的链接都保存到一个数据库里(比如ACCESS或SQL)能不能给点思路,或者简要的代码,谢谢! 解决方案 解决方案二:google提供的有个webservice.要么你就对抓取到的内容用domdocument进行分析后入库.解决方案三:疯狂≮程序员≯群:3733191软件交流群:9951116解决方案四:可以把你们的作品上传到这个网站上,大家

“飓风木马”暴力劫持搜索引擎 百度搜索变搜狗

近日,大量 网友发帖反映"用百度搜索却自动跳到了搜狗",同时还伴随着浏览器首页被篡改为www.91kk.com或者是123.sogou.com的现象.经安全中心分析,这些网友的电脑受到了一款"飓风木马"的侵害,该木马通常是和一个名为"飓风影音"的播放器捆绑传播.安全专家提醒网民:遇到类似情况,应尽快使用杀毒软件全盘扫描查杀该木马.据安全专家介绍,普通的广告程序只会篡改浏览器首页,对系统不会有太强的破坏作用,然而"飓风木马"却是