破译百度第一讲 百度搜索结果页url参数详解

 

  在百度首页输入任意关键词搜索之后,我们跳转到搜索结果页面,在浏览器的网址栏我们可以看到很长的一串url地址。那么,你真的了解这一串url的含义吗?

  s?:搜索

  百度搜索结果页使用了重定向,因此我们看到的不是search.php?这样的url格式

  wd:当前搜索的关键词

  即输入的关键词的urlencode字符串,编码格式为gbk或者utf-8,默认编码格式为utf-8。用于作为搜索原料,百度还会经过分词、判类等操作,不是直接检索数据库,这个会在后面的破译百度系列当中详细讲解。

  bs:上一次搜索的关键词

  内容格式与当前搜索的关键词一致。用于记录用户的搜索行为,记录该值被用于相关关键词统计、同义词分析等操作。

  rsv_spt:用户浏览器类型

  值为1或者3(暂时只统计到这两个值)。用于标记用户当前使用的浏览器,IE内核浏览器为1,非IE内核为1,不过现在这个参数恒为3,还没有了解到时停用了还是改作他用。

  rsv_bp:判断是第几次搜索

  值为0或者1。当用户第一次搜索时,该参数值为0;当用户在第一次搜索的结果页进行第二次搜索或者更多次数搜索时,该参数值为1。用于记录用户的搜索行为,记录该值被用于校验搜索结果质量以及相关搜索词相关数据分析。

  tn:搜索来源

  该值为网站标记。例如从hao123的百度输入框搜索内容,将出现tn=sitehao123。记录该值被用百度统计搜索来源,该来源数据可能被作为决策数据。

  inputT:键入时间

  从打开百度页面开始到点击搜索按钮的时长。该参数被用于记录用户搜索行为。

  oq:相关搜索的主词

  例如搜索seo是什么,在底部的相关关键词当中有淘宝seo是什么意思,当点击后oq的值就是seo是什么。该参数主要用于相关词统计以及用户搜索行为记录。

  rsp=第n+1次相关搜索

  统计相关搜索的次数,例如是第4次相关搜索,那么rsp的值为3。该参数主要用于相关词统计以及用户搜索行为记录。

  f:搜索行为判断

  8为用户自主搜索,3为下拉框推荐,1为相关搜索。该参数主要用于用户搜索行为记录以及关键词统计。

  pn:页码

  值为公差为10的等差数列。用于页码判断,同时也用于校验搜索结果质量。

  cl:搜索类型

  值为3时是网页搜索,其他的值所对应的类型暂时还没有统计到。该值会影响搜索结果排序。

  lm:指定时间内百度收录情况查询

  值为1时是最近24小时;值为7时是最近7天;值为30时是最近1个月;值为360时是最近1年。

  rn:搜索结果显示条数(Record Number)

  取值范围在10~100条之间,缺省值为10。

  ie:查询输入文字的编码

  此项设置会影响搜索参数wd的编码类型。

  si:在限定的域名中搜索

  主要用于检索某个站点的百度索引数据,例如想要只得到百度的搜索结果,那么参数的值为baidu.com。使这个参数有效必须结合ct参数一起使用。

  ct:此参数的值一般是一串数字

  估计应该是搜索请求的验证码,目的暂时还没有分析出来。

  本文首发于优问网(http://www.excellam.com/view/22450.html),转载请注明版权。

  《破译百度》系列将全程投递与A5站长网,希望各位站长支持,如有错误,请批评指正!

时间: 2024-09-29 14:54:42

破译百度第一讲 百度搜索结果页url参数详解的相关文章

什么是百度权重,门老师为您详解百度权重

什么是百度权重?百度权重是什么?应该是最近一些日子网友讨论比较多的问题.门老师最近看到了两篇关于百度权重的文章,作者把自己的观点通过图文形式详尽的表达了出来.详情请搜索<我们是否应该在意百度权重值?>和<正确认识"百度权重">两篇文章的标题,网络有广泛转载.   爱站查询某站的百度权重结果 SEO的魅力在于我们这些草根和百度这样的互联网巨头斗智斗勇的过程.这个曲折的过程中,因为我们对于SEO的理解不同所承受的结果曲线也不尽相同.说白了,就是每个人对于SEO的理解

Struts2 Result 参数详解_java

一个提交到服务器的处理通常可以分为两个阶段,第一个阶段查询服务器状态(查询或者更新数据库),第二个阶段选择一个合适的结果页面其返回给用户(这里要讲的Result的内容). Struts2提供了对不同种类返回结果的支持,常见的有JSP,FreeMarker,Velocity等. Struts2支持的不同类型的返回结果为: 名字 说明 Chain Result 用来处理Action链 Dispatcher Result 用来转向页面,通常处理JSP FreeMarker Result 处理FreeM

flash js Fusioncharts 参数详解与参考

flash js fusioncharts 参数详解与参考 objects anchors 锚点 用于标识line或area的数值点 支持效果 animation 动画.shadow 阴影.glow 发光.bevel 倾斜.blur 模糊 动画属性 _alpha._x._y._xscale._yscale background 整个图表的背景 支持属性 animation.shadow.glow.bevel.blur 动画属性 _alpha objects anchors 锚点 用于标识line

gcc参数详解

这篇文档是我的关于gcc参数的笔记,我很怀念dos年代我用小本子,纪录所有的dos 命令的参数.哈哈,下面的东西可能也不是很全面,我参考了很多的书,和gcc的帮助.不全的原因是,有可能我还没有看到这个参数, 另一种原因是,我可能还不会用它 不过,我会慢慢的补齐的.哈哈 如果你要转在本文章请保留我email(pianopan@beeship.com)和文章的全面性.  [介绍]  gcc and g++分别是gnu的c & c++编译器 gcc/g++在执行编译工作的时候,总共需要4步  1.预处

虚拟主机/空间参数详解

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 刚接触站长行业的朋友免不了对网站空间的需求.无论你是租用收费的,还是使用免费的.对空间的相关参数有一个大体的认识能让你少走许多弯路. 参数详解: 操作系统:一般为win2003或者Linux.这个是指该空间的服务器所使用的系统,这个一般情况可以不管的,直接看其它的参数是否适合自己使用就行了. 网站空间:指的是该空间的容量,就和自己的电脑硬盘是

JVM的参数详解(转)

堆大小设置JVM 中最大堆大小有三方面限制:相关操作系统的数据模型(32-bt还是64-bit)限制:系统的可用虚拟内存限制:系统的可用物理内存限制.32位系统下,一般限制在1.5G~2G:64为操作系统对内存无限制.我在Windows Server 2003 系统,3.5G物理内存,JDK5.0下测试,最大可设置为1478m.典型设置:java -Xmx3550m -Xms3550m -Xmn2g -Xss128k-Xmx3550m:设置JVM最大可用内存为3550M.-Xms3550m:设置

$.ajax()方法参数详解_AJAX相关

会灵活的运用ajax的方法,非常重要,本文先给大家介绍ajax的几种方法,然后通过实例给大家分析详解,具体内容请看下文吧 1.url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. 2.type: 要求为String类型的参数,请求方式(post或get)默认为get.注意其他http请求方法,例如put和delete也可以使用,但仅部分浏览器支持. 3.timeout: 要求为Number类型的参数,设置请求超时时间(毫秒).此设置将覆盖$.ajaxSetup()方法的全

Jquery中$.ajax()方法参数详解_AJAX相关

俗说好记性不如个烂笔头,下面是jquery中的ajax方法参数详解,这里整理了一些供大家参考.  1.url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. 2.type: 要求为String类型的参数,请求方式(post或get)默认为get.注意其他http请求方法,例如put和delete也可以使用,但仅部分浏览器支持. 3.timeout: 要求为Number类型的参数,设置请求超时时间(毫秒).此设置将覆盖$.ajaxSetup()方法的全局设置. 4.async

Mysql慢查询使用与参数详解

慢查询为系统中查询时间超过long_query_time的值,分析慢查询是优化SQL的基础,默认清下Mysql慢查询为关闭状态,可以通过 show variables where Variable_name = 'log_slow_queries'; 来查看是否开启,如果为OFF则需要修改mysql配置文件,在mysqld下面增加以下参数 #慢查询日志地址,需要mysql运行帐号对该目录有写权限 log-slow-queries="/log/slow.log" #当query语句大于2