URL地址中所暴露出来的网站特点

我喜欢浏览网页时多个心眼。这个心眼需要观察许多元素,每个元素都能提供信息。孤立的一个元素不重要,但是多个元素组成的信息,往往能获得有价值的判断。那么从这些元素说起:

永远不
忽略URL

URL是一个重要的信息,职业敏感让分析师绝对不会忽略URL地址的特点。URL反映出网站的蛛丝马迹,直接以例子说话:

$URL地址所在的域名

很多人在网上被骗,很大原因就是从来不关注URL所在的域名。

比如:http://www.taobao.ipx32.com/about.html,看似弱智的骗术却让很多
网友 误以为是淘宝的网站而落入圈套。这是ipx32域的网站,而不是taobao的网站。

在浏览的过程中,时刻关注页面的URL域名,可以知道点击链接是否离开本站,而关注新到的站点域名有何特征。在许多大客户的营销过程中,跨域的链接是很常 见的,不同的域意味着站长或广告主的监测工具与策略也会有所不同。比如:在IT门户中常有Intel,华硕,HP等硬件厂商的专题页面(可能会添加Google Analytics或Nielsen的监测代码),这些页面中会有链接将访问者导入新的域名,如intel.com.cn,或者hp.com.cn(可能 会添加Omniture、HBX或Webtrends的监测代码)。这种跨域的URL是显而易见的。$ URL地址所包含的参数

URL中包含参数是再常见不过了,但每个参数都有含义,关注它们能够全面掌握网站的功能特点。比如:

http://www.chinawebanalytics.cn/?p=917 这是Sidney的新博客的地址,可以分析这个博客运营了挺长的一段时间了,ID号都排到917了。http://adsclick.qq.com/adsclick?oid=1112901&loc=QQ_SX_JY_Test6&url=http://www.52-abc.com/这是QQ首页的右侧广告链接,
里面
丰富的参数告诉了我们对这些广告位的名称定义,以及跳转的目标地址。http://www.soso.com/q?sp=S&sc=web&cid=w.q.in.sb.web&ty=1&bn=&op=entry&kw=&w=WA 这是腾讯搜搜的“WA”结果页,告诉我们搜索关键词参数是用W变量。还有一些别的参数,也许一下子看不懂,如果有需要可再多次试验研究,就可以确定。

总之,对URL的参数关注是分析师的基本功。

$ URL地址所指向的文件类型

URL中会包括文件类型的信息。

HTML/HTM:这说明这种网站的页面是经过静态化处理的,以方便搜索引擎抓取。现在大部分门户与CMS系 统都会有静态化处理功能。再有一些简单的个人网页也会使用html文件名。JSP/PHP/ASPX/ASP:这说明这是一种动态页面,网页源文件是存在服务器端,这些文件的特性可自 行搜索了解。无类型:有些地址,http://www.ectend.com,这是属于服务器 自定义了主页,效果
其实是http://www.ectend.com/index.php.do:http://www.ems.com.cn/qcgzOutQueryAction.do?reqCode=gotoSearch 这种情况是jsp开发的网站。其实不需要完全知道,能辅助即可。这种网站一般有一定的技术含量,但技术实力不强,不够先进,常见于一些国资背景企业的功能 型网页,或者网站的后台。因为时下好的网站,在前端页面都能将URL隐藏得很好,不会出现.do这种情况。另外:还有一些开源项目的网站URL地址比较特别,如Wordpress:http://www.ectend.com/index.php/excellent-analytics/; 或 Wikipedia:http://zh.wikipedia.org/wiki/Wikipedia:首页。$ URL地址命名的特征

从URL的命名也能发现蹊跷或有趣的事,比如:

淘宝的URL特征就很有意思,是通过base 64编码的。(感谢money的指点,修正原来错误,很有收获,再次说明URL里有乾坤),很 多“-”。我推测“–”之间代表着变量,如果中间没有值,就代表这个变量没有定义。

http://list.taobao.com/browse/50018957-50018960/n-1-1---------------------0---------yes---------------------2-------b--40--commend-0-all-50018960.htm?ssid=r18?ad_id=&am_id=&cm_id=&pm_id=凡客诚品的URL也很有特色:

http://www.vancl.com/Product_1E10000/RuanNiuPiXiDaiXiuXianXie+HeiSe.html, 产品拼音+颜色。另外还能找出他们员工粗心之处:我们知道中文括号()与英文括号()不同,URL地址中只能出现英文括号,中文括号会翻译成编码。可见Vancl 的员工在产品录入时没有统一标准:

http://www.vancl.com/CategoryList-1440-1--1/GaoJiMianTangQuanMianChenShan%EF%BC%88ZunGuiKuan%EF%BC%89.html

http://www.vancl.com/CategoryList-1324-1--1/ShangWuXiuXianKu(BiaoZhunKuan).html网页源文件

对于好奇的网页,一定要查看网页源文件。通过源文件的快速浏览能够确定网站的技术实力、设计人员的素质,监测工具与监测方法的部署情况。一般关注以 下四点:

代码是否干净还是冗烦部署了哪些监测工具监测工具的代码部署的位置与顺序是否加入了可疑代码查看本文来源

时间: 2024-11-01 00:21:25

URL地址中所暴露出来的网站特点的相关文章

URL地址中的#符号使用说明_javascript技巧

一般我们想让一个a标签点击后执行javascript代码,有以下几种写法: 方式一:<a href="#" onclick="alert(1);">点击一</a> 这种方式的缺点就是点击后会在地址栏的URL后面加#号,同时把页面移动到顶部,一般不建议使用.方式二:<a href="javascript:void(0);" onclick="alert(1);">点击一</a> 这

URL(地址)中的特殊字符

特殊含义                           十六进制值  + 表示空格(在 URL 中不能使用空格)   %20  / 分隔目录和子目录                   %2F  ? 分隔实际的 URL 和参数                %3F  % 指定特殊字符                         %25  # 表示书签                            %23  & URL 中指定的参数间的分隔符           %26

获取URL地址中的文件名和参数的javascript代码_javascript技巧

复制代码 代码如下: //获取页面文件名 function GetPageName() { var url=window.location.href;//获取完整URL var tmp= new Array();//临时变量,保存分割字符串 tmp=url.split("/");//按照"/"分割 var pp = tmp[tmp.length-1];//获取最后一部分,即文件名和参数 tmp=pp.split("?");//把参数和文件名分割开

php获取url地址中的域名几种方法

方法1php自带函数(parse_url)  代码如下 复制代码 $Url='http://www.111cn.net/ index.html'; $tempu=parse_url($Url); $message=$tempu['host']; echo $message; //输出结果就是 www.111cn.net 方法2自定义函数  代码如下 复制代码 function get_domain($url) { $pattern = "/[/w-]+/.(com|net|org|gov|biz

获取URL地址中的GET参数

/*-----------------实现1--------------------*/ function getPar(par){ //获取当前URL var local_url = document.location.href; //获取要取得的get参数位置 var get = local_url.indexOf(par +"="); if(get == -1){ return false; } //截取字符串 var get_par = local_url.slice(par.

以不同的观点分析在URL地址设计中常遇到的2个问题

我们知道影响站点的收录排名因素有很多,诸如内容的质量.网站的速度,站点的结构.URL地址的结构等等.很多细节都会对站点日后的优化产生影响,因此我们在站点设计的时候总是会从多方面进行思考.遇到这些问题的时候,我们往往会从各种渠道获得相关的解决方法.但是这些前辈所给我们的建议是否就一定是适合我们的站点呢?笔者认为不然,有的问题还是要有自己的想法,切勿过度的盲从.下面笔者将从不同的观点分析我们在站点url结构设计中容易遇到的2个问题. 疑问一:我们的URL地址是否需要统一? 这个问题我想大多数的SEO

js取得url地址参数实例_基础知识

复制代码 代码如下: <script language="javascript"> /** * 获取url地址中的参数 * link:www.jb51.net */ var url="www.jb51.net/af.php?id=50&a=100"; alert(url); if(url.indexOf("?")!=-1){ var p=url.indexOf("?"); //返回所在位置 var str

php提取字符串中网站url地址的方法_php技巧

本文实例讲述了php提取字符串中网站url地址的方法.分享给大家供大家参考.具体分析如下: 今天写一个问答系统上线之后发现有很多人发链接了,由于业务部门要我们过滤掉网站地址了,下面我给大家分享一个提取字符串url地址函数,代码如下: 复制代码 代码如下: $postInfo['answer2'] ='可以的,商业贷款可摊还36%,公积金贷款可摊还16%|||可以先把账户里的余额提取出来用作首付,然后每个月贷款商业贷款可摊还36%,公积金贷款可摊还16%|||可以的,现在甲类公积金是摊还比例htt

jquery ajax中url地址的问题,不明白这个url地址该怎么写。

问题描述 jquery ajax中url地址的问题,不明白这个url地址该怎么写. 搞不清楚url是怎么访问的,不明白这个url地址该怎么写. 谁有现成的例子让我借鉴一下吗. $(function(){ $("#send").click(function(){ $.get("load_Ajax.html",{ name:$("#name").val(), content:$("#content").val() }).funct