网络数据的背后——网络日志的分析指标

常用的定量分析是问卷调查,这可以收集到用户对产品的主观反馈,它的结果受问卷题目的影响,不能完全客观地反映用户如何使用产品,他们在实际环境中遇到了哪些问题。而针对网站的定量分析,网络服务器的日志文件能真实反映用户的当前体验,解释行为的深层特点,能够更有效地改进产品。

网络日志可以帮我们回答很多问题,比如用户在什么时间段浏览网站;对网站的什么板块比较感兴趣;是怎样了解到网站;多少用户会转成重复用户;在网站上找到兴趣点的路径是什么;应该怎样优化使用过程,提高用户体验,等等。要系统地分析日志,得到有价值的用户反馈,主要考虑聚合度量、基于会话的统计、基于用户的统计和点击流分析四方面。
1. 聚合度量

可以理解为将大量网站数据进行合并分析。下面结合某旅游论坛的日志数据说明常用的聚合度量指标。特别说明一下,本论坛纯属虚构,数据也是为了说明概念虚构的。

(1)网站的浏览量。

同时间段的浏览量比较,可以得出用户关注度的变化趋势。图1显示了某旅游论坛2008年6月至2010年12月浏览量变化情况,其中09年6月左右浏览量骤然上升,09年12月逐渐趋于平缓,曲线的变化可能与论坛的营销手段、设计等有关,因此能见证采取措施带来的效果。

图1 某旅游论坛的浏览量

(2)一天内各时间段浏览量的分布。

从图2可以判断用户主要在休息时间浏览该论坛,因此论坛应当突出休闲轻松的内容。

图2 某旅游论坛一天内各时间段的浏览量

(3)网站各板块的浏览分布。

可以分析具体板块、单个页面、同类页面组的浏览分布情况,判断用户的兴趣点。图3说明论坛用户主要对东南亚、日本比较感兴趣。

图3 该论坛国外旅游版的浏览比例

(4)操作系统和浏览器比例。

方便网站更好的适应操作系统和浏览器。图4显示用户使用的操作系统以windows为主;图5表明浏览器中IE占多半比例,Firefox和Chrome的用户量也比较大。因此设计或改版时,需要重点满足windows模式,显示效果主要保证IE、Firefox和Chrome的兼容性。

图4 该论坛用户使用操作系统的比例

图5 该论坛用户使用浏览器的比例

(5)推荐链接网站。

即打开网页前,用户浏览的上一个网页。了解推荐链接网站,便于知道用户怎样进入网站,了解使用的情境。用该论坛举例,有近30%的用户是从搜索引擎进入网站,约60%则是从收藏或者地址栏输入直接进入论坛,这就说明用户忠诚度比较高,已经有了相对稳定的用户群。

(6)搜索引擎推荐和关键词。

如果推荐链接来自搜索引擎,其中含有的关键词能帮助确定关键词的营销方案;如果是网站内部搜索的关键词,则更有助于向用户推荐内容。例如该旅游论坛内部搜索的热门关键词是“攻略”、“自驾”、“蜜月”、“海南”和“五一”,用户关注什么,这方面就需要多多提供参考。

2. 基于会话的统计

会话是指通过链接与网站进行的信息交互。

(1)每次会话的平均访问的页面量。

典型会话可以说明用户访问网站的广度。例如搜索类网站广度较小,用户的目的是查找信息,达到目标后就会终止,所以支持这个主要任务需要的页面较少,框架简单。但如果是电子商务类网站,使用目的是浏览、完成交易,过程复杂,访问页自然较多,因此需要不同的指引支持整个过程。

(2)会话平均的持续时间。

从持续时间的长短,能判断用户的兴趣点;也可以判断出哪些是过渡页,哪些是内容页。图6是查询北京周边旅游景点的过程,小框的内容是这步查看的页面和查看的时长。从时长可以判断出列表页和当地旅游版属于过渡页面,但同样是过渡页,两者耗费的时间不同,这种现象也许是因为没有明显的推荐景点入口,因此查找时间较长。

图6 查询北京周边旅游景点攻略的过程

3. 基于用户的统计

主要利用cookie(网站储存在用户本地终端上的数据)得到。

(1)访问次数。

主要用来衡量用户的忠诚度和对网站的信任度,相对而言访问次数与这两者成正比。

(2)访问频率。

可以用来决定网站内容的更新频率。图7显示了上述旅游论坛某三个版块的更新与访问频率的统计情况,第一个版更新太慢,可以通过访谈得到用户想要的信息,增加更新频率;第二版更新与访问同步,发布的信息能让用户尽量接受;第三版更新太快,很多内容被埋没,是吃力不讨好的做法。

图7 旅游论坛某三个版块的更新与访问频率

(4)保留率。

是某时间段回访的用户数与该时间段总用户数的比值,时间段的长短需要根据网站本身的定位决定。还是用旅游论坛说明,用户一般会在旅行前一个月内查询旅游的相关信息,因此可以考虑以月为间隔统计保留率。如图8所示,该论坛保留用户的能力稳定。

图8 该旅游论坛2010年用户的保留率

(5)转换率。

转换率等于进入下一页的用户与浏览当前页用户的比例。从下表可以看出用户从旅游版面的列表打开贴子的用户较少,回复贴子的比例也很低,因此可以向用户推荐有价值的贴,同时考虑增加回帖的激励措施。

4.     点击流分析

即分析得到用户是如何使用网站的。

路径分析。从论坛的查找景点攻略的目的,是快速了解目标景点的信息,目前的过程可以精简为图9所示的关键路径。因此可以考虑是否把图6中的过渡页“首页列表”设计为论坛的侧边栏。同时像“八达岭”、“秦皇岛”、“海河”等属于关注度高的景点,因此可以考虑将热点景点的链接直接呈现在列表中,将旅游版面这一过渡页也省略。

图9 查询景点攻略的过程

上面提到的各个指标都是单独呈现的,有时需要结合多个指标综合考虑。例如可以利用基于会话统计中的平均持续时间、平均访问页面,以及基于用户统计的访问次数、访问频率等分析用户的忠诚度,这里就不详细阐述了。

网站日志分析主要能得出用户在网站上做什么,怎样做,但为什么做需要通过访谈、焦点小组、可用性测试再进一步了解。

上面是在学习网站日志分析时整理的比较有用的资料,相对浅显,更深入的研究希望可以随时交流~

参考资料:Kuniavsky, M. (2003). Observing the user experience: a practitioner’s guide to user research. San Francisco,CA: Morgan Kaufmann.

(本文出自Tencent CDC Blog,转载时请注明出处)

时间: 2024-10-27 20:27:06

网络数据的背后——网络日志的分析指标的相关文章

使用无线网络数据包对无线网络安全进行分析

本文阐述的是利用无线网络数据包来对无线网络安全的正确分析,在无线网络中,建立连接并不像连接有线网络那样简单,物理安全也没有阻止未经授权人员进入设备室那样容易,甚至在接入点总方向的小问题都可能让你崩溃.也就是说,保护无线网络安全将成为未来安全行业的挑战.在这篇文章中,我们将探讨解决利用数据包分析无线安全问题的实用技巧,首先我们将展示正确连接无线网络数据包的方法,收集到正确数据后,我们将探讨不同的分析技术,包括分析WEP/WPA认证.过滤加密流量以及寻找恶意接入点等.捕获无线数据包从数据包 来看,无

网络日志的分析指标

常用的定量分析是问卷调查,这可以收集到用户对产品的主观反馈,它的结果受问卷题目的影响,不能完全客观地反映用户如何使用产品,他们在实际环境中遇到了哪些问题.而针对网站的定量分析,网络服务器的日志文件能真实反映用户的当前体验,解释行为的深层特点,能够更有效地改进产品. 网络日志可以帮我们回答很多问题,比如用户在什么时间段浏览网站;对网站的什么板块比较感兴趣;是怎样了解到网站;多少用户会转成重复用户;在网站上找到兴趣点的路径是什么;应该怎样优化使用过程,提高用户体验,等等.要系统地分析日志,得到有价值

【网络数据与科学】大数据时代:领航未来 大数据四大趋势凸显

大数据分析_大数据处理_大数据技术_云计算_网络数据与科学   网络大数据整合了大数据分析,大数据处理,大数据技术,云计算为一体,力争打造国内数一数二的网络数据处理平台.   在全球经济.技术一体化的今天,我国IT行业已经开启了大数据的起航之旅,大数据已经在经济领域发挥重要作用.   2012年,政府.互联网.电信.金融等领域市场规模占据近一半的市场份额.大数据在主要经济领域的发展趋势如下:   大数据分析成为市场营销的重要手段   与传统的市场研究方法不同,大数据的市场研究方法不再局限于抽样调

网络数据的统计和分析

大数据引爆了互联网信息,它不仅更新了了互联网的数据应用模式,更重要的是,它还深深影响着人们的生活.大数据时代到来,不少人认识到数据分析的认识正在从"向后分析"向着"向前分析"方向改变.人们的思维模式因此改变,同时也带来了数据采集.分析和使用等难题.如果这些难题受到解决,也将意味着大数据向纵深方向发展的开始. 一.数据统计分析是怎么一回事 近年来,包括互联网.物联网.云计算等信息技术在内的IT通信业迅速发展,数据的快速增长成了许多行业共同面对的严峻挑战和宝贵机遇,因此

实例介绍网络数据收集与分析的方法和要点

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 数据的收集与分析是从事互联网相关工作人员的必备技能,小到个人站长,大到行业集团决策者,在作任何一个选择与决策的时候,都是以数据作基础与支撑,面对 互联网的各种数据繁杂多变,如何做好数据的收集,整理与分析工作呢,下面笔者以个人的实际操作的案例来详细说一下数据的收集与分析的要点,供大家参考! (笔者要收集的是活跃的人气地方论坛) 1.明确收集数据

基于数据包分析的大数据技术解决网络安全问题

1.网络攻击简介 网络攻击是利用网络存在的漏洞和安全缺陷对网络系统的硬件.软件及其系统中的数据进行的攻击.网络信息系统所面临而对威胁来自很多方面,而且会随着时间的变化而变化.从宏观上看,这些威胁可分为人为威胁和自然威胁. 自然威胁来自于各种自然灾害.恶劣的场地环境.电磁干扰.网络设备的自然老化等.这些威胁是无目的性的,但会对网络通信系统造成损害,威胁通信安全. 而人为威胁是对网络信息系统的人为攻击,通常是通过寻找系统的弱点,以非授权方式达到破坏.欺骗和窃取数据信息等目的.两者相比,精心设计的人为

【先锋】缔元信.网络数据CTO罗文川:企业如何选择DMP平台

缔元信.网络数据CTO罗文川在接受CSDN采访时表示,企业在选择DMP平台时,需要考虑四大因素.他认为,首先是DMP数据平台的数据丰富性,是否能够对自身产生价值:其次是DMP平台是否提供相应匹配的应用,可以方便的使用自己的数据:第三是DMP平台的技术能力,是否有较强的系统架构来支撑DMP体系:第四是DMP平台运营方的服务,DMP平台的运营方是否可以在数据的应用上给与企业更多的帮助. 作为第三方互联网数据服务提供商,凭借自主研发的超大型网络数据服务平台,缔元信以独有的全景数据服务模式,在网站运营效

软件定义数据中心(SDDC)的日志分析

现代化基础设施不断生成日志数据的速度已远远超过人类分析的速度.而且,现在的数据中心可以在脚本控制下建立或拆除,其活动数量和数据量都在呈指数增长. 传统的数据分析法是每周或每天依照列表审查日志文件,这种方法已无法满足软件定义数据中心(SDDC)对数据审查的要求.SDDC的现代架构具有针对多层应用的高度自动化的动态部署能力,它要求实时日志分析也必须到位,分析是复杂故障排除.动态配置.保证高性能以及卓越安全性的关键. 在软件定义数据中心,你看到的是大量服务器之外的变量.你想看到配置量和配置时间,想知道

卡巴斯基剖析网络彩票的背后赤裸裸的网络诈骗行为

相信很多人都收到过标题为"中奖通知"的电子邮件,甚至收件箱都被这类垃圾邮件挤满.其实,这类垃圾邮件的内容和形式都大同小异首先通知收件人获得了一笔巨额大奖,为了能顺利获得奖金,收件人必须先支付一定的手续款.看上去的确很诱人,事实上,这就是赤裸裸的网络诈骗行为. 卡巴斯基实验室垃圾邮件分析员Maria Rubinstein在她的分析文章"恭喜您获奖了网络彩票的背后玄机"一文中,详细指出网络诈骗分子常用的伎俩,并给出一些有用的建议,帮助人们分辨虚假彩票信息和真正的通知.