网站数据分析:时间因素需考虑

  在网站数据分析中,时间是最常见也是最不可或缺的维度之一,大部分情况下用于限定指标统计的范围和粒度,同时时间因素也会对指标的一些统计规则和细节造成影响,而在某些数据分析中我们很容易忽略时间因素的影响,这些影响可能误导最终的结论。

  发现这个问题是在一个数据提取的需求中,网站每天会发布很多新的内容,这些新的内容需要进行推荐,不然就会被埋没,所以很多网站都会有“最新推荐”之类的模块,而这个数据需求就是分析应该推荐哪些新内容?网站新发的内容质量参差不齐,而且数据积累较少,而推荐模块需要放置那些有潜力的新内容,以便潜力充分发掘后成长为热门内容,所以数据分析要做的就是去寻找那些有潜力的新发内容。如果是TOP10的推荐榜单,最简单的做法就是根据新内容的访问量或者转化率进行排序选前十,但其中有很多值得注意的地方,关于转化率需要注意的地方可以参考关键指标背后的秘密这篇文章,这里主要讨论如果以内容的访问量进行排序,如果选择近一周的汇总数据,我们需要注意什么?也许你已经想到了,之所以这里举例新内容,是因为新内容有一个发布时间(Publish Time),就像一个人的出生日期,而从发布时间到当前的时间间隔就是内容的持续时间,也可以认为是内容的生命期(Lifetime),就像一个人的年龄。内容的持续时间越长就获得越多的数据积累,相应获得高访问量的机会就越大,如果我们比较一周中在不同时间发布的内容在该周的总访问量,那些就会掉入错位比较的陷阱,或者叫“Mismatch”。

  一个形象的比喻就是刚刚入伍的新兵跟久经沙场的老将的决斗,虽然新兵不是完全没有胜出的机会,也许那个新兵天生勇猛,或者有着一股初生牛犊不怕虎的冲劲,可以一举击败经验丰富的老将,但在大多数情况下这种可能性较小,这是一场不公平的决斗,而在数据分析中我们需要尽量去避免这类不公平的决斗(比较)。

  内容和商品分析

  其实日常中发生这类错误的情况可能很普遍,当我在博客新发文章几天后上Google Analytics去看数据,发现新文章页在相对较后面的位置,不是因为真的没人看,而是GA上默认展现近一个月的汇总数据,报表根据Pageviews排序的结果新内容无法在短时间内迅速冲到前几位。对于那些新发内容或者新上架产品频率不高的网站,运营人员可能比较清楚哪些是新内容,所以通过一些人为的辨认调节在分析的时候不易掉入陷阱,但对于每周有上百个新发内容的网站,这类错误的发生很可能埋没一些优质的新品。

  我们需要找到一些办法去规避这个时间因素对分析结果的影响,通常我们在选择比较对象的时候需要控制所有的比较对象具备相同的持续时长,比如我们比较新内容的热门度,统一选择近一周的数据,对于较早发布的内容摒弃之前的数据,而近一周内刚发布的内容则舍弃不参与这次比较,等到有了完整的一周数据之后再加入比较。这样虽然可以确保比较在同一基准线上,但无疑延后了评估的结论,对于某些一上来就表现抢眼的内容无法及时发现,于是这里采用统计单位时间指标表现的方法,即根据内容的发布时间统计得到每个内容的持续时间(一般精确到天即可),然后将内容的总体访问量除以这个持续时间,就得到了单位时间的内容访问量,进而进行比较:

  上表取的是5个新发布内容近10天的访问量数据,同时加入了内容自发布以来的持续天数,我们用总的访问量除以持续天数计算得到平均每天访问量,然后以总访问量和平均每天访问量分别进行降序排列,得到完全不一样的排名。如果按排序1,我们完全可能忽略D内容的强劲表现,而权衡时间因素之后的排序让我们能够更加准确的把握有潜力的新内容。

  以上的方法同样适用于电子商务网站的商品分析,很多电商网站希望在新商品中挑选有足够潜力的商品进行重点营销,用于打造所谓的“爆款”,从而进一步促进订单量的增长提升销售额和利润。对有潜力新品的挑选一方面需要足够敏锐的嗅觉和眼光,另一方面就要借助数据分析,而这个时候不得不考虑上面提到的时间因素的影响,记住一个月内销售20件的商品不一定比销售50件的差,关键在于这些商品你是何时上架的,使用有效的方法进行评估才能找到真正有潜力有价值增长点的商品。

  要知道任何的网站内容或产品都不是经久不衰的,都有它们自己的生命周期,所以明智的网站运营永远在不断寻找新的生长点,如果数据分析中欠缺考虑时间因素,那些有潜力的产品和内容很可能就会被“久经磨练”的产品内容长期压制,导致网站新陈代谢过于缓慢,进而落后于其他网站。

  用户分析

  在进行用户分析的时候,同样需要注意时间因素,如用户RFM分析、用户忠诚度价值评分、用户生命周期价值等,这些基于用户在一段时间内持续性行为分析的模型都易掉入时间的陷阱。我们没法奢求一个只注册了一周的新用户在近一个月的访问频率高于老用户,因为你只给了他7天的时间,而与他对决的是拥有充裕的30天时间的用户;同样你不应该去比较一个仅使用一个月的新用户与一个一直在持续使用的老用户在三个月或半年中的消费次数、消费金额等,因为他们不在同一起跑线上。但新用户拥有潜力,指不定他们就会成长为更加高价值的忠诚用户,所以在针对用户的营销中我们需要消除这个因素的影响,同样使用除以用户使用网站持续时间(从用户首次访问或者注册时间开始计算)的方法计算单位时间的指标表现,使用RFM模型看下考虑时间因素前后对用户评估的差异:

  如上表所示,假如RFM模型选择了近100天的数据来对用户进行分析,这里同样加入“持续时间”这个统计量,即用户从注册到当前的天数,如果用户的注册时间在100天之前,那么用户在该统计周期中的持续时间就是100天(最大期限)。RFM的三个指标中的最近购买间隔(R)不受用户持续时间的影响,因此在考虑时间因素时不用做变换,而购买频率(F)和消费金额(M)都会受到持续时间的影响,需要除以持续时间,计算得到单位时间(这里是天)的数值,即表格中每位用户在“是否考虑时间因素”前后的指标变换。从变换前后的比较来看,用户1因为是持续使用的老用户,未考虑时间因素前在购买频率和消费金额上具有明显优势,但数据变换之后,用户2所表现的粘性和价值更高,即用户2虽然使用网站时间不长,但在单位时间的购买消费上优于用户1,我们通过雷达图进一步看下考虑时间因素前后的效果:

  图中对数据进行标准化评分后,蓝线代表用户1,红线代表用户2,虚线表示未考虑时间因素,实现代表考虑了时间因素,可以看到用户2在考虑时间因素之后价值被明显放大,从图中可以得到用户2的预期价值优于用户1。如果我们不去考虑时间因素的影响,分析的结果就会产生明显的偏差,进而可能误导对用户的正确评估。

  其实这里提及的时间因素还是一个遵循对比原则的问题,比较的对象之间必须具备可比性,不然比较的结果就没有任何的意义。

  

时间: 2024-11-05 23:19:52

网站数据分析:时间因素需考虑的相关文章

网站数据分析篇之——网站导航分析

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客 站长团购 云主机 技术大厅 之前笔者写过一篇<数据分析是未来seo的必修课>,之后有网友问笔者如何对企业小网站数据分析呢?这个还真的不好回答,只能给出通用的数据分析方法,笔者自己也有好几个企业网站,平时闲下来也会对其30天的数据分析,寻找有问题的页面,然后进行修改.下面跟大家谈谈网站导航的分析.以用户行为为基础去分析网站导航. 对于所有网站来说,一般

浅议网站URL到底需不需要静态化

很多SEOer似乎都有一种共识:网站URL一定是需要静态化的.笔者从网上各大SEO培训站点搜索得到的资料也是这样说的,URL静态化是网站优化的一个重要指标. 但是,不少站长都知道一个事情:早前,谷歌站长博客发表了一篇讨论URL动态化还是静态化好的帖子,在这帖子里,谷歌明确建议不要将动态URL静态化. 帖子一出,整个传统SEO界的观念被颠覆了.到底URL应该静态化还是动态化呢?不急,且来看看谷歌自己的观点: 谷歌在帖子中阐述了自己的观点: 1. 谷歌完全有能力抓取动态网址,再多问号都不是问题; 2

网站设计用色需与企业产品特点相结合

  网站设计者不仅要对色彩敏感度强,还要特别关注流行色的发展趋势.特别是一些欧美的服装发布,流行色发布会等等一些当前的主流色的关注度要高.现在我主要负责的是彩票类网站的设计,平常没事的时候我会多看一些优化的网站,同时研究别人的用色,多学习.做一个色彩方面的有心人,就会使自己的网页富有暮气,更受欢迎.网站设计最主要的还是给用户看的,所以要多看一些对网友对网站的评论的东西,这样不仅能做到亲民还能提高自己的色彩品味.用人喜欢的色彩是不会掩盖设计师的特色的因为设计师用色往往是保管自己的用色方式上才去采用

seo网站数据分析应重点关注的几方面

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 网站数据分析是seo工作中的重要一环,比如通过流量分析才会知道网站的seo效果,想知道蜘蛛对网站的抓取情况得分析网站日志,想知道做的关键词有没有效果要分析关键词的效能等等.通过网站数据分析可以知道我们的工作效果,同时也能够让我们发现网站存在的问题. 但网站数据分析包括很多方面,除了上面所列举的流量分析.日志分析.关键词分析之外,还有其它很多方面,这边就不一一列举了,下面就列举一些seo应该重点关注的方面. 1. 竞争对手分析 通过对竞争对手

网站数据分析:多维交叉分析 排查网站数据异常

中介交易 SEO诊断 淘宝客 云主机 技术大厅 我们在进行数据分析的时候,大部分时间都在使用趋势分析.比较分析.细分分析这三类方法,但其实还有一个方法我们也会经常使用--交叉分析,尤其是在排查数据异常的问题时,交叉分析就能展现其强大的威力.另外要跟大家说声抱歉的是博客的更新频率可能没有那么频繁了,但是尽量每个月至少能发布一篇,希望文章的质量有所保证,还是欢迎大家留言讨论,能够发起一些有趣的话题,一起拓展在网站数据分析方面的思路. 什么是交叉分析? 交叉分析是指对数据在不同维度进行交叉展现,进行多

网站数据分析:分析的前提—数据质量3

中介交易 SEO诊断 淘宝客 云主机 技术大厅 前面的两篇文章--分析的前提-数据质量1和分析的前提-数据质量2分别介绍了通过Data Profiling的方法获取数据的统计信息,并使用Data Auditing来评估数据是否存在质量问题,数据的质量问题可以通过完整性.准确性和一致性三个方面进行审核.这篇文章介绍最后一块内容--数据修正(Data Correcting). 数据审核帮助我们发现数据中存在的问题,而这些问题有时候可以利用一些方法就行修正,从而提升数据的整体质量,数据修正就是为了完成

网站数据分析:SkyGlue—用GA标记用户生成点击流

中介交易 SEO诊断 淘宝客 云主机 技术大厅 最早看到SkyGlue这个工具是在Cloga博客的文章,后来经过jasseyyang的推荐,向SkyGlue的cindy申请开通了博客GA账号的试用.经过一段时间的使用,现在来简单介绍一下SkyGlue这个工具. SkyGlue是Google Analytics的一个扩展工具,基于对网站中唯一访客的识别和标记,自动追踪网站的事件监控,记录用户操作的点击流数据.SkyGlue同样是通过JS页面标记进行安装部署,不过前提是你已经部署了GA的代码,因为S

网站数据分析:分析的前提—数据质量1

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 数据质量(Data Quality)是数据分析结论有效性和准确性的基础也是最重要的前提和保障.数据质量保证(Data Quality Assurance)是数据仓库架构中的重要环节,也是ETL的重要组成部分. 我们通常通过数据清洗(Data cleansing)来过滤脏数据,保证底层数据的有效性和准确性,数据清洗一般是数据进入数据仓库的前置环

一分钟了解阿里云产品:从域名到网站,只需四步

  从域名到网站,只需四步,轻松访问   第一步. 注册域名.     首先您需要先拥有一个域名,没有域名先购买域名,这是一个很简单的事情.   第二步. 准备服务器和网站.     1.我已经有域名,接下来该如何操作?接下来需要您开始准备网站和服务器   如果您已经做好了网站,还没有购买服务器?您可以购买阿里云云服务器.   如果您需要网站建设加服务器一站式服务,您可以购买阿里云智能建站服务.   2.我的网站和服务器已准备完毕,接下来该如何操作?那我们一起进入服务器备案环节.   根据规定,