小白学数据分析----->ARPPU的误区

新年到来,该应该持续坚持写下去,还是有很多人要来学习和进步的。

今天提到了一个概念:ARPPU。

这个概念等同于之前大家认识的ARPU(其实这句话我是很不愿意说的),ARPPU是总收入除以总付费用户数,得到的每个付费用户的平均收益。今天说的误区其实也就是大家一个使用上或者是认识上的误区,这个误区被巧妙的利用了,以至于那些可能不会注意到细节的人被蒙蔽了。

ARPPU是一个算数平均数,在均数的范畴中,概念很大,比如几何平均,截尾平均,调和平均(主要用于在玩家升级的平均速度方面的应用)等等。而恰恰因为ARPPU是算数平均数,所以,一些使用上的误区或者认识是需要背去校正的。

算数平均数是描述数据分布的集中趋势的统计指标,但是如果数据分布严重的偏态,那么这个时候算数平均数算出来的结果其参考意义是有限的。从ARPPU来讲,我们希望通过ARPPU的计算能够代表整个付费群体的平均消费水平和收入贡献,也是集中消费的趋势。但,对一款游戏而言,事实上并不是如同我们考虑的那般呈现所谓的正态分布形式,其实,如果我们把每人收入贡献绘制成频数分布来看,这是一个典型的幂律分布。小额付费群体多,但收入贡献少,大额付费群体少,但贡献收入多。而这时如果合并一起进行ARPPU的计算,显然高估了小额群体的付费能力,低估了大额群体的消费能力。

从集中趋势分析的角度来看

其实,多少年来,不是非常懂得精细化运营的人都是这么粗略的看待这个指标进行分析的,而现在对于这样一个使用误区,尤其当我们进行精细化运营后,需要更多的是跟多的群体细分,群体定位。当然,如果我们要从宏观把控整个游戏的平均消费水平,一种办法是去掉一些噪声,比如截尾均数(按比例去掉两端数据,在计算均数,如果和原来的均数相差不大,则说明极端值不存在,均数不受影响,一般是取5%),除了这种方法,这里我们可以通过一种非常简单的统计指标来分析,这就是中位数。

中位数:全体数据按大小排列,在数列中处于中间位置的那个值。中位数主要是位置平均数,所以不会受到极端值的影响,因此在评估ARPPU这类衡量平均水平,但是偏态分布严重的情况,中位数是很合适的,更加能够代表其集中趋势和平均水平。

从离散趋势分析的角度去看

百分位数

我们知道游戏中付费用户群体我们划分为三个部分,小鱼用户,海豚用户,鲸鱼用户,三个群体我们可以通过对总的付费群体进行百分比划分,这里就是用了百分位数据,所谓百分位数就是一个位置指标,我们可以把所有玩家的付费额从小到大排列,然后按照百分比划分,比如从左向右50%为小鱼,40%为海豚,10%为鲸鱼。在此情况下,我们分别计算各个群体的ARPPU值,这个相对我们刚才的从宏观的得到ARPPU,会更加准确的分析不同群体用户的消费能力。实际上刚才说到的中位数其实就是一个特殊的百分位数。

当然了,从离散趋势分析的角度,全距也都是可以去使用的,也是很简单的,这个只是一种检查而已,但是就方差,标准差等可能并不适合在游戏中消费数据的分析,虽然说他们涉及我们要分析的每个变量,但是由于他们也受到极端值的影响,所以不适合去做这种分析,他们的合理使用范畴是在服从正态分布的数据中。

总的来说,一个ARPPU所代表的内容很多,但是我们在使用和分析中,要避免一些误区产生。也要适当的使用统计学的一些灵活的方法重新审视和分析这些数据。

 

时间: 2024-09-20 00:50:49

小白学数据分析----->ARPPU的误区的相关文章

小白学数据分析----->付费用户的金字塔模型实践操作

免费游戏中付费用户模型分析 最近看了不少文章,对于付费用户的模型也有了很深刻的理解和认识,早先我做了不少关于大R,中间R,低端R用户的分析,想来还是觉得草草了事,近来有网友提出来,理论探讨的多了些,实践上手的东西少了点,毕竟还是叫做小白学数据分析啊,今天就把以前说过的付费用户的模型具体的实践一下. 感悟和理论 得到的灵感首先要感谢Nicholas Lovell 的这篇文章,是我得到了一些处理和分析这个模型的办法.连接如下: http://www.gamesbrief.com/2011/11/wh

小白学数据分析------>日活跃人数分析

从今天开始,特开辟一个小专栏,题目暂定为小白学数据分析,鄙人不才,在数据分析的道路上走的崎岖坎坷,同时数据分析本身是一个多面和复杂的工作,要懂得理论(统计.概率.数据挖掘.算法.模型)更要懂得业务,懂得行业理论,还要有灵活多变的思维,想想还是很复杂和麻烦的,所讲内容不但是理论,不仅是数据,尽量把这些东西综合起来,立体的来看,鄙人水平有限,很多的内容是尝试和改进,参考了很多的材料,在木有高人指点和牛人帮助的情况下,我只能借助浩瀚的网络知识和自己的悟性,今天决心拿出来给各位主要是帮助大家和我一起进步

小白学数据分析----->数据指标 累计用户数的使用

小白学数据分析--à数据指标累计用户数的使用 累计用户数是指注册用户数的累计,即可以认为是新用户的累计.在一般的数据统计中,我们基本上都会涉及到这个指标,且这个指标是逐渐累加的,比如: 时间                   注册用户数[新登用户]           累计注册用户数 1日                    100                                                 100 2日                    120   

小白学数据分析------>把握分析标准与敏感度

写在正文之前,想说几句话,今天是2012年3月16日,是我开博客以来的第9个月,9个月让我成长的非常迅速,这期间我收获了很多东西,认识了很多人,开了群,见了网站,持续的写博,从来没想到我的博客会有这么大的作用,从来没有SEO,从来没推广,从来没有任何宣传,我想到和我做的就是把我自己的成长纪录下来,把网游数据分析的点滴分享出来,当然我希望有人看,但是我毕竟不是高手,只是一个小白,小白只能是学习心得的纪录和整理,帮助自己理顺思路,很希望自己的文章有人看,因为那样就会有高手帮助我指点问题.今天 博客9

小白学数据分析-----> ARPU之殇

昨天看了香橼对360的质疑的相关报道,并且也看到了多个企业的大佬站出来拿着数据在互联网各种解释,今天新浪上也多了一篇文章<页游自曝ARPU值背后 不重要因计算方式不同>http://biz.265g.com/1209/183961.html,看罢后,感慨万千,鄙人也做了不算长时间的游戏数据分析,对于这个ARPU认识也算有一些,这里我谈谈香橼对360的质疑的事. 关于ARPU的很多分析我之前已经写过了,这里不再细说. 首先一点,这篇文章中提到了ARPU,并且给出了英文的解释:(Average R

小白学数据分析------&gt;描述性统计术语汇总

以下所说的统计学术语大家可以参考小蚊子blog的内容 (http://blog.sina.com.cn/s/blog_49f78a4b0102dwz9.html) 术语是帮助我们打开思路,通过多个角度对数据进行深度解读,数据分析师不能仅仅靠着对数据的一种感觉和敏感来进行数据分析,这样的主观性太强,在合理必要的情况下,使用前人已经总结和使用的方法往往对我们更有帮助,但也要记住不要陷入这个指标误区中,核心还在于人(但不是让你凭感觉作分析),在于人对待问题的思考方式,解决办法. 今天来说说描述性统计分

小白学数据分析-----&gt;什么是活跃_I(DAU)

最近和几个人聊天,大家对于活跃都有着自己的看法,此外因为一些标准的问题,不熟悉分析术语的很多人把活跃,留存等很多信息都搞混了.后来发现这是一个很现实的问题.在一些我 看来不是问题的问题都变成了问题了,因此在此特地说说活跃的事,帮助更多从事游戏数据分析的小白们成长. 究竟什么是活跃?在日常与外界合作过程中,我们经常日活跃.周活跃.月活跃等等信息,貌似听起来比较简单,但是真正如果自己实施操作统计数据时却发现自己又不懂这些定义,因此作为一些分析师.甚至开发人员就会发现很难去操作.以下我将描述三个活跃的

小白学数据分析-----&gt;怎么看待数据处理

本来这算不上一篇文章,但是我仍旧写了,除了解决一个小问题还要说点其他的关于数据分析的想法,首先先解决一个小问题. 第一部分 问题描述:处理游戏帐号信息时发现有重复的帐号,比如帐号A有N个重复项,希望留下1个重复帐号,但是要把剩下N-1个删除重复帐号删除.具体的原数据(黄色)模拟如下: 而我们希望得到的最终处理数据格式如右侧一列(绿色)所示.针对这个处理,其实有很多方法,可以参看小蚊子的<谁说菜鸟不会数据分析>,比如使用条件筛选就能搞定,今天不谈这个方法,说说另一种思路. 首先我们对于原数据进行

小白学数据分析-----&gt;渠道、运营、数据_I

学分析论坛|专注于游戏数据分析 针对本文的相关的讨论,请移步http://www.xuefenxi.com/forum.php?mod=viewthread&tid=112&extra= 上周六做了一个演讲,关于渠道.数据.运营的内容,今天开始,针对演讲的一些内容,有针对性的阐述一下.不过既然我是一个数据分析师,自然还是从数据分析角度来看待这个问题,在后期的文章中,我会加入一些案例,帮助理解. 渠道是最有效的获取潜在用户的方式 渠道存在海量的用户资源,并服务于开发者.渠道本身聚合了大量的用