数据分析有哪两大误区

  平时无论是进行用户调研、产品运营还是竞品分析,都少不了对于数据的分析,如果项目中出现某些分歧谁也无法说服谁时,很多时候也都是拿数据说话,可见在开发产品的时候,对数据的统计与分析十分重要。大家都说数据是客观的,但其实数据受背景环境、统计者、统计方法、分析者看法等多重因素影响,以致我们在统计和分析时却常常陷入误区,得不到正确的答案。下面简单说一下关于数据的两个常见误区。

误区一:把某一类型数据当做全部数据导致分析结果错误

  先说个小故事:二战时英国空军希望增加飞机的装甲厚度,但如果全部装甲加厚则会降低灵活性,所以最终决定只增加受攻击最多部位的装甲。后来工作人员经过对中弹飞机的统计,发现大部分飞机的机翼弹孔较多,所以决定增加机翼的装甲厚度。后来一个专家说:“可是机头中弹的那些飞机就没有飞回来”。

  这个故事里本应是对全部飞机进行分析,但统计样本没有包含已经损毁的飞机,所以得出的结论只是根据部分数据,或者说是根据具有同样特征(受伤)的某一类数据推论出的,并不能代表全部类型的数据,所以得出的结果很可能是错误的。

  再看一个例子:前一阵我为了分析人人网,想看看人人网现在的用户访问量是什么状态,于是选择了PV作为观测指标,通过alexa来看人人网的PV在过去一年中呈明显的下降态势,这也印证了我的预期,于是就以此为论据进行了分析。可是后来发现,alexa仅仅统计通过WEB的访问量,而用户移动端的登录并不在统计范围之内!这两年智能手机普及迅速,移动端登录也非常普遍,缺失这部分数据意味着前面统计的数据基本没有意义,因为WEB端访问量的下降有可能是用户访问人人网次数降低,同时也有可能是由PC端向移动端迁移,这个统计就不能作为论据出现了。

  从上面这个例子可以看到,我只统计了WEB端的访问情况,认为这就是人人网全部访问量,而忽略了移动端,从而推出了错误的结果。另一个问题就是由于我已经有预期(人人网访问量下降),那么我在为这个结论找寻相关的论据,当找到符合我结论的论据时很容易不去做更多判断就选择有利于自己的数据,这也是数据统计人员常见的问题。

  用某一类型数据代替全部数据会误导我们做出错误的判断,在统计时一定要注意这点。这一方面需要意识,在统计、分析数据时要时刻想着还有没有其他的情况,还有没有我们没有想到的数据类型,这些数据是不是能代表全部类型,尝试站在更高的角度去解读这些数据,而不是拿到数据后立刻就盲目分析。另一方面需要知识的累积,比如你知道alexa是如何进行统计的,那么很轻易就会想到还要考虑移动端的情况。知识的累积有助于我们做出准确的判断,这些知识与经验都是从阅读或实践中得来的,平时多做,慢慢累积,时间久了自然会看得更全面。

误区二: 鲜明事件让我们夸大了偶然因素

  鲜明的事件更容易占据我们的视线,从而让我们高估事件发生的概率。

  比如从年度统计中看到,某基金近两年的收益率达到100%,有某某明星操盘手等等,人们就会争相去购买该基金,同时也会让人们认为买基金就是可以赚钱的。而实际上,绝少有基金可以常年保持这样的收益率,近两年收益前五名的基金很可能在五年后收益率就排行倒数,而世面上大部分基金也无法跑赢大盘,不过人们在记忆中依然会认为买基金确实很赚钱,当年XXX两年益100%呢。两年收益达到100%只是偶然情况,但却由于事件太过鲜明而长久驻扎在人们的心智中。

  类似的事还有很多。比如富士康N连跳,大家都觉得这么多人跳楼,富士康肯定太黑暗了,但大家却没有注意富士康员工大概有37万人,按12连跳的话自杀率不到十万分之四,而全国的平均自杀率为十万分之十五, N连跳自杀率远低于全国自杀率,可见富士康12连跳实际上是一个社会问题,而不仅仅是一个企业的问题,我们太过注重鲜明的事实却忽略了背后整体的概率。还有前两天美国波士顿爆炸案死亡3人,微博上各种祈福,可是阿富汗、伊拉克等国家几乎每天都面临着这些问题,只是由于媒体不会整天报道那里的消息,而天天出现的袭击也麻痹了人们的神经,所以我们只会关注鲜明的波士顿爆炸,而对其他地区天天发生的事情无动于衷。另外比如你周围有人买股票赚了好多钱,可能你也会很想投身股市一试运气,而忽略了散户8赔1平1赚的整体概率。你看到了各种创业成功者的报道,认为自己也可以尝试创业,毕竟成功概率好像也不低。但你不知道那些不成功的人基本没有被报道的机会,而实际上创业成功的人可能不到1%。

  说了这么多,其实就是太过鲜明的偶然事件会让我们忽略背后一直存在的整体概率。看到这种数据的时候,不要太过情绪化,你所看到的数据或事件可能只是个例,并不能代表大多数,可以去查查历史情况或平均情况,去找找沉默的用户或数据,切忌轻易就做出判断和决定。要理性看待这些偶然事件,既不盲目跟随,也不对此嗤之以鼻,在明确整体概率的情况下,剔除偶然因素,分析这些偶然事件背后是否存在着某些值得借鉴的地方,从而吸收到自己产品或项目中,以便使自己的产品或要处理的事情有可能成为市场中下一个“偶然事件”。

  作者:@回首之泪

时间: 2024-09-20 00:59:39

数据分析有哪两大误区的相关文章

再谈大数据行业里的两大误区

之前在虎嗅发了一篇文章<大数据行业里的两大误区>,很多朋友评价还不错,受此激励,结合最近目睹.经历的项目,想多写一些.经过笔者总结,发现大数据的误区还真是不少,尤其是国内,很多人以讹传讹,造成了很多基本概念的偏差.接上一篇文章,再来谈谈大数据中的一部分误区,供大家拍砖. 误区三:数据量特别大才叫大数据 在 "数据界"存在这样有一波人,他们认为"只有Peta级以上的才叫大数据,甚至到了Zeta以上才叫大数据,目前还没有到真正的大数据时代!",每次听到这样的

美国数据科学家:重视非结构化数据分析 走出两大“经典”误区

虽然基本上国内大部分公司,言必提"大数据",但是对于大部分CIO.CTO们来说,对数据的分析仍然停留在过去的阶段:对于非结构化数据分析的成熟度还远远落后于结构化数据. 但是现在移动端所带来的爆发式增长给大数据从业者带来了非常大的挑战,这些数据有很多是非结构化数据,充斥了人们交流的空间,相应的,对非结构化数据的分析也变得越来越重要--对非结构化数据进行分析.提取出有价值的东西,成为CIO.CTO们最关注的问题. 但是目前,很多人仍有非结构化数据分析等同于舆情分析的粗暴认知. 非结构化数据

塑造品牌的两大误区

遇到一个海归美女来请教做四川烟熏鸭的微营销,写了一个很长的自传来包装自己,然后说这么做的原因是听别人说,微 营销时代, 首先要做个人品牌,让别人接受了你的人,再来接受你的产品.然后又说 觉得另一个朋友圈卖鸭的男士走的是自恋路线,觉得自己可以走性感路线,所以就把自己包装成了穷山沟逆袭的英国留学归来的美女海归来卖这个烟熏鸭.我告诉她有两个问题,第一个问题她说的那个案例, 其实业绩并没有好到可以做为现象级去研究的地步,月流水百万以上,我们可以谈谈成功经验,月流水十几万差不多是每个人都能做到的.第二,做

交换链接的两大误区

链接 由于链接在网站排名中占据着一个非常重要的地位,也是搜索引擎优化一个很难实现的目标.因为这存在着相当大的主观原因.在进行交换链接的时候,平常很多人会容易犯下以下的两个错误. 误区1:PR越高越好: 1.很多站主在要求交换链接,第一个提出的要求就是pr要超过多少多少. 对于同类网站来说,网站PR是越高越好.这样不但会转换为你的反向链接,而且也可以有效地提高你网站的PR值.为你的网站排名也会作出很大的贡献(根据hilltop算法,排名的最后决定于链接网站的数量与质量) 但是如果交换链接的网站与你

交换友情链接的两大误区

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 由于链接在网站排名中占据着一个非常重要的地位,也是搜索引擎优化一个很难实现的目标.因为这存在着相当大的主观原因.在进行交换链接的时候,平常很 多人会容易犯下以下的两个错误. 误区1:PR越高越好: 1.很多站主在要求交换链接,第一个提出的要求就是pr要超过多少多少. 对于同类网站来说,网站PR是越高越好.这样不但会转换为你的反向链接,而且也可

避免投资浪费 认清大数据的10大误区

大数据在当前的科技新闻中占据了主导地位,它被吹捧为一切问题的可能的解决方案,从入侵检测与预防欺诈,到治疗癌症和设置最优的产品价格. 但我们定义大体量.多格式.高速度的大数据,并不是能够搞定每一个问题的灵丹妙药.事实上,如果公司迷信周围的一些大数据的神话,可能在错误的方向越走越远,浪费大量的时间和金钱,影响公司的市场竞争地位,或者损害公司的声誉. 以下是企业应当知道的围绕大数据的十个最大的误区,了解他们将有助于有效地避免大数据的消极影响,并真正获得大数据带来的商业价值. 避免投资浪费,认清大数据的

认清大数据的10大误区

 大数据在当前的科技新闻中占据了主导地位,它被吹捧为一切问题的可能的解决方案,从入侵检测与预防欺诈,到治疗癌症和设置最优的产品价格. 但我们定义大体量.多格式.高速度的大数据,并不是能够搞定每一个问题的灵丹妙药.事实上,如果公司迷信周围的一些大数据的神话,可能在错误的方向越走越远,浪费大量的时间和金钱,影响公司的市场竞争地位,或者损害公司的声誉. 以下是企业应当知道的围绕大数据的十个最大的误区,了解他们将有助于有效地避免大数据的消极影响,并真正获得大数据带来的商业价值. 避免投资浪费,认清大数据

百度SEO优化应避开这两个误区

有人说,SEO很简单,八个字:内容为王,外链为皇.是的,SEO的核心道理确实简单如此.但凡成事者,皆赢在细节,今天我们要谈得细节,就是两个鲜为人知的SEO误区,特别是百度优化.了解并避开这两个误区,也许能让您的SEO工作事半功倍,让您赢在细节--成关键词排名之事! 一.用内页去对抗网站或者栏目 大家都知道,百度注重网站权威性,也就是说,越是权威的网站,越容易获取关键词排名,这是共识.那么,为什么还有那么多的SEO人员,纷纷在与那么多权威的网站对抗,并依然存在机会呢?除了坚持不懈努力让自己的网站变

浅析企业网站成功运营的两大核心:SEO优化和推广

现在很多企业网站,已经意识到,网站不是简单的用来向自己的用户展示,更多的是要发挥网站的功效,给自己企业带来更多的订单,这样企业网站的运营就要从被动转变成主动,要主动的把自己的网站营销出去,提升自己企业的品牌形象!从而获得更多客户的认可,于是就会给自己企业带来不错的订单! 这种想法算是比较进步的,但是在操作的过程中,往往走到了另一个误区,从原先只要搞个网站,在自己的名片上,能够印上网址就可以了,不管别人看不看,数年如一日的网站内容,开始转变成,在网站页面的美化上,无所不用其极.很多企业网站,竟然全