数据分析中OLAP应用心得

  理性决策的基础是数据,而数据分析中,OLAP是重要且必要的工具。结合自身工作特点及心得,拙作于斯:

  1.什么时候用多维度OLAP?

  多维度OLAP在让数据透彻的同时,也会造成数据碎片的风险。因此,使用OLAP时一定要有目的的使用,比如在验证或推翻假设检验时对比项(控制组)的选取,抑或探求某一维度下具体指标值。OLAP可以增加数据的分辨率,但也会使数据碎片化。在数据贪心心理的作祟下,谨记在明确目标下再使用多维度OLAP。

  在没有明确目的,但要探索数据时进行OLAP,一定要先在目前计算性能允许下,设定好数据的分辨率(如一层维度)。通过这样来利用OLAP对数据进行探索。

  OLAP大多数时是供整个团队来自助查询的,这部分功能不宜过分延伸,因为">数据计算成本很难让团队成员充分理解。一言以蔽之:OLAP要么在有明确目的下,要么在明确限定下使用。

  2.OLAP的目的:

  随之而来的问题是OLAP的明确目的是什么? 如果说数据分析的目的是为判断决策提供逻辑依据,那么OLAP即是为这些逻辑依据提供分析用的原材料。一个指标值突然的显著变化,我们的目的绝不是说看遍所有维度,所有水平的指标表现,这是一种低效的方法。而宜用相关性高的维度中可能影响的水平下之数据,去推翻或支撑备择假设。如A指标在过去30天内环比波动在3%以内,但最近2天波动却达到10%,对这种异常首先进行假设,而后利用OLAP所呈现的更细粒度数据对假设进行论证或推翻。

  OLAP很难解决问题,但却是解决问题道路上的重要工具。

  以上拙见,仅供参考。

时间: 2024-11-05 20:11:24

数据分析中OLAP应用心得的相关文章

规则引擎在数据分析中的作用

前言:规则引擎通过将业务规则和开发者的技术决策分离, 实现了动态管理和修改业务规则而又不影响软件系统的需求.以下通过实例对基于SQL 查询.自定义规则等一系列场景来说明规则引擎在数据分析中的应用. 在现代的企业级项目开发中, 商业决策逻辑或业务规则往往是硬编码嵌入在系统各处代码中的.但是外部市场业务规则是随时可能发生变化的, 这样开发人员必须时刻准备修改.更新系统,降低了效率.在这种背景下, 规则引擎应运而生,它通过将业务规则和开发者的技术决策分离, 实现了动态管理和修改业务规则而又不影响软件系

网页游戏数据分析中变量与关系的相关疑问

"http://www.aliyun.com/zixun/aggregation/8458.html">优化推广""找到用户流失原因和解决方法"是网页游戏数据挖掘数据分析最主要的两方面功能作用,对此尝试举例提出个人在相关思考的几个疑问作为探讨交流题目,希望借此共同关注数据分析在网页游戏运营领域的应用.QQ61411209 MSN:f95858@msn.cn网页游戏广告投放效果的优化是运营中推广需要解决的主要问题,利用数据分析为寻求最优广告策略提供依据

数据分析中遇到的“圆”

与十年前不同,当今令数据分析师迷茫的,可能不再是数据很少,而是数据很多;今天不是不知道玩好数据的重要性,而是不知道玩错数据的危害性,即所谓甜蜜的烦恼.一个数据分析师,如果能体会到,当下数据存在的核心问题,并且能清楚解决办法,就可以精益求精了. 这次想跟大家讲的是一个由受.想.行.识四个部份所组成生生不息的圈(Feedback Loop),彼此互相推进. 听起来有些玄乎,不过结合例子说就可能有意思了. 一.受 "受",即是对周围世界的感受 当前,作为一个电商,去感受公司经营状况的方式越来

数据分析中会常犯哪些错误,如何解决?

错把相关性当成因果性 correlation vs. causation 经典的冰淇凌销量和游泳溺水人数成正比的数据,这并不能说明冰淇凌销量的增加会导致更多的人溺水,而只能说明二者相关,比如因为天热所以二者数量都增加了.这个例子比较明显,说起来可能会有人觉得怎么会有人犯这样的错误,然而在实际生活.学习.工作中,时不时的就会有人犯这样的错误. 举个栗子 数据显示,当科比出手10-19次时,湖人的胜率是71.5%;当科比出手20-29次时,湖人的胜率骤降到60.8%;而当科比出手30次或者更多时,湖

数据分析中会常犯哪些错误,如何解决的?

错把相关性当成因果性 correlation vs. causation 经典的冰淇凌销量和游泳溺水人数成正比的数据,这并不能说明冰淇凌销量的增加会导致更多的人溺水,而只能说明二者相关,比如因为天热所以二者数量都增加了.这个例子比较明显,说起来可能会有人觉得怎么会有人犯这样的错误,然而在实际生活.学习.工作中,时不时的就会有人犯这样的错误. 举个栗子 数据显示,当科比出手10-19次时,湖人的胜率是71.5%;当科比出手20-29次时,湖人的胜率骤降到60.8%;而当科比出手30次或者更多时,湖

优云运维:漫谈redis在运维数据分析中的去重统计方式

今天,我和大家分享下redis在运维数据分析中的去重统计方式.为了避免混淆,本文中对于redis的数据结构做如下约定: SET:saddkey member ZSET:zaddkeyscoremember HYPERLOGLOG:pfaddkeyelement STRING:setbitkeyoffset value 名词约定: 维度:比如版本.操作系统类型.操作系统版本.运营商.设备型号.网络类型等 复合维度:由两个或多个维度交错产生的维度,比如某个版本下的某个设备型号. 去重统计在数据化运维

云计算已在大数据分析中发挥重要作用

大数据并不是实时vs.批处理的问题.正如Ovum的分析师Tony Baer和其他一些分析师所指出的那样,这不是一个非此即彼的问题.鉴于现如今的企业用户在制定一套成功的大数据战略方面有着广泛的选择和大量的工作负载,上述分析师的论断也并不奇怪或有什么值得争议的. 更具争议性的话题是,虽然也许并不令人感到惊讶,是从被需要用以获得大多数大数据的基础设施中获得其性质.例如,AWS(亚马逊Web服务)的数据科学主管马特·伍德警告说,虽然"分析是会令人上瘾的,但如果你企业的基础设施跟不上的话,这种积极的上瘾会

有些数据分析中常踩的坑,当心别掉进去

错把相关性当成因果性 correlation vs. causation 经典的冰淇凌销量和游泳溺水人数成正比的数据,这并不能说明冰淇凌销量的增加会导致更多的人溺水,而只能说明二者相关,比如因为天热所以二者数量都增加了.这个例子比较明显,说起来可能会有人觉得怎么会有人犯这样的错误,然而在实际生活.学习.工作中,时不时的就会有人犯这样的错误. 举个栗子 数据显示,当科比出手 10-19 次时,湖人的胜率是 71.5%;当科比出手 20-29 次时,湖人的胜率骤降到 60.8%;而当科比出手 30

J2ME学习过程中的一点心得整理

过程|心得   关于MIDlet的生命周期 当MIDlet被应用程序管理器成功地初始化之后,就开始展开了它的生命周期. 基本上MIDlet有三个状态:停止状态(Paused),激活状态(Active)和消灭状态(Destroyed).  MIDlet的生命周期完全由应用程序管理器控制,只有当应用程序管理器认为MIDlet的状态必须改变时,才会调用相关函数. MIDlet一开始一定是先进入停止状态,然后应用程序管理器再将他转换为激活状态,然后调用startApp(). 以激活状态来说,应用程序管理