数据是未来的原材料

  数据是越多越好吗?

  过去,有一个问题一直令我很困惑,现在的企业获取数据很容易,并且数据的增长速度非常之快,那么对于公司来说,到底要收集什么数据呢?收集多少数据?收集数据的边界在哪里?

  后来在美国遇到Patil,他认为过去收集数据很难,而现在获取数据资源变得更容易。但是如果收集数据的出发点,不是为了解决问题,那么收集再多的数据有什么意思呢?

  可是许多公司还有一个疑问是,现在收集数据不难,成本也不高,为什么不先收集数据再说呢?等以后需要数据来解决问题时再拿出来用也可以。Patil的答案我也很认同,他劝大家千万别这么想,用这样的理念来设计数据应用肯定会失败的。数据是没有边际的,我为此也痛苦了好一段日子。比如收集一个人的生日,可以精确到几分几秒,但这么精确的数据有什么应用,能产生什么价值呢?

  事实上,数据是有生命周期的,比如从中国身份证号码是可以推断出性别的,但是过几年如果这个规则变了,导致我们基于数据所做假设和决策依据也就失去了意义(Data Broken)。更何况保存数据及其收集时的背景(Context)也是一件不容易的事情。所以说,在收集数据的同时,我们必须知道未来可以用来做什么,今天都想不出来的话,日后就更不容易想出来了。

  打一个比方,今天很多电商老板会问重复购买率是多少,于是我们收集数据来计算重复购买率,却很少想到需要重复购买率来做什么决定。这就好比刻舟求剑这个故事,他告诉我们世事在变,我们不能只是机械的套用方法或指标。就像重复购买率有不同的定义,而做不同的决策需要不同定义的重复购买率。如果从一家投资公司的角度来看重复购买率,它想收购A公司,那么会从重复购买率来看整个A公司的健康程度或用户质量等。如果从A公司本身运营的角度来看重复购买率,那么它更关注的是日、周级别的重复购买率的变化趋势,或者当月新增客户有多少人在三个月后的重复购买,从而可以衡量每个月新增及存量客户的忠诚度和质量,找出改善的空间。知道了以上的背景之后才去选择用什么数据不是更靠谱吗?

  数据应用因小而美

  从2011年年底,我开始思考怎么从“用数据”转变为“养数据”(即数据运营转变为运营数据),这一段时间我特别为收集什么样的数据而烦恼(more data, more problem)。而且,我也曾经想做一个特别大的适合多数人使用的数据应用出来(虚火上升),可是后来发现这在数据应用的起步阶段几乎是不可能的,一是找到可以解决大部分人需求的数据应用不容易,二是支付宝的数据非常丰富,需要考虑的因素很多,因素之间的联系又很复杂。

  所以,我总结,当做数据应用的时候,数据就是等于原材料,当原材料一直处于变化的情况下,做出来的产品很容易出问题。体会数据和应用的关系之后,我最后决定从小角度切入,先做小应用出来(很好的瞄准器)。

  这里说的“小”指的是应用的目标很具体。打个比方来说,对于一款数据应用,如果我的目的是分辨两种决策谁更好,差异在哪里,是很具体的问题。但如果我的目标是想知道如何让公司赢利,就是一个空泛的目标。

  还请注意,“小”不是指数据量。许多人在没有获取足够数据,并且缺乏对数据理解的情况下做判断,其实是在享受自己的无知。

  经过一番周折之后,也是按照小角度切入的想法设计数据应用,小角度切入设计产品可以做到具体和快速,而且可以避免因原材料的变化而导致的问题。

  把数据放进“框”之中

  此外,还不得不说到一个话题,在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(情景)里面看才能看出问题。

  为了把问题说得很明白,这里我拿前阵子一家电商公司找我讨论的问题举例子。这里不太方便公开这家公司的名称,暂以A公司代替。

  A问我,要不要撤去导航网站的广告?因为怀疑许多老客户是从导航网站访问官网,而不是直接访问官网。

  把这个问题说得再直白点,就是要弄清楚在导航做广告与A公司的业务关系。

  那么,接下来要观察用什么“数据框架”,有助于做决策?

  一、A公司当前的投入产出比

  1、明确导航网站引进来的新、老用户占比如何?

  2、引入的新、老用户的投入产出比和转化率如何?

  3、推断撤去导航网站,对流失新老用户的影响?

  二、与竞争对手的博弈

  有一个问题可能会忽略,那就是你不做导航网站广告,你的对手就会立马进来。做数据框架的时候,要特别注意框架不是静态的,而是博弈的,需要把竞争对手因素算进来。

  三、考虑时间因素

  建立框时要考虑时间因素:

  1、  用现在、过去和未来的眼光来审视导航网站,看看导航的质量是不是越来越好

  2、  需要注意的是时间有延迟性,引进来的流量会有一些延迟,在两三个月后才能知道新用户的价值(life time value)。

  总之,“数据框架”是商业分析师的灵魂所在,从框中找寻问题的关键因素及答案。不同的问题有不同的框,不能完全在此全部阐述。

  如何用框架来做决定?

  对此,我总结了四步走的方法:

  第一,首先确定有什么问题,从解决问题的角度出发收集数据;

  第二,把收集的数据整理好,放入一个“数据框架”内(这个框架是用来帮助决策者做决定的)。让决策者用框更清楚地看到数据与决策之间的关系,比如A公司在框架内要知道竞争情况、新老客户比例情况等因素,以及多种因素互相的关系。

  第三,看框架与决策的关系,比如A公司与导航网站有三种选择,完全不合作,部分合作,全面合作。根据数据框架告诉A公司该怎么决策。如果发现数据框架与决策不能匹配,就必须返回到第二步。

  第四,根据决策做出行动,检查行动是否达到了目的。如果行动了发现根本没达到目的,就要检讨整个链条,看问题出在哪里。是数据有问题吗?还是因为框架不对?或者是决策不对?是否还有数据没考虑进去?

  所以,又回到之前我老说的话题,不懂商业就别谈数据。想要解决的问题越复杂,框架也越复杂。而对于现在多数还没有开始做数据应用的电商公司来说,一开始框架千万不要太复杂,一定是针对某个需解决的问题开始搭框架,令框架与决策之间的关系非常清楚。你的问题是什么,你的decison是什么,反过来你的框架又该怎么样。从小角度切入,从“小”做起。

时间: 2024-07-30 19:46:44

数据是未来的原材料的相关文章

互联网已死-大数据的未来在哪里?

一.大数据的未来在哪里 1.互联网已死 大数据的未来在哪里?以BAT为代表的互联网公司之外是否还会有新的互联网巨无霸诞生,基于技术和资本两方面的考虑,几无可能,未来的互联网世界只能是一个几家独大,行业细分的市场,新生互联网公司的机会在于细分,而不在于挑战传统互联网巨无霸.具体到大数据应用来讲,大数据在互联网行业的应用也必将是一个行业细化的过程,而BAT的触角几乎无处不在,新公司的崛起任重而道远,大数据发挥价值的空间也就变成了BAT手中的玩具. 2.传统行业才是大数据的春天 大数据向传统行业的渗透

大数据市场未来将呈现三大发展趋势

随着移动互联网.物联网等的迅速发展,新数据源不断出现,而中国数据总量的不断增长,使大数据成为一种重要资源,有利于推动零售.旅游.医疗.金融.电信.政府公共服务各个领域的业务创新. 大数据转变企业商业模式 来自于线下大数据市场(IT企业的大数据应用及大数据平台业务市场)中IT巨头和单一大数据业务的厂商开始行动,优化产品和服务路线图;线上大数据 市场(互联网用户数据市场,以及以互联网金融为主的线上金融市场)的成熟度逐渐提高,以金融和零售为核心的线上大数据应用走向成熟,市场体量进一步扩大. 企业着力培

大数据预测未来五年最热行业

日前,全球最大的职场社交平台LinkedIn(领英)基于其平台数据分析发现,十年前的热门行业现如今早已热度不再,而数据科学家.新媒体专员等以前几乎不存在的冷门职业却日渐成为时代的新宠.因此,考生及家长在填报志愿时,与其紧盯住当下最热专业不放,倒不如结合自身能力及兴趣进行专业选择. LinkedIn根据大数据对未来五年的行业发展进行了预测,总结出了八大极具发展潜力的最热行业:电商.新媒体营销.大数据服务.云计算服务.VR.UI设计.私人旅行定制和微电影策划.其中,部分行业已经成为当下人们职场热门,

大数据技术 未来发展前景及趋势分析

文章讲的是大数据技术 未来发展前景及趋势分析,在过去几年里,大数据技术已得到广泛关注.在这一领域,有几个趋势和创新正悄然发生.本文整理了您目前正在使用或未来将要使用的大数据的新趋势和变化. 流大数据分析 · Storm: Apache Storm是一种开源的分布式实时计算系统.Storm加速了流数据处理的过程,为Hadoop批处理提供实时数据处理. · Spark: Spark是一个兼容Hadoop数据源的内存数据处理平台,运行速度相比于Hadoop MapReduce更快.Spark适合机器学

数人云操作系统2.0发布 OCP+数人云或将引领数据中心未来

借鉴谷歌先进理念的创业公司并不在少数,数人云就是利用Mesos和Docker技术打造了一个轻量级PaaS.向上在PaaS层平台支撑应用管理,向下在IaaS层提供底层资源统一调度分配. Docker 技术的出现为以轻量级容器为核心的新一代 PaaS 平台提供了爆发式增长的机会,数人云正在帮助国内传统企业将新一代云技术快速落地在生产环境中. 数人云还同清华大学OCP(开放计算项目)实验室进行深度合作并开展了很多前沿的研究工作,比如在10台OCP服务器去支撑百万并发的压力.对于CPU集群的管理.将深度

"智胜数据 颠覆未来"---Informatica 数据管理高峰论坛上海见!

2017年10月31日,由 Informatica 和至顶网.锦囊专家联合举办的 Informatica 数据管理高峰论坛将在上海举行,以"智胜数据 颠覆未来"为主题,展示创新化数据管理解决方案及其变革成果,同时针对智能化数据驱动的商业颠覆性变革的动力进行探讨. 随着数字生活.智能社会的到来,释放数据潜能成为商业技术的创新性发展的动力源泉,未来商业要取得颠覆性变革,赢得新商业,就需要进一步释放数据潜能,实现以数据为驱动的数字化变革. 在这样的时代背景下,Informatica 联合至顶

10个观点 指引大数据产业未来发展方向

文章讲的是10个观点 指引大数据产业未来发展方向,大数据的"炒作"期从2013年慢慢步入成长期,2016年大数据产业还在经历蜕变.而16年也是大数据产业规模明显增长的一年.技术与应用的创新,政府需求的推动,行业应用大热都在这一年显而易见. 2016年底工信部正式发布<大数据产业发展规划(2016-2020年)>,规划的提出为我国大数据产业崛起指明了方向.其中规划目标到2020年,大数据相关产品和服务业务收入突破1万亿元;建设10-15个大数据综合试验区,创建一批大数据产业集

数据技术产品Top100盘点,共话数据营销未来与方向

2014的互动营销圈,"程序化购买"与"大数据"成为最大的热议话题.百度阿里.腾讯.谷歌.360等流量大盘的效果数据导向的广告营销在整体市场中的占比接近70%.中国互联网广告营销市场开始"数据化"."大数据化".数据营销也将在2015互动营销领域,继续发光发热.2015年1月16日,由DCCI互联网数据中心举办的"iworld互动营销世界*数据星球",携数据营销近百家企业,相聚国家会议中心,共话数据营销未来

云存储将成为数据存储未来发展方向

在云计算浪潮之下,新的存储技术--云存储,日益成为数据存储未来发展方向,随着社会的发展和科技的进步,特别是计算机和网络的飞速发展,人们对信息数据存取的大容量.便捷.可靠性要求越来越高.有分析认为,尽管云存储的发展目前仍受到一定的局限,但未来一到两年,云存储的市场空间将会放大. 云存储是云计算的重要应用,是指将团队或个人的文件或数据集中存储在数据中心而非本地,并按照实际使用进行付费的技术.广义来说还包括存储基础上提供的文件管理服务,即存储+"操作系统".目前,云存储按不同的分类标准可以分