脱掉大数据外衣 走出大数据困境

  《企业观察报》记者 简文超

  如果要评选最近两年出现在媒体上的十大热词,大数据毫无意外会入选其中。

  然而,似乎所有人都意识到大数据的能力,但却找不到运用大数据的方法。不管是企业、政府或者其他社团组织,大数据离他们那么近,却那么远。

  “大数据成了人们竞相议论的热词,但鲜有人提及这场巨大变革中人们需要具备的能力,无数的企业及个人忘‘数’兴叹。”

  作为阿里巴巴集团商业智能部副总裁、国内大数据实践的先行者和数据观察家,拥有十几年丰富的数据实战经验的车品觉,或许是国内对于如何利用大数据这个问题最有话语权的那个人。

  “未来是大数据的时代,未来的竞争就是数据的竞争,也许,我们早该忘掉那些华而不实的喧嚣,让大数据真正从‘看’到‘用’,真正地活起来。”

  为了能让更多的人学会怎么用大数据,车品觉写作了《决战大数据》一书。在该书中,他试图呈现出自己所理解的大数据的本质以及如何才能让企业走出“用”大数据的困境。

  “作为一个跟数据打了十几年交道的人,我深深地知道,从‘看’到‘用’,再从‘用’到‘养’运营数据,本身就是一个复杂的过程。目前我们最应该做的,就是暂且忘记大数据的概念。”

  “我希望从一个实用的角度来拨开大数据的‘迷雾’,告诉每个人大数据的具体运作应该是什么样的;我们要的不是数据的量,而是有‘质’的量,这正是我写作本书的重要目的。”

  脱掉大数据外衣

  研究、实践大数据多年的车品觉,对于大数据有着自己独特的看法。在他看来,大数据就像是国王的新衣:每个人都在说着动听的话,却没有人看到那件衣服。

  “网络上有很多人在谈大数据,但是他们只会谈,不会做。那些所谓的大数据专家,根本就没有做过。”

  对于为何没有好的办法去做,车品觉《决战大数据》一书称:用数据的人不知道大数据从哪里来,做数据的人不知道大数据如何用。

  “用的人不敢用,因为大数据的真实性;做的人不知道怎么用,因为大数据的复杂性。这一问题造成的结果就是,数据量变得越来越大,而且越来越无法有效地被使用。”

  “大数据从来不是免费的午餐,伴随着大数据热潮的到来,关于大数据的一些问题也会层出不穷——大数据会夹杂着虚假信息;大数据的来源是多种渠道的,偏倚、随机的误差总是存在……”

  除了上述问题,人才的断层,才是大数据所面临的最严重的问题。

  “现在,收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据的一大命门。”

  车品觉解释,在使用大数据时,我们通常的做法是先把数据收集起来,因为这些数据在未来可能有用。不过,“未来可能有用”就注定会引发一个问题——收集数据的人不知道未来使用数据的人要做什么。

  “这时候,如果你再问收集数据的人如何才能更好地收集数据,那么,数据的使用就会陷入一个死循环。”

  在书中,车品觉举了搜索感冒药的例子,来佐证自己的这一论断,他写道:比如我在搜索引擎里面发现某个地方搜索“感冒药”的频率非常高,于是,我就断定这个地方可能出现了流行性感冒。但是,这样是否就是正确地使用大数据呢?

  答案是否定的。因此,车品觉说,生产数据的人,并没有给使用者这个数据的人一些参数,而使用者在其使用之后如果效果不好,就会面临损失。而这样的信息不对称,最终受到损害的是那些使用数据的人。

  问题就是答案

  在车品觉看来,企业如果想要真正用好大数据,需要看清楚大数据能给企业带来怎样的价值,以及它的本质到底是什么。

  “当回归到这个问题时,如果你自己都没有弄清楚,那么就算给你再多的数据,你也只会手足无措。”

  那么,大数据究竟能给企业带来怎样的价值呢?大数据的本质又是什么呢?在《决战大数据》一书中,车品觉给出了自己的理解:大数据能让企业合理地分配资源,以及带来更好的用户体验,而大数据的本质则在于还原用户的真实需求。

  “数据收集实现的是企业资源的合理分配,例如,把推荐系统做得更好,让更多的用户可以有更高的概率找到他们想要的商品,这样就能提高商品的购买率,为企业创造更大的经济效益;数据收集实现的也是顾客体验的提升,例如,便捷的搜索引擎可以使顾客更容易地找到他们所需要的商品,为他们创造更加优质的购物体验。”

  而关于大数据本质的判断,车品觉则在书中作出了如下论断:“数据的本质就是还原,这是收集元数据的关键方法,如果没有这个概念,你就不知道未来你需要什么数据,就更不懂得什么是重要的数据,到最后只会产生越来越多的无从辨别的数据。”

  在车品觉看来,数据的这一还原功能,就像是一个瞄准器,瞄准消费者的购物行为,并且以数据的形式记录下来。

  “如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。”

  阿里巴巴的秘诀

  作为阿里巴巴集团副总裁和数据委员会会长,车品觉是少数几个对阿里巴巴从IT战略转型到DT战略(大数据战略)享有发言权的人之一。在《决战大数据》一书中,他总结了阿里巴巴在践行DT战略中的经验分享给后来者。

  “当谈到阿里巴巴的数据化运营时,我首先想到的就是‘人’,我们太多的时间都在讨论我们应该做什么,却很少会反过来想如果让数据化运营落地首先要从‘人’做起。”

  因此,在《决战大数据》一书中,车品觉首先跟读者分享的,便是阿里巴巴数据化运营的内功——“混”、“通”、“晒”这三板斧。

  所谓的“混”,是指数据分析师要跟管理业务部门的人打成一片。车品觉认为,作为数据分析师,如果不和业务部门混在一起,就不会知道业务部门在做什么,“商业敏感是要靠‘混’出来的,它并不会凭空出现在你的面前。”

  “只有具备商业敏感的数据分析师,才会懂得使用什么数据来驱动公司实现经营目标,现在在公司里,我最不希望看到数据分析师长时间坐在自己的位置上埋头苦干,我更愿意看到他们和业务人员混成一片。”

  而车品觉所谓的“通”,则是指企业判断数据是否有价值的一种能力,如果做到了这一点,就做到了“通”。

  “坚持带着业务问题来观察数据或者带着数据来观察业务,兼备二者的敏感,就是做到了‘通’,有些人在很短的时间里就能判断出数据是否有价值,就是因为‘混通’了。”

  但是,想要打通数据,并不容易。在书中,车品觉提出了打通数据的三个关键点:首先是要做好数据安全工作,以保证公司内部不同职位的员工可以查看不同的数据;然后,统一不同部门的数据标准,使公司内部数据有统一的接口,避免混乱;最后,关联不同部门的数据,创造机会让数据的运营可以扩散至部门之外。

  在打通数据之后,阿里巴巴所做的便是“晒”数据。“在‘晒’数据层面上,通常是通过数据来回答这几个问题:业务好还是不好;数据如何改变可以让业务更好;如何利用数据帮助业务发现机会,甚至产生出新的商业价值。”

  “混”、“通”、“晒”这三板斧,是阿里巴巴在实施大数据战略时的核心法宝,车品觉说:它们其实是配合了数据方法论与人的修炼,能做到借事修人,让用数据的人在数据中成长,循序渐进地让每个人成为数据分析师。

  当然,这三板斧只是阿里巴巴大数据战略的内核部分。在书中,车品觉还提到了实施大数据战略所需要的外延策略,而要了解大数据的最佳实现方式,无疑是直接阅读他所撰写的《决战大数据》一书。

  数据的5大价值

  01.识别和串联价值

  能够辨别关系和身份的数据是最重要的,这些数据应该是有多少存多少,永远不要放弃。在大数据时代,越能够还原用户真实身份和真实行为的数据,就越能够让企业在大数据竞争中保持战略优势。

  02.描述价值

  描述业务的数据包括成交额、成交用户数、网站的流量、网站详细页的流量、成交的卖家数等等,我们可以通过数据对业务的描述来观察交易活动是否正常。

  03.时间价值

  数据的时间价值是大数据运用最直接的体现,通过对时间的分析,能够很好地归纳出一个用户对于一种场景的偏好。

  04.预测价值

  数据的预测价值分成两个部分,第一是对于某一个单品进行预测,第二是数据对于经营状况的预测,即对公司的整体经营进行预测,并能够用预测的结论指导公司的经营策略。

  05.产出数据的价值

  从数据的价值来说,很多数据本身并没有特别的含义,但是在几个数据组合在一起或者对部分数据进行整合之后,就产生了新的价值。

时间: 2024-10-31 09:56:32

脱掉大数据外衣 走出大数据困境的相关文章

脱掉“隐形保本”外衣券商集合理财摒弃“同质化”质疑

以自有资金参与旗下管理的集合理财产品,并首先承担出现的亏损,是券商开展集合理财业务初期的最鲜明特色. 不过,目前,这种以自有资金参与旗下集合理财产品的做法正在悄然被各券商所放弃. 统计数据显示,2009年一季度新成立的券商集合理财计划达10款,另有6款处于推广期,产品数量上已经追平了2008年全年的发行数量,但其中仅有3款产品的管理人选择了以自有资金认购,并且只有一款1月份成立的产品表示将由自有资金优先承担风险. 相反,2008年成立的16款券商集合理财产品中,有过半数产品的管理人选择了以自有资

脱掉JNI的外衣(-)

 脱掉JNI的外衣     我们都知道java是一种跨平台语言,而且是一种完全oo的语言,在本身的语言特性上也是使用非常的方便易用,所以是大多项目优先选用的一种开发平台,尤其在处理业务性比较强的系统上更是开发的迅捷便利,那么它也有一些缺憾,在处理本地方法的时候很乏力,因为我们不能够直接对内存直接操作,内存管理都是通过JVM来处理的.因此对于底层开发来说并不是一个好的选择,因此我们在涉及到底层开发的时候会用c/c++来处理,那么如果在一个业务系统中,有部分子系统需要调用底层的应用,或者第三方提供的

大数据如何走出“围墙”?

大数据浪潮的扑面而来,使得对数据的认识和利用被提升到前所未有的高度.特别是对于占据九成份额,拥有最多大数据资源的政府部门,堪称"富矿". "政府手里最值钱是土地和数据,数据是可以反复利用的,政府数据一旦释放,所产生的价值要比土地高太多."谈及政府数据的价值,贵阳大数据交易所总裁王叁寿告诉<中国电子报>记者说. 更重要的是,大数据时代,国家大力发展政务大数据,还在于其能够成为打通部门壁垒.提高行政效率.转变思维方式,是开启"智慧政府"之

走出大数据分析误区 寄云多行业工业案例树标杆

如今,数据成为企业的核心资产已经成为共识,然而到底应该如何选择适合自己的服务和产品却困扰着企业负责人.繁多的产品和方案充斥的大数据服务领域,给真正需要大数据应用的企业造成了干扰.寄云科技认为众多成功案例的落地实施,是检验大数据服务能力的不二法门. 人们往往将大数据分析与数据管理的概念相混淆.在工业行业中,大数据主要来源于传感器.PLC等设备,以秒.毫秒等频率源源不断产生,随着时间的推移变得海量的数据:ERP.CRM等IT数据,也在产生着TB级的数据.数据的管理是一门科学,它涉及数据治理.元数据管

走出JavaScript初学困境—js初学_基础知识

从开始接触JS这东西有一年时间了,心头总是有一些说不出来的苦闷.在论坛里也常常有人这么说.那么苦在何处呢?总是感觉学的不深入,一些简单的东西可以做但也是不能得心应手.能不能把这种苦再说的具体点儿呢?都说了是"说不出来的苦闷"怎么具体呀? 何为难言之隐?说不出来,不能具体,不能把问题落到实处就不能得到解决的办法.这就是难言之隐!我认为这也就是初学者的"困境".之所以要用"我认为"正好迎合了本文标题中的"心得"二字.如果能对大家有

Trifacta:大数据正在走出试验阶段

大数据正在许多企业步入一个新的阶段. 公司用已经尝试过的方式来使用他们的数据以便做出更好的决策,并发现它的作价值. 现在,他们想扩大,在分析企业的更多领域的数据方面,麻烦的是,入门是艰苦的工作. 仅仅用了半年,凭借2500万美元的新资金-对高跟鞋12000000美元募集-- Trifacta认为它可以提供帮助. "传统上,数据是会计,"Trifacta的CEO说, "越来越多的传统企业都感知的数据是一个潜在的战略优势." 到目前为止,他说,很多公司都在投资于大数据做

中小企业如何走出网络营销困境?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 感谢腾讯.百度以及千万中国网站,让中国网民开始不断地聚合,产生一种前所未有的商业价值;而这种商业价值,也吸引不同行业的中小企业主开始试水网络,希冀在这片金灿灿的新土地上挖掘自己的财富宝藏.但很多人不知道,互联网其实是一个深不可测的江湖,甚至泥潭.就像一匹雄心勃勃的骏马会感慨草原的丰裕肥沃,但是一旦陷入其中,便会发现这只是一片化骨的沼泽. 最好

高考志愿季|如何从选专业开始 科学规划走上大数据之路

◆ ◆ ◆ 导语   随着全国各省高考分数线的公布,考生和家长也投入到了报考志愿的战争中.高薪.市场需求居高不下的数据科学家正在成为众多年轻人的理想职业.那么想要进入大数据领域并成为佼佼者,如何从高考选专业开始科学规划?   大数据文摘联合数据派(datapi)策划了本期专题,针对"数据科学家"的专业成长路径,采访了清华大学徐葳教授.阿里数据专家刘智勇.哥伦比亚大学数据科学在读硕士王昱森,希望他们从各自不同的角度,给想要走上大数据这条路的年轻人选择专业提供一些参考. ◆ ◆ ◆ 数据分

大数据到底怎么学:数据科学概论与大数据学习误区

"数据科学家走在通往无所不知的路上,走到尽头才发现,自己一无所知."-Will Cukierski,Head of Competitions & Data Scientist at Kaggle 最近不少网友向我咨询如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题.由于大数据技术涉及内容太庞杂,大数据应用领域广泛,而且各领域和方向采用的关键技术差异性也会较大,难以三言两语说清楚,本文从数据科学和大数据关键技术体系角度,来说