昨天的虎嗅F&M创新节的“如何洞察用户:阿里与宝洁的大数据实战”专场里_a href="http://zdb.pedaily.cn/Enterprise/阿里巴巴/" target=_blank>阿里巴巴数据委员会会长车品觉、宝洁中国市场研究部总经理李霈、英特尔中国研究院首席工程师吴甘沙和股票雷达创始人冯月聊到一个很有趣的话题:作为传统公司,宝洁很羡慕阿里能够轻易收集到真实、实时、全面的的数据,但车品觉却说,大数据公司对数据处理同样存在两个难点:
第一大数据太大,大数据公司跟传统公司一样需要做“采样”的工作〿/p>
第二是很难还原真实需求。“用户研究上来讲,大数据给予的力量就是还原用户的真实需求。”但今天没有一个还原是完整的。尤其是无线的出现,是增大了数据的断裂。“场景在变,以前有一部PC锁定了你的位置。今天移动来了,你们的场景变化非常大,你是从一个电影院出来,还是刚吃完饭出来,整个场景变化是非常大的,所以它所收集数据背后的原因跟场景非常不一样,这也让底层的数据变得不一样。‿/p>
他还说到_a href="http://news.pedaily.cn/industry/互联罿" target=_blank>互联罿/a>大数据跟传统公司收集的用户数据的一大不同是,不是用数据来判断事情的未来怎么样,而是后面能不能找到他的回路。“可能我第一次判断是错误的,但是有足够的数据告诉我是错误的。我们要非常快速的收集错误,把原来那个东西去做改正,同时想怎么样收集的更精确,如何收集他的更多的情景。‿/p>
对话实录如下_/p>
吴甘沙:大家好我是来自于英特尔的吴甘沙,一直在做大数据。大数据经历了几个阶段:
第一个阶段叫瞪眼阶段,数目是让人瞪大了眼睛。IBM诿0%的数据是过去两年产生的,IDC说现在有多少折字节的数据,英特尔朿a href="http://news.pedaily.cn/industry/互联罿" target=_blank>互联罿/a>一分钟产生了多少数据,谷歌说我们现在一天产生的数据超过从人类文明曙光开始到2013年产生的所有数据,所以这是第一“瞪眼时代”〿/p>
第二个是定性时代。第三个时代是理念时代〿/p>
第四的时代是“迷糊时代”。所有人都在说大数据,但是所有人都不知道大数据该怎么做。今天我们很荣幸请来了两个明白人_a href="http://zdb.pedaily.cn/Enterprise/阿里巴巴/" target=_blank>阿里巴巴集团副总裁数据委员会会长车品觉先生,另一位是宝洁中国区市场研究部总经理李霈先生。我们希望两位帮大数据做正本清源〿/p>
请两位花几分钟时间讲讲你心目中的大数据和用户洞察是什么?
大数据的力量与难点:真实的还县/p>
李霈:我是李霈,是宝洁公司市场研究部的,今天很高兴参加这个活动〿/p>
对我来讲,我们有很多传统的研究消费者的方法也有很多新的方法,传统方法更多的基于用户的问卷和结构化的数据,而新的方法更多的是基于非结构或者大数据观察消费者的行为的内容〿/p>
大数据时代确实给我们带来了很棒的变化,我个人觉得有三点,真实性、时时性和全面性〿/p>
车品觉:用户研究上来讲,大数据给予的力量就是还原用户的真实需求。还原一个真实的需求之后才知道怎么利用这个数据做最终判断〿/p>
这点说起来很容易,做出来很难,过去讲数据化运营,就是用数据做出一个判断,帮助企业解决一些问题。企业的问题可能是要研究用户的未来的需求,所以要去用数据还原,还原过程中发现真正的数据不够,所以会去找体外的数据,用这个数据得到一些新的结论,我认为这就是大数据的力量〿/p>
大数据的难点就是怎么样才叫“真实的还原”。因为没有一个还原是完整的,尽量用今天有的一些数据、以及其他人的数据帮助我们达到这样的一个数据储备,最后才可以用数据〿/p>
吴甘沙:大数据应该是帮我们把消费者还原成一个人。不能单独隔离他的某些行为,而是要看他的整个生活环境和生活背景〿/p>
车品觉:我最近常常举一个例子,比如我在路上看到一个人穿一个T恤很好看,上班以后我在淘宝上搜,淘宝不知道我是路上看中的,所以背景的还原不是足够的〿/p>
吴甘沙:您希望任何一个动作发生以后,您能够还原他所处的语境,甚至这个动作以前一系列的联系的语境〿/p>
车品觉:尽量〿/p>
有技术就能用全量数据?一样要采样
吴甘沙:大家知道宝洁是人类历史上最早开始实践商业智能的公司,到现在差不夿0年的时间了。在现在这样一个大数据和互联网时代,商务智能被赋于了什么样的新的含义?
李霈:宝洁在过去几年里,从组织架构上有专门的团队来做这方面的工作,大数据也都应用在日常的工作进程中。一方面我们会和很多第三方平台合作拿到大数据,另一方面也在打造我们自己的大数据。比如宝洁中国有一个生活家的俱乐部,现在为止有1500万的会员,我们收集了他们的信息,这对我们来说就能更好的服务他们〿/p>
我们不光是希望有一些短期的回报,比如通过数据做一些精准投放,我们还期待能利用这些数据做一个长期的观察,长期增加用户黏度和增加购买力,希望建立一种一对一的、很亲密的恋人式的关系,更好的服务他们〿/p>
另一方面,怎么样用大数据了解消费。不光是大数据,包括互联网技术,对我们来说都带来了非常大的机遇,在洞察用户的真实性、时时性和全面性上〿/p>
我本人负责婴儿护理品类,我们拥有中国最大的纸尿裤品牌邦宝士,我们跟消费者接触的时候,发现现在妈妈时间很少,传统的方法很难跟她们交流。最近我们用微信跟她们交流,发现在那上面妈妈可以用碎片的时间跟我们交流,可以发图片,发视频,而且她们在一起聊天很热烈,几天之内就是几千条的信息,几百个图片和视频。她们甚至会在半夜给孩子喂奶的时候突发感慨发大段的信息给我们。这让我觉得很激动,这是真正利用数字技术深入到她们的内心〿/p>
还有一个就是全面性。这是大数据对我们来说非常有帮助的地方。传统的调研方法上,由于成本和操作性的限制,只能选取一些代表性的人群和地点做代表性的抽样,不够全面。比如我想了解江苏盐城和广东肇庆消费者选择洗发水有什么不同,传统的方法很难做到。大数据就可以。去年我们和百度合作,通过分析消费者在不同城市搜索的不同,来研究他们对产品的喜好,并且应用到我们的分销和营销的角色过程中,这能保证在那个城市的消费者能够用到他们所喜爱的产品〿/p>
另外我们对产品的测试,以前也是只能选取某一些消费者来倾听反馈,其他的消费者就不知道了。最近一年通过电商平台,我们够做到对每一个产品都能收集很好的评价和反馈,帮助我们对每一个产品的改进和创新〿/p>
吴甘沙:车总我知道您以前在传统行业做,圿a href="http://news.pedaily.cn/industry/银行/" target=_blank>银行,电信,现在也是在最前沿的互联网。刚才霈总说真实性、实时性、全面性,你肯定都能掌握。您觉得有没有一些传统的数据分析工具或者是理念、或者是方法论,是现在大数据的场景下可以借鉴的?
车品觉:阿里大数据做了几年。其实对大数据也是需要采样的,不可能所有数据都用。我们是在努力把东西变得实时,但我们的仓库里很多数据还是T+1的,实时性今天也不是很多做大数据公司能完全做得到的。全面性就更难做得到了。所以采样什么时候都需要做,不是说传统行业需要采样,我们做这个行业大数据公司就不采样了,还是会采样,而且面对的问题也是一样的。线上线下唯一的分别是,我们在数据足够的情况下还是以观察为主,不会轻易的问消费者,你准备得怎么样〿/p>
淘宝不管有多么大量的数据,也不可能知道用户不在淘宝的时候在哪里。类似这样的例子还是要用抽样的方法给到我们答案的〿/p>
交易批量数据而非个体数据,保证安兿/span>
吴甘沙:车总讲的非常有料,所谓的全量数据,第一有没有全量数据?第二是不是处理得动?还是要经过采样。第三数据精确性还是很重要。大家知道传统的类似于淘宝这样的,有一丿a href="http://news.pedaily.cn/industry/零售/" target=_blank>零售商很厉害,沃尔玛。他们有一套非常厉害的大数据系统,能够时时的跟上下游供应商分享数据。现在大数据时代,大家都哭着喊着说没有数据,阿里是数据大户,现在都流行打土豪,我们没数据,阿里有数据,大家都说数据要分享,我想听听车总,现在阿里关于数据分享这块有什么样的动作和理念_/p>
车品觉:分享的时候,即使是在我们公司内部分享,都要想数据分享过程中是否安全,安全作为数据开放的一个保障是很重要的。另外当我们讲到数据开放的时候,就要包括责任。数据玩起来要对社会负责任,不能说因为玩起来了对数据不负责任。我们是数据的保管者,要做好报隐私的责任,我觉得将来越来越多的人会提到这个观点的〿/p>
吴甘沙:共享和数据安全是是对立的,大家知道美国历史上信息自由法案出来之前,政府也是拿了很多安全的理由搪塞对数据共享开放的要求。据我所知阿里也有数据安全委员会,会不会拿这样一个挡板防止数据共享?另外,刚才您讲到了关于很多个人的数据,沃尔玛那个是反应的更多门店聚合的数据变化趋势,在这块,我知道阿利耶有类似的产品,这块有没有更多的共享_/p>
车品觉:应该会越来越多。比如某公司收集朿000个人类似的行为,这个数据被另一个公司买去做数据上的分享和研究,是会的,但是绝对不会精细到一个个人的层面。即使美国他们做事情也是非常小心的〿/p>
阿里有安全委员会,我们安全委员会在阿里来讲更多的是平衡开放后的利益和风险。大数据层面很难给出一个答案说这个可以,那个不可以。但是有一个比较重要的是个人的数据只能给到个人〿/p>
吴甘沙:我注意到一家企业是聚信力,通过个人登陆淘宝网站,把他的交易记录取下来,作为信用的记录,所以淘宝是允许这样的做法的〿/p>
车品觉:从我的角度来讲,如果一个人说保管我的数据,现在要把保管好的数据交给我,我觉得是可以的,因为是我要的是我的数据,没有个人隐私问题。如果说我拿了数据以后给了第三方能不能帮我做数据分析?我觉得应该是可以的〿/p>
吴甘沙:今天跨界对谈还有一位嘉宾,冯月先生他是做雷达生意的,是做股票雷达的,下面三位嘉宾可以互相发问〿/p>
大数据的ROI无法从公司分解?
冯月:我们股票雷达是一家大数据公司,给股民提供实实在在的服务。从创业公司来讲我们算是一个在数据方面投入比较大的公司,我们有上百台服务器。我的问题是,这种大数据对企业来讲,怎么看待ROI?这个ROI的投入是指的大数据研发,包括运维上的投入,而产出并不是销售多少,而是销售过程中的提升量。比如淘宝通过大数据成交量仿00亿提高到400亿,我指的是提高的那100亿〿/p>
我们看到现在的大数据从每一个公司作为战略层面讲一定要实施,像傿a href="http://zdb.pedaily.cn/people/盛刚/" target=_blank>盛刚才提到可以三年不考虑收入,但是你不能永远不考虑收入。像偿a href="http://news.pedaily.cn/industry/搜索/" target=_blank>搜索,三年之后大量的大公司都说要砍掉自己的搜索,比如人民搜索_a href="http://zdb.pedaily.cn/company/微软/" target=_blank>微软也在考虑是不是要砍掉Bing。我们实践中不知道二位目前的ROI是怎么样的情况_/p>
李霈:ROI最终还是要看投入产出比,我们目前不会更多的考虑投入产出,大数据投入对我们来说还不够,还需要很多这方面的信息。另外大数据很大,可以反复的挖掘,所以价值争取做到最大化〿/p>
第三点,从挖掘大数据,短期回报以外更多的还是希望找到消费者的洞察,对宝洁来说,消费者洞察是无价的〿/p>
车品觉:这个问题本身是有一些问题的。我们讲ROI,如果在一个决策层面上是非常难分解一个ROI的,做大数据的过程中有很多东西在整个链条里,非常难说加了大数据而有了这个ROI。特别因为大数据生产出来的原材料和新数据,对公司有什么影响?这是比较微观的。比如今天我们的推荐系统里会出现一个新的原材料,叫购物性别,实际上不用原来的性别,是购物的性别,所以那个推荐系统增加了两个点的提升。这两个点的提升等于多少的价值,所以这是ROI。但是很微观的地方才能讲ROI,讲到宏观的地方很难讲ROI的〿/p>
吴甘沙:霈总和车总家大业大,考虑的问题跟初创公司不太一样,现在两位的讲法是数据越多越好,同时选对的数据并不是所有的数据都需要存下来〿/p>
车品觉:但是有些数据是可以做的很聪明的,比如小公司利用搜索可以爬到他的邮件,也可以做大数据的营销这是很聪明的做法。从大公司来讲,不是说我们不做小的东西,其实很多大的创业都是很多小创业在后面推动的〿/p>
李霈:我对阿里大数据非常好奇。开玩笑说,我作为一个从亿5年市场研究人员来说,做梦都想到阿里大数据海洋中畅游一翻的。在阿里除了我们看得见的大数据应用,比如说产品推荐、排名、同样买了这个产品的人还买了什么其他的产品,有没有一些在我们看不到的地方,阿里着重去收集消费者的数据,特别是消费者洞察方面还有哪些呢_/p>
车品觉:最近我看得比较多的是场景,比如用户购买的时候在移动场景和不是移动的场景的区别。无线已经是很大的占比了,新的用户行为已经开始了,新的用户行为是在移动的时候他的行为跟以前不一样〿/p>
李霈:有的时候我们光看购买最后的结果并不足够,而是整个购买的行为包括他所在的场景串在一起才能给我们真正带来消费者数据,这个非常有启发〿/p>
吴甘沙:车总您对李霈总有没有什么问题?
车品觉:其实也不是问题,应该说从物联网出身的分析师,或者做大数据的,一般来说对采样不是很理解,虽然是我们也有一些部门在做一些事情。所以我想知道的是从一个传统抽样的做法来讲,从他们的角度来讲,有什么大数据的东西是特别需要的?如果我们数据放开给你们用,会对哪些数据特别感兴趣_/p>
李霈:我个人觉得,对我来讲最有用的,可能是怎么把数据变成很好的消费者洞察,再从洞察变成实际的行动。我们有时发现一些随机的相关数据时会非常激动,但是最后不一定知道到底怎么用这些数。比如不同星座的人可能对这个兴趣不一样,但是真正用就不知道了〿/p>
过去实践中,我们也觉得对我们来讲最重要的还是要把数据分析和公司的资源合在一起。你拥有哪些生产线和执行力是怎么样的,比如我们的产品线有高、中、低端,我研究消费者,希望看到三个层面的消费者行为和平时的做法有什么不同。研究这样的变化对我们公司实际行动是非常有意义的。所以如果看到阿里数据,如何和我们公司目前的运作方式模式合作起来,能够看到我们在哪些地方有更好的改进〿/p>
车品觉:霈总和我们的理念有一个地方很不一样:互联网大数据更注意的点不是我能不能判断这个事情怎么样,而是我后面能不能找到他的回路。可能我第一次判断是错误的,但是有足够的数据告诉我是错误的。我们要非常快速的收集错误,把原来那个东西去做改正。这点是大家在理念上非常不一样的地方,因为互联网很多东西都能收集,所以我做的时候要同时想怎么样收集的更精确,如何收集他的更多的情景〿/p>
吴甘沙:时间有限,请三位嘉宾用一句话总结一下你们对大数据的期待和看法〿/p>
车品觉:还是想跟大家说的是,无线的数据越来越重要。我们要花点时间去想想,当无线的出现对整个大数据有什么影响?大数据底下的数据已经产生了非常大的断裂,如果今天不去思考,无线会影响数据源的收集,原来PC为来源的大数据和无线为中心的大数据采集点,它们之间有什么变化,这都是需要思考〿/p>
场景在变,以前有一部PC锁定了你的位置。今天移动来了,你们的场景变化非常大,你是从一个电影院出来,还是刚吃完饭出来,整个场景变化是非常大的,所以它所收集数据背后的原因跟场景非常不一样,这也让底层的数据变得不一样〿/p>
今天还有另一个点就是我们要观察,有一些数据其实过了一段时间就没用了,有些数据永远要收集,你怎么做判断?
李霈:消费者是老板,我希望用大数据的方法把老板的服务的更好。大数据很美,但是怎么用确实很难,我希望跟业界同仁一起研究、探索,更好的把这个东西用起来〿/p>
冯月:我觉得未来大数据会落地,落到各个行业。之前看到大数据都是在销售领域,比如淘宝利用大数据提高销量,或者每一家企业我们看到网络上现在创业公司十家做大数据的,有七家是做社会化营销,精准投放的。我们觉得未来大数据会慢慢的应用于各个行业,比如说帮助生活更加智能,帮助个人健康系统更加智能等等〿/p>
吴甘沙:从几位嘉宾听过来,大数据应该真正解决我们的问题,大数据需要接地气,大数据不是宏观的行为,我们更多的应该是关注小数据,关注对每一个用户的行为改变,以及对他的洞察。谢谢各位,今天关于大数据行为洞察对话到此为止。谢谢!