车品觉——数据的本质就是还原

数据的本质就是还原,这是收集元数据的关键方法。

当我们在进行用户的场景还原时,必须认清数据收集的领域是什么。在不同的领域里收集到的数据,可以找到与其所在领域里不同的东西,比如,搜索引擎和社交网络(SNS)得到的数据就是不一样的。而企业首先要做的是,确认用户是不是同一个人,比如在SNS里涉及的很多信息主要都是聊天内容,如果我是做 SNS 的,我就会更多地去寻找这个人和其他人的关系。他今天跟张三聊了 3 分钟,明天跟李四聊了 5 分钟,这项数据在 SNS 领域里可以获得。但当我们要真实地还原整个人的行为的话,最好要有不同领域作为互补,这会让你掌握更多更全面的信息。

你有多大的能力知道哪些数据是同一个用户的,这是企业首先必须解决的问题。然后再去关注,收集到的数据的量这么大,广度这么 宽,价值在哪里。而当企业不清楚收集到的数据是不是同一个用户的时,那这个数据又有什么用?所以,在大数据里,最重要的还是收集人的数据。

而数据的价值,正如我们前面所分析的,必须来自场景。

对于消费者数据的收集,其中一个瞄准器就是你能否还原用户购买行为的场景。基于科技的不断进步,如果有一天 Google  眼镜成为每个人的标配,或者是有一天,我们买的每一部电脑,其本身都是跟手机捆绑的,那么这两种交叉数据是很容易获取的。

为什么场景会变得如此重要?场景是不是被准确地表达了?场景是否会成为一件事情的背景,用来还原整件事情?有一年的“十一黄金周”,我们发现很多用户使用 iPad 购物,为什么?你或许不会想到,这是因为那年的“十一黄金周”第一次实行黄金周高速公路不收过路费的政策,很多人堵在了路上,没有其他事情做,所只能以使用 iPad 购物。如果企业在分析数据的时候,没有考虑到 10月1日整个中国的高速公路都出现拥堵的这个场景,企业就没有办法还原整个场景,也就无法解释这个现象。

我还发现了一个新场景。有一天,我们研究了一些无线数据——用二维码让用户到 达我们预想让他到达的页面。我们可以看到,iPhone 手机在扫完二维码后就到达了页面,但是安卓却没有。在中国,很多装有安卓系统的手机在扫完二维码之后都无法自动跳转到关联页面。这时,安卓手机就成为用户登陆网站购物的重要场景。不管是一部 iPhone 手机、一部三星手机,还是一部其他类型的手机,手机的大小和系统的兼容性本身都能对场景产生巨大的影响。而如果我们盲目地去观察数据本身,自以为是地认为用户没有进行点击,那就大错特错了。事实上,是他点不了。

可见,有很多看似无关紧要的东西都在场景里,而在无线移动终端的世界里,这个场景又平添了很多其他的东西,这都需要我们仔细地甄别。

当我和数据分析师们聊天时,我总是会特别提醒,在研究无线数据的时候,要特别注意的是用户在每天移动的时间点和非移动的时间点里都做了什么。从起床到睡觉,有几个时间点基本是固定的,所以基本上就可以判断每个人一天的行为走势是什么。

我曾经在一次电商大会的圆桌论坛上提出了一个观点,当时与会者都很认同,就是我建议把一些以前用来观察用户忠诚度的框架,比如 RFM 模型来做收集数据的瞄准器。有什么数据能让我更好地看到 R,更好地看到 F,更好地看到 M ? RFM 是一个收集维度,个人 PC、手机、平板电脑是另一个终端场景维度,PC 能更好地收集 R,手机能更好地收集 M,这样就可以通过场景的不断变换来收集更多的数据。

现在,有一些终端的确可以收集以前收集不到的数据。以前,我们不知道一些数据的收集背景是不是移动的,但现在可以。用户做一件事情的时候是不是正在移动?他是不是在银泰百货里面?面对不同的场景,我们的框架也要相应改变。所以,现在做数据分析报告,最后的一个问题变成了:“无线变了,这个报告的结果还是一样吗?你的报告应不应该也变一下?”

我认为,数据的本质就是还原,这是收集元数据的关键方法。如果没有这个概念,你就不知道未来你需要什么数据,就更不懂得什么是重要的数据,到最后只会产生越来越多的无从辨别的数据。一旦数据多到了连你的公司都没有办法处理的时候,那么其他会处理的人、公司和国家就会把你毫不留情地挤出市场。

“未来一定是国家和国家之间的数据大战,公司与公司之间的数据大战!”信息时代催生了海量数据的出现,这个世界上每时每刻都在产生大量的数据。此时,大数据已经不再是一个单纯的概念,而是像空气一样围绕在每个人的身边,每个人都是数据的制造者。也正是因为每个人都在通过不同的设备生产着数据,使得数据更多在“量”这个维度上不断膨胀,但是,“量”的单纯膨胀却对企业真正了解一个用户的需求产生了极大的挑战。所以,如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。

在不久的将来,随着 O2O的深入和穿戴式设备的兴起,企业和企业之间必须进行更多的数据融合和交换,必须进行更多的跨行业的数据交流,这样才能更好地还原用户真正的需求,让用户在任何一个场景中都能够获得由数据带来的便利。

总而言之,更深化的数据连接使海量数据经过提炼更真实地还原了事实,也使我们运用数据科技去解码未来的需求成为可能。


原文发布时间为:2014-04-13


时间: 2024-09-28 01:43:21

车品觉——数据的本质就是还原的相关文章

大咖 | 车品觉:我们为什么要认识数据的本质

时下仿佛大家都在谈人工智能,就像当年人人都在谈大数据一样.在不同场合上,阿里巴巴的马云.百度的李彦宏及腾讯的马化腾分别谈过自己对人工智能的看法和观点.这种对话有点儿像金庸小说中的华山论剑.到底是气宗( 大数据)还是剑宗(人工智能)更有战略意义?我认为,两者是相辅相成的.经历了互联网20年的发展,我们已经积累了足够多的数据去驱动一场"智能盛宴",以大数据为核心的人工智能渐露端倪. 有一天晚上准备睡觉时,听到隔壁传来女儿跟苹果智能语音助手Siri对话的声音.我太太问我,这样正常吗?我告诉她

优易数据研究院院长车品觉:如何形成大数据生态链的闭环

5月26日,优易数据研究院院长车品觉在数博会"大数据创新生态体系论坛"上发表<如何形成大数据生态链的闭环>的主题演讲. 生态一词,是个复杂的系统;由于系统复杂,就需要协同分工.车品觉指出,谈到大数据,就会想到大数据科学家,但如果想把这件事做好,需要做数据工程的人.做数据算法的人和产品经理的共同努力. 另一个与生态有关的,是将大量的数据转化为企业的行动力.企业走向全面数据化,可以遵循以下步骤:一是关注决策的过程,加强数据分析能力;二是建立数据资源,整理数据标准;三是形成管理规

阿里车品觉:大数据时代的若干新思考

大数据究竟是什么?大数据未来将走向何妨?美好的大数据理想与现实之间还有多少距离?目前实践了些什么?遇到哪些困难?这些问题值得我们去思考.为此,阿里巴巴数据委员会联合阿里研究院<阿里商业评论>举办了一场大数据思想沙龙.邀请多位在商业世界数据第一线的实战领军人物,就以上问题展开深入的探讨. 车品觉,<决战大数据>作者.阿里巴巴集团副总裁.数据委员会会长. 不同状态的企业,对于数据的关注点不同 我们要非常注意企业所处的状态,包括企业状态和数据状态.一个企业处在不同的状态之下,对于数据的关

车品觉:数据与金钱的交易鲜有存在,但数据确实正在催生的新经济

相比之下,数据交易几乎无迹可寻,至少,数据与金钱的交易鲜有存在.这跟它"新兴资产类别"这一称号很不相称.在2011年发布的一份报告中,世界经济论坛(WEF;达沃斯的会议组织机构兼智囊)就给数据冠以这一称号,隐含的意思是,构成数据经济的,将是欣欣向荣的数据信息市场.但从当前的情况来看,数据经济基本上是一个个相互孤立的"谷仓"集合体. 交易市场缺失的原因,也是相应企业产生的原因.由于市场交易携带的各种"交易成本"--搜寻信息.谈判交易.执行合同等等,

车品觉:它是抓捕本·拉登的幕后英雄,只服务100家客户,估值却高达200亿美元!

2011年2月15日,美国海关的一名年仅32岁的情报人员杰米· 萨帕塔,在墨西哥的一条高速公路上被一群毒贩射杀. 尽管他开着防弹的SUV并且亮明了自己外交官的身份,但是15名手持自动来福枪的毒贩依然果断开枪.与萨帕塔同行的另一位探员维克多·阿维拉幸免于难,逃回华盛顿. 美国禁毒署(U. S. Drug Enforcement Administration,DEA) 虎躯一震,勃然大怒,誓死要报仇雪恨.然后却无从下手,当时毒贩手脚麻利,留下的证据太少. 他们很快求助了一家数据公司,并展开了名为Op

阿里副总裁车品觉:无数据不成活

大家好!我是车品觉. 我从6岁开始就喜欢看风水:13岁开始就跟着我家人疯狂的学习看风水.因为我希望自己能成为先知! 我心目中的先知,是表现得我先比别人知道很多事,而不是神话传说里面的那种先知. 我觉得哪怕就早三秒钟比别人知道得多一点,这都能产生价值.可惜的是,我用了二十几年的时间才知道,原来算命和风水都是大骗局. 那时我开始意识到,中国社会里最大的骗局,就是用一个非常小的样本数据,来试图判断每一个人未来的命运.这是不可能的,不管哪一个术数名家,他一生能看的房子风水都是有限的,没有办法完全概括整体

车品觉:对于大数据未来趋势的判断

光阴荏苒,2015年在跌跌荡荡中成了过去式,对于大数据的产业来说过去这一年冒出了很多新的名词.但在我看来,真正的大数据应用和市场才刚刚开始萌芽,所以我希望大家先认清一个关键,那就是所有的数据都是基于应用而产生,而数据经过釆集及整合后又再落实到自身或其他应用情境中,大数据的创新价值可以来自新连接的数据.算法或者产品本身. 过去两年大数据的成长和智能手机的有着紧密的关系,发挥了媒体.通信.社交及传感器于一体.同时IOT的浪潮又正在酝酿之中,online与offline的接合带来了更深度的数据关联,触

车品觉——忘掉大数据

忘掉大数据 我们正处在历史的转折点上,数据技术在快速变革.大数据成了人们竞相争议的热词,但鲜有人提及这巨大变革中需要具备的能力.无数的企业及个人望"数"兴叹:"大数据与我何干?"未来是大数据的时代,未来的竞争就是数据的竞争.也许,我们早该忘掉那些华而不实的喧嚣,让大数据真正从"看" 到"用",真正"活"起来.大数据的力量来自触类旁通的关联,我们以前总是用数据来证明或企图说服工作上的盲点.而如今的数据不再成为

演讲精华:车品觉“实战大数据”高峰论坛

搜索引擎如何优化? 上图中,上面是"货",下面是"人",大部分人只能看到"爆款"产品,但是有非常多的产品是无法看到的.所以我们通过优化搜索引擎,希望更多的.适合的产品展现在更多人的面前,但是效果不好.可是我们想了一个方法,在人群中先找到一个"达人"--所谓"达人"就是比比其他人更会挑选商品的人,TA们比人群中其他人的能力强,总能挑到物美价廉的商品.在大数据样本中,一般会有"达人"出现.定