莫被忽悠 六问题揭露谁是大数据伪砖家

生火这一技术的由来在过去的一百万年间都很有趣,但是黑夜的结束,冬季的温暖以及炖出来的第一罐汤才真正改变了一切东西!

我最近读了一些“大数据”方面的文章,发现了这个最新的科技泡沫中迷惑但是完全可预测的趋势。由于大数据很热门、时髦、并且性感,表面上看很有趣。每个人都加入进来,跃跃欲试,好像他们是专家一样。如果这让你开始觉得像是知识分子在Facebook上关于国际政治的演讲一样,这绝非意外。在大数据的讨论中掺杂的专业知识和经验,与Facebook上关于政治的空话一样。

我想我可能会帮你判断自己的大数据专家到底是不是真正的专家。看看下面的这些言论对你来讲是不是很熟悉呢。

1.他们谈论的都是”大“和”数据“,而不是 “新问题”

看上去好像整个科技行业都沉浸在 “大数据”之中。所有人都在讨论它,刚刚成立的公司如雨后春笋般出现,LinkedIn上99.9%的简历都包括”数据科学家“这个词语,然而人们并不清楚这个词语真正的意义是什么。

确实,大多数的公司在并没有太大的商业价值的硬件和软件上投入了大量的钱。这并不奇怪。”大数据“对于发生在我们身边的变革来讲是个糟糕的名字。这与”大“无关,与”数据“也无关,而是与新问题有关,接触海量的数据的方便性更促使了新问题的产生。去年我听过Klout网站(一个评价影响力的网站)的技术主任做的一个报告。他提到,他们的数据库有1.3万亿行的数据,就像是他们那里有那么多人一样;也智能如此吧。

如果你现在问的问题还是以前-----有没有更多的数据这种老问题,那并不是在做“大数据”,而是在做”大的商务智能”,这个词语本身就是矛盾。

  2.他们谈论的是技术,而非商业

有一天有个人问我,“Hadoop 对数据归档有什么影响”。 Hadoop是一种工具,大数据是一个商业现象。很多人认为Hadoop是一种解决方法,大数据仅仅是在档案中蹲坐着的数据。错误的信息和销售宣传使人们迷失其中。

很容易这些人就陷入了速度和容量、特性与功能的讨论中。这项技术是由工程驱动的,没有什么比填的满满的的规格表更能引起我们这些工程师兴奋了。如果你是一个谨慎的CFO;世界上没有比一个招人嫉妒的软件架构师更昂贵的了。

很多企业现在问了在大数据中投入了这么多的资金,也要问了,“价值在哪儿?”好吧,如果你不将自己的项目聚焦到对商业问题的理解和解决上,那么你的项目所研究的出来的结果不大有可能是解决商业问题的方案。

你可能会建成世界上最大的云服务商,但是除了留给自己一点自夸的东西,谁又关心这个呢?从一个商业问题开始,弄清楚怎样将问题数据化,然后利用科技找到解决方法。

3.他们关心大数据更内在的东西,而不是行动

我合作过的很多机构将数据分析作为结果,完全忽视了大数据的重点:行动。你可以构造出世界上最大的云结构,将其填满最干净的数据,用最好的数学模型模拟,产生令人惊奇的见解。如果这些工作做完了之后,你还没有改变公司的行为方式,你的产品和服务可以帮助你的顾客做些什么呢,或者你是怎样关怀周围的世界的呢。终归到底,你会彻底失败。

大数据不能仅仅是新的见解,它必须是新的行动和新的结果。我并不是LHC的痴迷者,这个人类历史上最大的科学实验,最近确认了上帝粒子(Higgs粒子)的存在。然而,如果Higgs的知识没有赋予这个粒子一些意义,我们都将继续质疑在LHC上花费的数十亿美金是否值得。

洞察力很重要,但是行动才是养家挣钱的来源。如果你的“大数据专家”在提出新见解的路上乐此不疲,而不是想法设法创造新的商业成效。那你是在经营一个科学实验了。

  4.他们讨论的是结论,而非联系

如果你已经从花费在大数据的努力中得到分析性结果了,你的“大数据科学家”在谈论的是“结论”,这一波的大数据专家很多并不理解联系和诱因之间的细微差别。两者看上去是一样的,然而涉及到行动时,这区别可大了去了。联系意味着在各事物之间有着存在着表面上的关系,预示着某个特定的输入也许会引起某些特定的结果。但是,在“联系”中不存在确定性。诱因就不一样了

只要记住,近似永远都是近似。

这对喜欢绝对的商业人士来说是当头棒喝;至少他们想要看上去是绝对的过程。好吧,在分析学中没有这样的事情。你的数据可能代表着一堆事实,但是分析学和统计学就如同剧院一样。你看到的不一定总是你得到的。确实,许多“数据学家”更倾向于是“数据操作工”。为支持某个议会给出政策上可接受的结果。

联系不能成为诱因。任何告诉你找到诱因的大数据专家应该被马上质疑直到其他方面证明他没有骗人。

5.他们讨论的是数据质量,而不是数据有效性

我看到花费在数据质量问题上的笔墨越来越多。你在用好的数据吗?你怎么知道,你怎样净化数据的呢?这些都是在数据库和业务智能联合论坛上的问题。数据质量是一个问题,在那么多的垃圾流进流出后。但是关注净化数据只是数据库的思维模式中的一部分。除此之外,还有一个价值数百亿美金的行业。他们关注提取-转化-上传这个整体,有这种思维模式的商人挣扎在将数据与现实世界联系起来的路上。

尽管数据质量重要,数据有效性更重要;我究竟有没有回答我所提出的问题的有效数据呢?通常,答案会是“没有”。除非你问的是一个你们公司已经问了好几十年的老问题,这样的话,又何必问呢?

如果你问的是新数据的新问题,你怎样直到那些数据是好的,哪些又是坏的呢?你又将哪些数据定义为“干净”的,哪些又是“脏”的呢?直到你开始研究这些由新的分析产生的新结果,进而才能发现这些结果是好的还是坏的,你怎么可能在输入数据的时候定义哪些是干净的,哪些是脏的?

再一次,这是老套的跳出数据库/业务智能行业思维的方式,而且与新开发出来的大数据的领域不合适。许多分析都需要有效的数据,但是在判断数据是否有效前就问这数据是不是干净的是无论怎样都没有意义的。

6.他们听上去跟其他讨论大数据的人说的一样

我们被埋没在大数据的噪声中。确实,是需要一些人来研究大数据的真正意义。更多的,我听到的是同一个课题被一再的重复;只是被误解、被引错,要不就是在推动产品或服务的名义下变态发展。

这令人感到羞耻,因为大数据的背后是社会行为,而且将会一直这样。如果你的大数据专家不谈论这些数据背后的社会,行为模式,政治和经济的话,那你就错失良机了。这个技术很有趣,但是也只是一个找到更有意义的结论的方法。

生火这一技术的由来在过去的一百万年间都很有趣,但是黑夜的结束,冬季的温暖以及炖出来的第一罐汤才是真正改变了一切东西!

如果你的“大数据专家”不能明白这个,那他们永远也不能明白了,你也是。

本文作者:佚名

来源:51CTO

时间: 2024-09-10 06:19:11

莫被忽悠 六问题揭露谁是大数据伪砖家的相关文章

别被忽悠了, 6个问题揭露谁是大数据伪砖家

生火这一技术的由来在过去的一百万年间都很有趣,但是黑夜的结束,冬季的温暖以及炖出来的第一罐汤才真正改变了一切东西!我最近读了一些"大数据"方面的文章,发现了这个最新的科技泡沫中迷惑但是完全可预测的趋势.由于大数据很热门.时髦.并且性感,表面上看很有趣.每个人都加入进来,跃跃欲试,好像他们是专家一样.如果这让你开始觉得像是知识分子在Facebook上关于国际政治的演讲一样,这绝非意外.在大数据的讨论中掺杂的专业知识和经验,与Facebook上关于政治的空话一样.我想我可能会帮你判断自己的

发改委:六方面发力大数据 2020年数据产业将占全球20%

中国大数据产业峰会暨中国电子商务创新发展峰会昨日在贵阳开幕.国务院总理李克强出席了开幕式. 国家发改委副主任林念修在论坛上表示,两年来,中国政府为了推动大数据.电子商务.互联网+等领域发展,先后出台了一系列政策举措,信息经济迎来了快速发展的黄金时期.2015年中国信息经济规模已经超过18万亿元,电子商务交易额超过20万亿元,数据总量已经超过1000亿,占全球数据总量的13%,据预测,未来5年中国大数据产业规模年均增长率将会超过50%,到2020年中国的数据总量将会超过8000亿,占全球数据产业的

大数据,小数据,哪道才是你的菜?

美国著名科技历史学家梅尔文•克兰兹伯格Melvin Kranzberg曾提出过大名鼎鼎的科技六定律其中第三条定律是这样的[1]"技术是总是配"套"而来的但这个"套"有大有小Technology comes in packages, big and small". 这个定律用在当下是非常应景的.因为我们正步入一个"大数据big data"时代但对于以往的"小数据small data"我们能做到"事了

【独家干货】金融大数据的法律实践

内容摘要 首先,王新锐简要分析了大数据时代用户数据的价值,并就用户个人信息的分类及处理环节进行总结,提出个人.监管者.媒体对此的关注点. 之后,王律师以立法框架.实际案例和业内实践三大部分为线索,通过"2014年3·15曝光鼎盛.大唐红旗等生动案例具体解释前期提到的各项相关法律条文,并分享以"数据脱敏.数据整合.内部隔离"为代表的业内最佳实践经验. 演讲全文: 今天我讲三大部分: 第一,概述.概述是为了让大家知道我们后面讲的东西是为了什么,把大家放在一个语境里,我们要把基本的

全球最性感的30家大数据公司

"不性感的大数据公司都不会成功."中国第一家大数据资产运营商--九次方大数据公司创始人王叁寿说. 关于"性感"与公司或产品的关系,乔布斯也有同样的看法: "你知道公司现在的问题是什么吗?公司的产品外观非常糟糕,没有一点性感美学元素在里面."乔布斯在1998年苹果的一次会议中也曾用"性感"一词诠释如何设计一款具有吸引力的产品. 一家"性感"的大数据公司,应该拥有独一无二的商业模式.业内顶尖的技术.超强的可视化

大数据的人类面孔

所谓"大数据人类面孔"(The Human Face of Big Data,HFoBD),请不要望文生义,误解为与视频或图像中的人脸识别有密切的关联--虽然,"大数据人类面孔"项目的发起者里克·斯莫兰(Rick Smolan)是一位著名的摄影家. 该项目是一个全球性的尝试,旨在向人类介绍大数据对我们所有人在生活.学习.治理.工作和玩乐方式上的革命性作用.该项目将通过简单.人性化的故事和图像,展示大数据已经对我们的世界带来的改变,并预示它将在未来影响到我们的一些方式

大数据在教育领域如何应用?

数据(data),一般而言是指通过科学实验.检验.统计等方式所获得的,用于科学研究.技术设计.查证.决策等目的的数值.通过全面.准确.系统地测量.收集.记录.分类.存储这些数据,再经过严格地统计.分析.检验这些数据,就能得出一些很有说服力的结论.大规模.长期地测量.记录.存储.统计.分析这些数据,所获得的海量数据就是大数据(big data).在制作大数据时,需要严格的方案设计.变量控制和统计检验等,不然所获得的大数据就是不全面.不准确.无价值或价值不大的. 在教育特别是在学校教育中,数据成为教

大数据对六大领域的挑战

第一个挑战是大数据对人性假设的挑战. 管理学自诞生开始,就以人为对象,以人性假设为前提不断演化出各种理论.第一个提出科学管理理论的泰勒假设人是"经济人",后来梅奥假设人是"社会人",西蒙则构造了"决策人假设".自西蒙之后,又有了各种各样新的理论:战略管理.营销管理.人力资源管理等,基本都是以西蒙的假设为预设. 社交媒体的诞生,意味着人不再是抽象的假设,而是一种基于大数据的画像.依据社交媒体里个体行为留痕的数据,就可以对个体进行画像.可以认为,大数

大数据的寒冬已至,谁将倒下,谁成巨人?

对运营商而言,即便联通.电信宣称通过数据变现实现了数亿的销售收入,但如果核算下从数据采集到变现应用全过程的成本投入(包含人员),一定是一个不太乐观的数字.对BAT来说,如果把数据运营部门独立核算,情况同样如此.只是像运营商.BAT这样的家业庞大的公司,不在意当前的损益,有能力持续开展战略投入. 那么是什么原因导致大数据行业集体进入寒冬?是实体经济下行影响吗?还是大数据停留在概念炒作阶段,未进入到实际应用? 大环境确实对大数据行业产生负面影响,不只是大数据,2016年实质上还是资本的寒冬,移动互联