打破谣言! 关于大数据的十个有力事实

  无论大家如何进行定义,大数据自诞生之日起就饱受争议——既有毛病之词,亦不乏诋毁之声。大数据对于很多人来说包含有重要的意义,特别是科学家和零售商家。不过这项技术的出现也引发了大量的相关隐私问题与安全威胁。

  到底是救世主、骗局抑或二者兼而有之?无论如何,大数据仍然在技术专家、趋势分析师、市场推广人士以及安全从业者群体中拥有极高的热度与人气。事实上,截至今天大数据仍然没有一个受到普遍认同的官方定义。那么大数据到底是什么?维基百科给出的描述可以说为大数据的概念确立之路开了个好头:“任何由于规模庞大且高度复杂而难以通过现有数据库管理工具或者传统数据处理应用进行处理的数据集。”

  虽然管理这种规模庞大、形式多变且对速度要求较高(这三点也就是经典的3V定义)的数据集确实充满挑战,不过目前针对这类任务的数据共享设备的数量正呈现指数级增长的趋势,而这又给大数据难题带来更多别样的变化。这类硬件被统称为物联网,其中包括机器传感器以及面向普通消费者的设备,例如联网温控器、电灯泡、冰箱以及可穿戴式健康监测工具等。IDC公司预计,物联网市场在未来几年当中将迅猛增长——其单位安装数量将由2013年年底的91亿增长到2020年的281亿。

  企业则将来自大数据的可行性分析结论视为潜在的利好消息,这不仅是因为此类结论能够帮助商家售出更多工具及服务,同时也可以更好地处理医疗事务、阻止伪劣药品流通、追踪恐怖分子甚至监控特定目标的通话内容。因此,大数据本身并没有善恶之分,真正起决定作用的还是我们的实际使用方式。

  具有讽刺意味的是,尽管大数据当中蕴藏着提升人类经验的潜在可能性,但这些宝贵的信息却往往很难进行收集、筛选、分析以及最后的解释。今天的文章着重审视大数据领域的挑战与机遇,这些事实与论证数据很可能给各位带来意外惊喜。哪些内容值得期待?这个嘛,作为大数据平台中的领导者,Hadoop的发展前景一片光明。而且数据科学家与大数据相关技术人士也将在未来几年中获得丰厚的薪酬回报。

  业内人士作出预测,认为“大数据”作为流行词汇将彻底消失。“一切的一切最终都会被归结为数据,仅此而已。大数据与所有以此为基础的预测行为都将成为由分析师以及众多‘大型’技术供应商负责的‘数据管理’工作,”Hortonworks公司总裁Herb Cunitz在2012年12月的一篇博文中写道。

  Cunitz作出的“大数据”概念消亡预测可能为时过早,他提出了很重要的一项结论,即一切的一切最终都会被归结为数据。只有管理这些信息所必需的工具会迎来变革。现在就请大家跟随我们的脚步,一同通过图文了解与大数据紧密相关的统计及研究成果。

  一、有多少数据被忽略掉了?

  大多数企业估算称,他们只对自身持有的约12%数据进行了分析,Forrester研究公司在最近的一项调查中发现。这到底是好消息还是坏消息?这个嘛,被他们所忽略的88%数据当中很可能蕴藏着足以带来数据驱动结论的宝贵信息。但从另一个角度看,他们也许明智地避免了由所谓“煮沸海洋”战略所带来的巨大资源消耗。说起企业忽略绝大多数自有数据的理由,原因主要有两点:第一是缺乏相关分析工具与“可控制”数据仓库,第二则在于他们很难确切了解哪些信息能够实现价值、哪些则最好加以忽略,Forrester公司在报告中指出。

  二、大数据相关工作岗位持续增长

  大数据掀起的狂潮对于具备特定技能的从业人员来说不啻为一大福音。根据 Dice网站(一家专门服务于技术及工程专业人才的求职网站)的统计,目前业界对于数据专家的需求正持续激增。与上一年相比,目前针对NoSQL技术人员的招聘岗位数量增长了54%,而面向“大数据人才”的岗位也上涨了46%,该网站在今年四月的报告中指出。虽然这样的提升幅度令人印象深刻,不过与网络安全专家的职位需求相比仍然是小巫见大巫——后者的同比增长幅度高达162%。

  三、大数据最终将成长至怎样的规模?

  在未来六年当中,数字化领域的数据问题将由目前的3.2 ZB(即泽字节)增长到40 ZB。(1 ZB基本相当于10亿TB。)“当我们审视即将席卷而来的数据量时,其庞大的规模真的很令人兴奋,”Hortonworks公司CEO Rob Bearden在今年于加利福尼亚州圣何塞举办的2014 Hadoop峰会上表示。“从现在到2020年,企业所持有的数量问题将以每年50倍的速度递增。我认为目前最重要的任务在于清醒地认识到,其中85%的数据来自新兴网络数据源。”包括移动、社交媒体以及Web与机器生成数据在内的这些新兴数据源将给全球企业带来重大挑战与不可错过的发展机遇,Bearden指出。

时间: 2024-08-03 17:40:21

打破谣言! 关于大数据的十个有力事实的相关文章

关于大数据的十个有力事实

无论大家如何进行定义,大数据自诞生之日起就饱受争议--既有毛病之词,亦不乏诋毁之声.大数据对于很多人来说包含有重要的意义,特别是科学家和零售商家.不过这项技术的出现也引发了大量的相关隐私问题与安全威胁. 到底是救世主.骗局抑或二者兼而有之?无论如何,大数据仍然在技术专家.趋势分析师.市场推广人士以及安全从业者群体中拥有极高的热度与人气.事实上,截至今天大数据仍然没有一个受到普遍认同的官方定义.那么大数据到底是什么?维基百科给出的描述可以说为大数据的概念确立之路开了个好头:"任何由于规模庞大且高度

大数据领域十个趋势:缺口巨大薪酬增长

在大数据时代,企业之间正在为了吸引并留住商业智能和http://www.aliyun.com/zixun/aggregation/13617.html">信息管理的专业人才而展开战争.在InformationWeek每年公布的IT从业人员薪金调查中可以看出大数据从业人员面临巨大的缺口. 现今大数据呈现出"4V + 1C"的特点.既Variety:一般包括结构化.半结构化和非结构化等多类数据,而且它们处理和分析方式有区别:Volume:通过各种设备产生了大量的数据,PB级

企业间的较量 2017大数据的十个走向

大数据发展已经成为未来科技发展的走向和必要的开端,预计2017年大数据十大新趋势走向将会迎来爆发式的数据增长. 1.大数据实现可视化服务 数据可视化技术让隐藏在大数据资源背后的真相呈现在众人面前.无论数据怎样形成,无论数据资源在哪里,图形数据可视化可以让企业组织在业务繁忙的同时对数据进行检索与处理.可视化数据不需要任何编程基础.你只需要上传你的数据,便能轻松地创建和发布图表,目前国际上已经有一些企业在发展大数据可视化做深入的研究,专门提供大数据可视化服务. 2.大数据进入资本市场 最近发数据的行

大数据双刃剑:反映事实和侵害个人信息只在毫厘之间

有一天,一位10几岁的女孩儿收到了大型超市寄来的孕妇用品折扣券.家人自然十分惊讶,觉得超市给一位10几岁的小女孩邮寄这种东西简直不可理喻.但实际上,这位小姑娘的确怀孕了.超市依据大数据,分析了这个女孩检索的关键词和购物的模式,从而判定她是一位孕妇. 最近,使用大数据进行个人和社会现象分析的例子越来越多.举个近期发生的例子,美国大选中,舆论认为特朗普以绝对优势活的胜利是异变,但大数据专家们却保守地预测特朗普多半会当选总统. 除美国外,20日韩国也出现了通过分析大数据来客观性的分析社会现象的例子.商

[重磅]清华大数据产业联合会"应用创新"系列第1讲:大数据分析(46PPT)

2014年11月26日晚,清华大数据产业联合会成立仪式在清华大学舜德楼401室召开,联合会依托于清华大学独特的师资和生源优势.清华大学多个院系和学科在大数据相关领域多年的积累与探索,联合大数据产业链中的优秀龙头企业与创新企业,旨在提供大数据产业链的思维碰撞与资源对接平台,促进产.学.研良性互动,以产业需求带动复合型大数据人才的培养,推动大数据生态系统中的各方合作共赢.会议由联合会秘书长王霞主持. 到场的嘉宾有: 清华大学杨斌副校长,清华大学数据科学研究院执行副院长.清华大数据产业联合会会长韩亦舜

2012Hadoop与大数据技术大会 精彩议题

议题 演讲嘉宾 MongoDB在大数据中的作用与最新技术发展 Paul Pedersen 10gen Deputy CTO Half life of data value. Getting instant insight when your big data is the 'hottest' Nikita Shamgunov CTO & Co-Founder of MemSQL HDFS Name Node High Availability Maheshwara Rao 华为Hadoop Co

让我们来看看跨学科对话下的大数据思辨

摘要: 8月14日,腾讯网在正院会馆举办了一场夏季思享会,而这次思享会的主题就是大数据.有意思的是,这次关于大数据的分享会请到了来自各个领域的学者和专家,是一场跨学科的思想碰 8月14日,腾讯网在正院会馆举办了一场夏季思享会,而这次思享会的主题就是"大数据".有意思的是,这次关于大数据的分享会请到了来自各个领域的学者和专家,是一场跨学科的思想碰撞.在现场的我听完了整场分享,有趣的观点不少,还有一些观点是目前国内关注大数据的人们不太提及的,非常思辨.在这里,我也跟大家分享一些来自思享会上

IDC周震刚:中国大数据市场的十大预测

2012年7月24日,主题为"芯动大数据 智领大机遇"的英特尔大数据论坛在北京举行.会上,IDC中国企业级系统与软件研究部高级研究经理周震刚分享了大数据市场的观察. IDC中国企业级系统与软件研究部高级研究经理周震刚 周震刚表示,IDC一直把大数据.云和移动以及社交这四个主题当做未来IT的主要方向.IDC在大数据方面已经做了大概三四年的研究,IDC中国从去年开始对大数据市场做了深入研究. 什么是大数据?--四个"V" 周震刚介绍道,IDC对大数据的定义是四个&quo

避免投资浪费 认清大数据的10大误区

大数据在当前的科技新闻中占据了主导地位,它被吹捧为一切问题的可能的解决方案,从入侵检测与预防欺诈,到治疗癌症和设置最优的产品价格. 但我们定义大体量.多格式.高速度的大数据,并不是能够搞定每一个问题的灵丹妙药.事实上,如果公司迷信周围的一些大数据的神话,可能在错误的方向越走越远,浪费大量的时间和金钱,影响公司的市场竞争地位,或者损害公司的声誉. 以下是企业应当知道的围绕大数据的十个最大的误区,了解他们将有助于有效地避免大数据的消极影响,并真正获得大数据带来的商业价值. 避免投资浪费,认清大数据的