管理大数据需要了解面临的挑战

如今,我们每天有多少数据处理?每年将产生多少数据?这一数字变化如此之快,每一年或两年翻一番,人们只能从知情人士获得最佳的估计数量。而这些透露消息的人士,其中大部分都是在组织中数据管理领域的杰出人物,他们所估计这个数字如此之高,这几乎让人不可能想象。根据全球市场调查机构IDC公司称,在2011年,我们大约创造了1.8泽字节的数据,换而言之就是1.8万亿千兆字节的信息。他们继续说,在2012年,我们创造了2.8泽字节的信息。此外,他们说,到2020年,我们将产生40泽字节的信息。

据IBM公司估计,我们现在每天创建了2.50亿千兆字节的数据。

这种大规模的数据集被称为大数据。大数据是已经成为非常流行的一个术语,以皮字节和艾字节表示和描述数据集,并且其有时施加到数据集的技术,并处理它的应用设置。

对于这篇文章的目的,我们将限制定义一个描述巨大的数据量。在2014年9月AIP会议议事程序中,安德列德·毛罗,马可·格雷科,米歇尔·格里马尔迪为我们提供了一个更具体的和健壮的定义:“大数据代表着这种高容量的信息资产的特征,通过各种需要特定的技术和分析方法,将其转变为价值”。

注意,这个定义是很重要的。它不仅是数据的数量,或体积,而且还有速度,也就是服务和消耗的速度。数据流已经改变了我们对存储和交付数据的看法,并放置在基础设施和应用程序引擎中,而以前难以想象要求能这样做。

一个更近的维基百科定义了“体积,速度和品种”短语,并添加到另外两个额外的“V”的概念,这两者都与大数据所面临的挑战非常相关的:变异性和准确性。

数据采集及其应用

随着互联网的出现和使用大数据的人数成倍增长,收集大量数据的能力也与之一起成长。数据收集发生几乎一样的其他计算活动的副作用。在我们采取的过程中,数据在创建帐户,上传文件,以及产生其他明显的行动。然而,数据也被无意提交收集,因为一些其它活性的副产品。一个看似私人的行为,如点击一个链接,对于营销人员就可以提供一个有价值的信息。因此,数据正在被记录和存储。并且在某处进行处理。

而计算机对于工作人员处理信息是优秀的,但没过多久,营销等行业实现保留供收集数据的大量的潜力,因为它是在网络上传来传去,最引人注目的是互联网(虽然重要的是记住很多大数据,并将其存储在企业的内部网)。当该数据与其他数据,例如人口统计信息,一个人的YouTube的喜好,地理位置,社会行为与Outlook配对,这个数据变得更加强大。

其他行业也意识到,他们在收集和处理信息方面从来没有见过这样大的规模。不仅互联网,而且企业和其他实体的内部网络可以容纳大量的信息。在美国、印度和其他地方的政府已经能够运行更精细的数据调整,以赢得选举。国际组织收集和使用医疗保健、生产力,以及就业数据,以帮助他们了解发展资金是最好的花费。私营部门在许多方面使用大数据,包括交易数据和分析。科学研究涉及到大数据分析,例如,大型强子对撞机的科研活动,以及超大型望远镜(VLT)阵列的数据返回。此外,大数据改变了制造业,通过提供生产、需求、足够的数据,分析师将了解是什么导致短缺和过剩,并对以前难以确定行为和计划进行可用性分析。

数据记录的泽字节是一回事,数据采集方便又便宜。当你认为你正在做别的事情的时候,数据收集正在发生。而我们如何利用它是一个完全不同的问题,也是任何组织所面临的最大挑战之一,从企业营销到政府部门,将考虑如何有效地使用这样大量的数据。

德毛罗等人所描述的数据的品种是大数据的关键特征之一。数据源无处不在,并收集所有类型的信息,其中一些应该被认为是敏感的,需要安全处理。随着各种各样的数据到来,这意味着来自不同来源的数据,格式和可访问性,即使是相同的信息,也可能是不同的。最后,数据的可靠性和准确性,是数据分析人员必须关注的重点。“脏数据”一直是数据库管理的一个问题,但这个问题与今天的环境指数相乘,具有更高的容量,并提供数据多源。

当它被成功地分析,大数据可以帮助科学家解码DNA,它可以帮助政府预测恐怖活动,它可以调整企业的产品结构,以满足客户的需求。

但面对这样的数据采集,持有人的问题是将如何利用它?并且越来越多,我们如何对此保证安全?

挑战和安全

如今,人们所面临的安全漏洞一直是很严重的,但大数据的安全漏洞可能是灾难性的。数据收集可以包括非常敏感和极其隐秘的个人信息,这将成为身份盗窃和恶意操纵的潜在数据。随着企业开发他们的大数据存储和分析系统,安全性必须列于他们的优先级名单的首位。

数据分析系统面临着大数据这个第一大挑战是简单的事实,系统和流程都不能处理,我们现在希望定期处理这些数据。存储基础设施相对容易创建:因为存储设备已经成为廉价和可用的,并对其挑战有着相当充分的了解。具分析和使用数据是目前正在开发的高需求,很多企业都已经建立了自己的内部数据分析:谷歌公司在2014年每天处理的信息大约20PB。

====================================分割线================================

本文转自d1net(转载)

时间: 2024-09-18 12:25:42

管理大数据需要了解面临的挑战的相关文章

浅析大数据时代信息安全面临的挑战与机遇

"世界的本质是数据,大数据开启了一次重大的时代转型,也是一场生活.工作与思维的大变革".随着世界各大国在陆.海.空.天.电.网多维度战略的紧张部署,信息技术爆炸式发展.基于大数据发展对国家.社会的组织结构和治理模式,对商业.企业的决策方式和业务策略,对个人的生活思维方式等各方面产生的深刻影响,各界逐渐开始关注"信息"本身而不只是"技术"了.在大数据时代,人类信息管理准则也将面临重新定位,而在信息安全问题日益突出的当下,大数据给信息安全带来新挑战的

大数据征信面临的挑战与对策

随着征信市场化步伐加快,大数据征信成为热门话题,受到互联网金融和资本市场的追捧.征信与大数据有着基因层面的密切关系,一方面,征信数据是天然的大数据,理论上与消费者和企业相关的数据都可以用来作征信:另一方面,征信其实就是将分散在不同信贷机构.碎片化的局部信息,加工融合成为具有完整视觉效果的全局信息,从中挖掘出风险信息,破解交易过程中信息不对称问题.而大数据技术的优势就在于能够更好地利用IT先进技术,将支离破碎的数据整合起来,形成真正有用的信息.所以,大数据对传统征信业务模式的影响将是变革性的,甚至

人大金仓:“大数据”企业应用面临挑战

文章讲的是人大金仓:"大数据"企业应用面临挑战,2013年9月2日-9月3日,2013华为云计算大会(华为HCC2013)在上海世博中心隆重召开.北京人大金仓信息技术股份有限公司(简称人大金仓)首席运营官戴钲出席会议,与来自全球的众多商业领袖.技术领袖.权威专家学者等围绕"精简IT 敏捷商道"这一主题进行思想碰撞,共同探讨云计算行业发展趋势和前沿技术及"大数据"时代云计算如何改变IT.会议期间,人大金仓首席运营官戴钲发表了题为"'大数据

IT现状调查:大数据时代 企业面临挑战

[IT168 调查报告]2012-2013中国IT技术趋势大调查活动于2012年10月16日启动,历经1个月的时间.在线调查期间,受到了来自ITPUB.ChinaUnix(以下简称CU)以及其它合作网站的网友的极大关注和积极参与.目前调查已经完满结束,所有的数据都在后台整理和统计之中.本次网上调查共回收调查问卷17,101份问卷,其中合格问卷为14,522份.从整体上看,今年的调查更专注,无论从数量上还是质量上都较去年有比较大的提高. 本次调查的内容涉及:企业信息化.http://www.ali

人们将面临大数据无法进行预测分析挑战

文章讲的是人们将面临大数据无法进行预测分析挑战,你是否认为大数据时代会有足够多的信息来支持建立强大分析,其实不然.有的情况中即便大量数据也不能保证基本预测的正常运行.多数时间,我们没有做到更多的事,所以只能默默承受这事实坚持最基本的.这是为什么我们要讨论当面临大数据不能预测分析未来的挑战时的情况. 场景一 以某家航空公司制造商举例,事物很少却有大量数据就难找到有意义的模式.运行的飞机每小时产生数据可达千兆字节,发动机在不同条件下操作,分析操作数据好处很多.像是预测性维护,对于分析行为来说或许困难

大数据对六大领域的挑战

第一个挑战是大数据对人性假设的挑战. 管理学自诞生开始,就以人为对象,以人性假设为前提不断演化出各种理论.第一个提出科学管理理论的泰勒假设人是"经济人",后来梅奥假设人是"社会人",西蒙则构造了"决策人假设".自西蒙之后,又有了各种各样新的理论:战略管理.营销管理.人力资源管理等,基本都是以西蒙的假设为预设. 社交媒体的诞生,意味着人不再是抽象的假设,而是一种基于大数据的画像.依据社交媒体里个体行为留痕的数据,就可以对个体进行画像.可以认为,大数

大数据执行的机遇、挑战与应对

文章讲的是大数据执行的机遇.挑战与应对,如今,我们生活在一个大数据时代,大数据深刻影响着社会生活的方方面面.大数据应用到人民法院的执行工作当中,给执行工作带来了诸多机遇,但机遇往往是与挑战并存,如何充分发挥大数据对人民法院执行工作的推动作用,我们需要对大数据执行研究好.结合好,做好应对. 2014年底,最高人民法院正式开通具有案件管理.网络查控.信息公开.信用惩戒等功能的执行指挥系统.该系统的开通,标志着我国法院执行由此迈进了大数据执行时代.然而,大数据受其固有特征的影响,在给法院执行工作带来利

英特尔凌琦:大数据带来的机遇和挑战

本文讲的是英特尔凌琦:大数据带来的机遇和挑战,2012年7月13日消息,2012第二届大数据世界论坛今天在北京开幕.本次论坛邀请了Forrester Research资深分析师曹宇钦 .IDC中国高级分析师周林等权威第三方咨询机构;微软亚太研发集团首席技术官孙博凯.赛仕软件中国总经理刘政.甲骨文大中华区技术总经理喻思成.Splunk亚太及日本区域副总裁刘文熙等业界主流厂商高层;以及支付宝首席商业智能官车品觉等来自金融.电信.电子商务.制造业等重点应用行业的用户嘉宾等都将与会于业内专业人士面对面探

红帽JBoss数据网格6版本更好的管理大数据 - 产品和技术

红帽JBoss数据网格6版本更好的管理大数据 发布时间:2012.06.29 14:20      来源:赛迪网     作者:赛迪网 [赛迪网讯]近日,红帽宣布内存数据网格解决方案红帽JBoss数据网格6版本正式上市.红帽JBoss数据网格6专门设计的几个最新特性能帮助企业用户减少关联数据库的需求,让应用软件研发能更好地管理大数据. 管理大规模数据的挑战是企业用户所面临的前所未有的挑战之一.这种挑战还将继续加剧,有行业观察家指出,到2015年,全球的互联网流量将达到万万亿的上限,比2010年的