大数据的未来在云端

数据正在呈几何级数增长,来自社交媒体(微信、微博)以及传感器设备的非结构化数据受到了越来越多的关注,而与传统企业交易系统的结构化数据一起,它们将有可能带来新一轮的产业变革。机器学习,自然语言处理,舆情分析等词汇几乎每天都会出现在媒体的报道当中,然而真正讲它们大规模投入应用的企业却少之又少。

  如今,企业CIO们几乎人人都在讨论大数据,许多人认为大数据就是搭一个Hadoop集群,把所有的数据全部存进去,再通过各种各样的API调用进行分析。然而答案并不是这么简单,大数据与IT方方面面都有联系,从基础设施到中间层再到前端的应用。Hadoop不是万能的,它只是大数据的一部分,想要真正驾驭大数据,我们需要考虑更多的事情。

  我们的数据究竟有哪些问题?

  事实上,我们要解决的大数据最基本的问题是存储和报表。我们该如何存储快速增长的数据,关键是在业务人员需要用到这些数据的时候,可以快速地访问。即席查询生成报表,对业务进行预测,充分利用大数据流中隐藏的价值。

  你的数据都有哪些类型组成?关系型数据、非结构化数据还是音频视频?你如何存储不同类型的数据,然后让企业内部的人员可以访问这些数据?答案其实在云端,云存储技术基本上可以应对大数据的存储需求,你可以存储任何类型的数据然后轻松地进行扩展。高端的SAN存储技术在大数据时代已经落伍,而且高昂的成本是企业所无法承受的。SAN存储适合的是关键业务数据,每一条记录对企业都是至关重要的。大数据正好相反,比如销售订单,这些数据是绝对不能丢失一条的,而一条微博或者日志文件怎没有这么高的要求。包括华为、亚马逊等云存储服务可以使用廉价的设备为企业提供大数据存储解决方案,实现可靠、可扩展并且性价比更高的存储。

  当然,电视的出现并未让广播电台灭亡,在大数据时代也是如此。SAN依旧有它的价值,但并不是所有数据都要存在上面。我们需要云存储是因为不同类型的数据都有着特殊的存储需求。比如读密集型的数据一般需要关系型数据库;日志文件只使用HDFS存储就可以;需要大量写操作的数据则需要NoSQL数据库;而存在大量读写操作的系统就需要强大的大数据架构来作为支撑。你的系统也许需要低延迟、高一致性、高度可靠或者需要控制存储的成本,每一种需求都意味着不同的存储解决方案。低延迟可能意味着要上SDD或内存设备,高一致性意味着要建立交易系统,高可靠意味着要使用数据库复制功能。所以,大数据已经告别了“放之四海皆准”的关系型数据库时代,Oracle+小型机+高端存储(或者说IOE)的组合已经不能处理所有的数据难题。

  那么企业到底需要什么?答案是以服务的方式提供的灵活可扩展的云存储解决方案,能够满足上述不同的存储需求。比如亚马逊的RDS,DynamoDB,华为的对象云存储等。当然,并不是所有的云存储都可以满足需求,企业需要更高的灵活性,同时出于延迟以及法规遵从等原因,这就要求能够从不同的系统中将数据快速方便地进行迁移,从内部系统到公有云,或者从一个云提供商迁移到另一个云提供商。

  商业智能与ETL的未来发展

  除了存储方案之外,我们还应该关注前端应用。传统的ETL也将经历变革。业务人员肯定不希望为了导入一点额外的数据就让IT部门更改schema,这样的工作量和成本太高了。理想的状态是有一个简单的工具,让业务人员就能够做即席查询,比如Tableau就能够解决这样的问题。然而,随着数据量的不断增长,TB甚至PB级别的数据需要进行处理,那么软件的成本就要考虑在内,这时候你该怎么办?

  ETL和BI工具的未来将运行在Web端,任何的业务人员都能够用它来生成报表。动态的HTML5用户界面可以通过拖拽就完成数据的查询与报表生成,如果你还需要对业务用户进行培训才能够使用这些工具,那么就真的OUT了。

  新一代的BI工具能够应对实时、图形化、大对象以及非结构化数据的处理,同时能够将这些数据存储在云端。每种数据可以托管在不同的云服务上,但都可以通过一个API进行访问。企业无需再关心什么样的数据用什么样的存储,云服务提供商就可以搞定。

  最后,有一点很重要。越来越多的企业开始意识到,数据分析已经成为了一种“战略武器”。下一代的商业巨头,也许就会从那些知道如何收集数据并把它们转化有价值洞察力的企业中诞生。千里之行始于足下,在构建大数据分析模型或者投入机器学习,招聘数据科学家之前,企业需要先解决好如何存储大数据,而答案就在云端。

原文发布时间为:2014-05-29

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-08-26 22:03:37

大数据的未来在云端的相关文章

互联网已死-大数据的未来在哪里?

一.大数据的未来在哪里 1.互联网已死 大数据的未来在哪里?以BAT为代表的互联网公司之外是否还会有新的互联网巨无霸诞生,基于技术和资本两方面的考虑,几无可能,未来的互联网世界只能是一个几家独大,行业细分的市场,新生互联网公司的机会在于细分,而不在于挑战传统互联网巨无霸.具体到大数据应用来讲,大数据在互联网行业的应用也必将是一个行业细化的过程,而BAT的触角几乎无处不在,新公司的崛起任重而道远,大数据发挥价值的空间也就变成了BAT手中的玩具. 2.传统行业才是大数据的春天 大数据向传统行业的渗透

大数据市场未来将呈现三大发展趋势

随着移动互联网.物联网等的迅速发展,新数据源不断出现,而中国数据总量的不断增长,使大数据成为一种重要资源,有利于推动零售.旅游.医疗.金融.电信.政府公共服务各个领域的业务创新. 大数据转变企业商业模式 来自于线下大数据市场(IT企业的大数据应用及大数据平台业务市场)中IT巨头和单一大数据业务的厂商开始行动,优化产品和服务路线图;线上大数据 市场(互联网用户数据市场,以及以互联网金融为主的线上金融市场)的成熟度逐渐提高,以金融和零售为核心的线上大数据应用走向成熟,市场体量进一步扩大. 企业着力培

大数据预测未来五年最热行业

日前,全球最大的职场社交平台LinkedIn(领英)基于其平台数据分析发现,十年前的热门行业现如今早已热度不再,而数据科学家.新媒体专员等以前几乎不存在的冷门职业却日渐成为时代的新宠.因此,考生及家长在填报志愿时,与其紧盯住当下最热专业不放,倒不如结合自身能力及兴趣进行专业选择. LinkedIn根据大数据对未来五年的行业发展进行了预测,总结出了八大极具发展潜力的最热行业:电商.新媒体营销.大数据服务.云计算服务.VR.UI设计.私人旅行定制和微电影策划.其中,部分行业已经成为当下人们职场热门,

大数据技术 未来发展前景及趋势分析

文章讲的是大数据技术 未来发展前景及趋势分析,在过去几年里,大数据技术已得到广泛关注.在这一领域,有几个趋势和创新正悄然发生.本文整理了您目前正在使用或未来将要使用的大数据的新趋势和变化. 流大数据分析 · Storm: Apache Storm是一种开源的分布式实时计算系统.Storm加速了流数据处理的过程,为Hadoop批处理提供实时数据处理. · Spark: Spark是一个兼容Hadoop数据源的内存数据处理平台,运行速度相比于Hadoop MapReduce更快.Spark适合机器学

10个观点 指引大数据产业未来发展方向

文章讲的是10个观点 指引大数据产业未来发展方向,大数据的"炒作"期从2013年慢慢步入成长期,2016年大数据产业还在经历蜕变.而16年也是大数据产业规模明显增长的一年.技术与应用的创新,政府需求的推动,行业应用大热都在这一年显而易见. 2016年底工信部正式发布<大数据产业发展规划(2016-2020年)>,规划的提出为我国大数据产业崛起指明了方向.其中规划目标到2020年,大数据相关产品和服务业务收入突破1万亿元;建设10-15个大数据综合试验区,创建一批大数据产业集

Hadoop没有消亡,它是大数据的未来

文章讲的是Hadoop没有消亡,它是大数据的未来,人认为 Hadoop 正在失败,但硅谷数据管理公司 Hortonworks 的总经理 Vamsi K. Chemitiganti 并不这么看,为了反驳此前一篇文章<为什么 Hadoop 正在消亡?(Why Hadoop is Failing)>的观点,他在自己的博客上写了一篇论述自己看法的文章,他认为达尔文式的开源生态系统正在确保 Hadoop 成为稳固和成熟的技术平台. 「女士,那么刚出生的孩子能干什么?」--迈克尔·法拉第,在 18 世纪被

坚持以人为本才是大数据的未来

以人为本是大数据的未来 随着互联网的发展,大数据.云计算以及智能化的广泛应用,大数据等这些"高.大.上"和虚无缥缈的"云"端词语已经开始从安防等专业领域开始走向了千家万户.只是很多消费者并不知道大数据和云计算这个概念而已.但是实际上大数据和我们的生活已经如影随形.网上购物消费.出门打车等大数据已经广泛的影响我们的生活并改变这我们的生活方式. 特别是智能手机和无线wifi的兴起,让大数据如虎添翼.每个人都心甘情愿地成为大数据的附庸,而且毫无怨言,甚至无声无息,并乐此不

大数据的未来–个人信息/情报/认知服务的思考

1.未来大数据的一切都都关于人 -不论述 2.大数据收集困难和高风险 现在的大数据的来源,都是通过自有平台收集用户数据的,对于没有平台的企业很难有机制和渠道获取稳定的数据来源. 有说通过法律和制度来,规范关于人的大数据使用,在这之前,唯一可行的方向是,把用户大数据使用,做成服务的必选功能,要使用服务,必须接受隐私风险. 3.对大数据的利用方式 现在的大数据 都是由各种数据聚合出一类关于人的结论 然后拿给企业使用. 我想大数据应用还有另一类. 利用网上的大数据,告诉某类人.甚至某个人,世界发生着什

大数据:未来核心竞争力

文章讲的是大数据:未来核心竞争力,作为新一代信息革命最热门的技术,大数据掀起了新一波IT投资和信息化建设的浪潮.越来越多的企业开始思考.探索和尝试用大数据的技术和手段,来提升营销.运营和生产的效率及效能. 大数据应用的关键,在于先进的创新模式.在保护用户隐私和数据安全情况下,要尽量让数据流动起来,如此才能创造高效的信息社会,让数据被使用并发挥价值,甚至还能二次发挥价值. 大数据技术更多的是处理企业非结构化的数据.非标准化的数据和企业Web的数据,以实时数据处理能力满足企业对客户的需求.现在,根据