用数据创造价值——透视大数据技术的背后

毫无疑问,世界上所有关注开发技术的人都意识到“大数据”对企业商务所蕴含的潜在价值,其目的都在于解决在企业发展过程中各种业务数据增长所带来的痛苦。

现实是,许多问题阻碍了大数据技术的发展和实际应用。

因为一种成功的技术,需要一些衡量的标准。现在我们可以通过几个基本要素来衡量一下大数据技术,这就是——流处理、并行性、摘要索引和可视化。

谁会用到大数据呢?

一年前,大数据技术的一些主要用户是大型Web企业,例如Facebook和雅虎,它们需要分析点击流数据。但是今天,“大数据技术已经超出了Web,是要是有大量数据需要处理的企业都有可能用到它。”例如银行、公用事业机构、情报部门等都在搭乘大数据这辆车。

实际上,一些大数据技术已经被一些拥有很前卫技术的企业在使用了,比如受社交媒体推动而需要创建相应Web服务的企业。它们对于大数据项目的贡献非常重要。

而在其他垂直行业中,有些企业正在意识到,它们基于信息服务的价值定位要比它们先前想象的要大得多,所以大数据技术很快就吸引了这些企业的注意。再加上硬件和软件成本的下降,这些企业发现它们已经处在了一场企业大转型机遇的完美风暴中。

大数据处理的应对三大挑战:大容量数据、多格式数据和速度

大容量数据(TB级、PB级甚至EB级):人们和机器制造的越来越多的业务数据对IT系统带来了更大的挑战,数据的存储和安全以及在未来访问和使用这些数据已成为难点。

多格式数据:海量数据包括了越来越多不同格式的数据,这些不同格式的数据也需要不同的处理方法。从简单的电子邮件、数据日志和信用卡记录,再到仪器收集到的科学研究数据、医疗数据、财务数据以及丰富的媒体数据(包括照片、音乐、视频等)。

速度:速度是指数据从端点移动到处理器和存储的速度。

大数据技术涵盖哪些内容?

一、流处理

伴随着业务发展的步调,以及业务流程的复杂化,我们的注意力越来越集中在“数据流”而非“数据集”上面。

决策者感兴趣的是紧扣其组织机构的命脉,并获取实时的结果。他们需要的是能够处理随时发生的数据流的架构,当前的数据库技术并不适合数据流处理。

例如,计算一组数据的平均值,可以使用一个传统的脚本实现。但对于移动数据平均值的计算,不论是到达、增长还是一个又一个的单元,有更高效的算法。如果你想构建数据仓库,并执行任意的数据分析、统计,开源的产品R或者类似于SAS的商业产品就可以实现。但是你想创建的是一个数据流统计集,对此逐步添加或移除数据块,进行移动平均计算,而且数据库不存在或者尚不成熟。

数据流周边的生态系统有欠发达。换言之,如果你正在与一家供应商洽谈一个大数据项目,那么你必须知道数据流处理对你的项目而言是否重要,并且供应商是否有能力提供。

二、并行化

大数据的定义有许多种,以下这种相对有用。“小数据”的情形类似于桌面环境,磁盘存储能力在1GB到10GB之间,“中数据”的数据量在100GB到1TB之间,“大数据”分布式的存储在多台机器上,包含1TB到多个PB的数据。

如果你在分布式数据环境中工作,并且想在很短的时间内处理数据,这就需要分布式处理。

并行处理在分布式数据中脱颖而出,Hadoop是一个分布式/并行处理领域广为人知的例子。Hadoop包含一个大型分布式的文件系统,支持分布式/并行查询。

三、摘要索引

摘要索引是一个对数据创建预计算摘要,以加速查询运行的过程。摘要索引的问题是,你必须为要执行的查询做好计划,因此它有所限制。

数据增长飞速,对摘要索引的要求远不会停止,不论是长期考虑还是短期,供应商必须对摘要索引的制定有一个确定的策略。

四、数据可视化

可视化工具有两大类。

探索性可视化描述工具可以帮助决策者和分析师挖掘不同数据之间的联系,这是一种可视化的洞察力。类似的工具有Tableau、TIBCO和QlikView,这是一类。

叙事可视化工具被设计成以独特的方式探索数据。例如,如果你想以可视化的方式在一个时间序列中按照地域查看一个企业的销售业绩,可视化格式会被预先创建。数据会按照地域逐月展示,并根据预定义的公式排序。供应商Perceptive Pixel就属于这一类。

五、生态系统战略

许多最大最成功的公司都花费大量资金构建围绕它们产品的生态系统。这些生态系统被产品特性和商务模型所支持,并与合作伙伴的产品和技术协同工作。如果一个产品没有一个富有战略的生态系统,是很难适应客户的要求的。

(责任编辑:吕光)

时间: 2024-09-29 21:57:47

用数据创造价值——透视大数据技术的背后的相关文章

数据科学家和大数据技术人员工具包

数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具.挖掘分析处理工具.其它常见工具等几百种,几十个大类,部分网址.为数据科学教育和知识分享,提高数据科学人员素质. 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学.概率模型.统计学.机器学习.数据仓库.可视化等.在实际应用中,数据科学包括数据的收集.清洗.分析.可视化以及数据应用整个迭代过程,最终帮助组织制定正确的发展决策数据科学的从业者称为数据科学家.数据科学家有其独特的基本思

详谈数据科学与大数据技术专业

从IT时代进入DT时代,高校在大数据方向上设置了哪些专业,具体学什么,就业怎么样,作为新兴专业,考生如何报考? 具体内容: 专业名称:数据科学与大数据技术; 人才培养目标:以大数据为核心研究对象,利用大数据的方法解决具体行业应用问题. 学制:四年;学位:工学或理学学位. 目前已有35所高校申报了大数据专业: 第一批(3所):北京大学.对外经济贸易大学.中南大学; 第二批(32所):中国人民大学.复旦大学.北京邮电大学.华东师范大学.电子科技大学.北京信息科技大学.中北大学.长春理工大学.上海工程

从网络广告透视大数据商业密码

2月底,在美国好莱坞第85届奥斯卡金像奖颁奖礼上,李安凭借<少年派的奇幻漂流>荣获最佳导演.有意思的是,这是微软研究院专家David Rothschild通过大数据分析预测的本届奥斯卡各奖项归属中,唯一出错的一个--David Rothschild对奥斯卡主要奖项其他各项奖的预测则全部命中.更早些时候,在2012年美国总统大选中,他还正确预测了51个选区中50个地区的选举结果,准确性高于98%. 这只是一个缩影,2012年以来,大数据已经在越来越多的领域和场合被人熟知,大数据的呼声此起彼伏,无

上海多所高校均新设“数据科学与大数据技术”专业

教育部日前下发关于公布2016年度普通高等学校本科专业备案和审批结果的通知.在上海高校中,包括复旦.上海交大.华师大.上外在内,共有57个新专业获备案或审批.记者发现,多所高校均新增"数据科学与大数据技术"专业. 据悉,按照<普通高等学校本科专业设置管理规定>,教育部开展了2016年度普通高等学校本科专业设置工作,经申报.公示.审核等程序,对各地各高校正式申请备案的专业予以备案.同时,根据教育部学科发展与专业设置专家委员会评议结果,以及在征求有关行业部门意见后,确定了审批同

大数据优化 | 以大数据优化为基础构建未来就绪企业

打造未来就绪的企业,并非以"预测未来"为前提,而是面向未来做好准备. 大数据真正的价值即在于为面向未来做好准备,帮助企业规避风险. 戴尔提供专门为大数据目标而设计的端到端体系架构,助力企业通过大数据获得商业洞察,面向未来就绪. 正如纳特·西尔弗(Nate Silver)在他的畅销书<信号与噪声>(The Signal and the Noise)中写的,预测未来是非常困难的,因为"我们选择性地忽略了最难以衡量的风险,即便这些风险对我们的生活构成了最大的威胁&quo

上市公司“掘金”大数据 多领域大数据应用受热捧

<关于促进大数据发展的行动纲要>(简称"<纲要>")有着"大数据国家战略"之称,其下发点燃了上市公司掘金大数据产业的热情.据上证报记者最新统计,至今已有近百家上市公司公告涉足该业务,或借力BAT挖掘数据价值与再造,或在定增项目中将大数据作为核心业务. 究竟什么样的数据才是有价值的数据?嫁接BAT.兼并收购是否是大数据变现的有效手段?去伪存真,哪些领域的大数据应用有望率先爆发?记者从多方调研专业人士,以寻求上市公司掘金大数据背后的价值所在. 掘

激发数据价值 IBM大数据深耕华南

ZDNet至顶网软件频道消息:8月15日,IBM大数据与分析高峰论坛在广州举行.IBM宣布其大数据与分析在华南区域的实践获得广泛成果,为越来越多的华南企业提供可视.可应用.可落地的大数据部署方案,实现产业转型和价值突破. IBM大中华区大数据和分析及新市场总经理,全球企业咨询服务部合伙人.副总裁Jason Kelley表示:"经过过去几年的认知和探索阶段,企业已经逐步明确数据作为二十一世纪新自然资源的巨大价值.大数据与分析成为提升企业竞争力的绝对优势,进行转型和创新的巨大动力.作为大数据领域的领

IBM与搜狗共建联合实验室 推动下一代数据中心和大数据运算发展

日前,IBM正式宣布和搜狗公司(以下简称"搜狗")合作成立联合实验室,共享平台.技术资源和人才以研发基于System x的下一代数据中心和大数据运算平台.该联合实验室是IBM在华首个面向互联网行业的技术研发联合实验室,旨在通过研发前瞻性的技术来推动互联网行业基础架构的进一步优化,帮助互联网企业应对"大数据"挑战. 强强联手 System x支撑创新平台 搜狗是中国最大的搜索引擎公司之一,致力于以搜索技术为核心,专注中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获

张新红:数据开放是大数据战略的突破口

本期光明网理论学术动态导读关注数据开放.网络安全.乡村治理.农村公共文化."扶教".军事"标准化"等话题,欢迎网友踊跃参与讨论. [张新红:数据开放是大数据战略的突破口] 国家信息中心信息化研究部主任张新红指出,建立大数据的基础设施,可以让经济增长潜力迅速迸发出来,这是因为公司可以用这些数据创造价值,进而可能创造新的服务行业.数据已经在那儿了,开放没有什么成本,赢得的却是新的发展机会.需要说明的是,大数据战略中的数据开放,与我们常说的信息公开有所不同.以往的信息公开