用数据创造价值——透视大数据技术的背后

毫无疑问，世界上所有关注开发技术的人都意识到“大数据”对企业商务所蕴含的潜在价值，其目的都在于解决在企业发展过程中各种业务数据增长所带来的痛苦。

现实是，许多问题阻碍了大数据技术的发展和实际应用。

因为一种成功的技术，需要一些衡量的标准。现在我们可以通过几个基本要素来衡量一下大数据技术，这就是——流处理、并行性、摘要索引和可视化。

谁会用到大数据呢？

一年前，大数据技术的一些主要用户是大型Web企业，例如Facebook和雅虎，它们需要分析点击流数据。但是今天，“大数据技术已经超出了Web，是要是有大量数据需要处理的企业都有可能用到它。”例如银行、公用事业机构、情报部门等都在搭乘大数据这辆车。

实际上，一些大数据技术已经被一些拥有很前卫技术的企业在使用了，比如受社交媒体推动而需要创建相应Web服务的企业。它们对于大数据项目的贡献非常重要。

而在其他垂直行业中，有些企业正在意识到，它们基于信息服务的价值定位要比它们先前想象的要大得多，所以大数据技术很快就吸引了这些企业的注意。再加上硬件和软件成本的下降，这些企业发现它们已经处在了一场企业大转型机遇的完美风暴中。

大数据处理的应对三大挑战：大容量数据、多格式数据和速度

大容量数据（TB级、PB级甚至EB级）：人们和机器制造的越来越多的业务数据对IT系统带来了更大的挑战，数据的存储和安全以及在未来访问和使用这些数据已成为难点。

多格式数据：海量数据包括了越来越多不同格式的数据，这些不同格式的数据也需要不同的处理方法。从简单的电子邮件、数据日志和信用卡记录，再到仪器收集到的科学研究数据、医疗数据、财务数据以及丰富的媒体数据（包括照片、音乐、视频等）。

速度：速度是指数据从端点移动到处理器和存储的速度。

大数据技术涵盖哪些内容？

一、流处理

伴随着业务发展的步调，以及业务流程的复杂化，我们的注意力越来越集中在“数据流”而非“数据集”上面。

决策者感兴趣的是紧扣其组织机构的命脉，并获取实时的结果。他们需要的是能够处理随时发生的数据流的架构，当前的数据库技术并不适合数据流处理。

例如，计算一组数据的平均值，可以使用一个传统的脚本实现。但对于移动数据平均值的计算，不论是到达、增长还是一个又一个的单元，有更高效的算法。如果你想构建数据仓库，并执行任意的数据分析、统计，开源的产品R或者类似于SAS的商业产品就可以实现。但是你想创建的是一个数据流统计集，对此逐步添加或移除数据块，进行移动平均计算，而且数据库不存在或者尚不成熟。

数据流周边的生态系统有欠发达。换言之，如果你正在与一家供应商洽谈一个大数据项目，那么你必须知道数据流处理对你的项目而言是否重要，并且供应商是否有能力提供。

二、并行化

大数据的定义有许多种，以下这种相对有用。“小数据”的情形类似于桌面环境，磁盘存储能力在1GB到10GB之间，“中数据”的数据量在100GB到1TB之间，“大数据”分布式的存储在多台机器上，包含1TB到多个PB的数据。

如果你在分布式数据环境中工作，并且想在很短的时间内处理数据，这就需要分布式处理。

并行处理在分布式数据中脱颖而出，Hadoop是一个分布式/并行处理领域广为人知的例子。Hadoop包含一个大型分布式的文件系统，支持分布式/并行查询。

三、摘要索引

摘要索引是一个对数据创建预计算摘要，以加速查询运行的过程。摘要索引的问题是，你必须为要执行的查询做好计划，因此它有所限制。

数据增长飞速，对摘要索引的要求远不会停止，不论是长期考虑还是短期，供应商必须对摘要索引的制定有一个确定的策略。

四、数据可视化

可视化工具有两大类。

探索性可视化描述工具可以帮助决策者和分析师挖掘不同数据之间的联系，这是一种可视化的洞察力。类似的工具有Tableau、TIBCO和QlikView，这是一类。

叙事可视化工具被设计成以独特的方式探索数据。例如，如果你想以可视化的方式在一个时间序列中按照地域查看一个企业的销售业绩，可视化格式会被预先创建。数据会按照地域逐月展示，并根据预定义的公式排序。供应商Perceptive Pixel就属于这一类。

五、生态系统战略

许多最大最成功的公司都花费大量资金构建围绕它们产品的生态系统。这些生态系统被产品特性和商务模型所支持，并与合作伙伴的产品和技术协同工作。如果一个产品没有一个富有战略的生态系统，是很难适应客户的要求的。

(责任编辑：吕光)

时间： 2024-09-29 21:57:47

用数据创造价值——透视大数据技术的背后的相关文章

数据科学家和大数据技术人员工具包

数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具.挖掘分析处理工具.其它常见工具等几百种,几十个大类,部分网址.为数据科学教育和知识分享,提高数据科学人员素质. 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学.概率模型.统计学.机器学习.数据仓库.可视化等.在实际应用中,数据科学包括数据的收集.清洗.分析.可视化以及数据应用整个迭代过程,最终帮助组织制定正确的发展决策数据科学的从业者称为数据科学家.数据科学家有其独特的基本思

详谈数据科学与大数据技术专业

从IT时代进入DT时代,高校在大数据方向上设置了哪些专业,具体学什么,就业怎么样,作为新兴专业,考生如何报考? 具体内容: 专业名称:数据科学与大数据技术; 人才培养目标:以大数据为核心研究对象,利用大数据的方法解决具体行业应用问题. 学制:四年;学位:工学或理学学位. 目前已有35所高校申报了大数据专业: 第一批(3所):北京大学.对外经济贸易大学.中南大学; 第二批(32所):中国人民大学.复旦大学.北京邮电大学.华东师范大学.电子科技大学.北京信息科技大学.中北大学.长春理工大学.上海工程

从网络广告透视大数据商业密码

2月底,在美国好莱坞第85届奥斯卡金像奖颁奖礼上,李安凭借<少年派的奇幻漂流>荣获最佳导演.有意思的是,这是微软研究院专家David Rothschild通过大数据分析预测的本届奥斯卡各奖项归属中,唯一出错的一个--David Rothschild对奥斯卡主要奖项其他各项奖的预测则全部命中.更早些时候,在2012年美国总统大选中,他还正确预测了51个选区中50个地区的选举结果,准确性高于98%. 这只是一个缩影,2012年以来,大数据已经在越来越多的领域和场合被人熟知,大数据的呼声此起彼伏,无

上海多所高校均新设“数据科学与大数据技术”专业

教育部日前下发关于公布2016年度普通高等学校本科专业备案和审批结果的通知.在上海高校中,包括复旦.上海交大.华师大.上外在内,共有57个新专业获备案或审批.记者发现,多所高校均新增"数据科学与大数据技术"专业. 据悉,按照<普通高等学校本科专业设置管理规定>,教育部开展了2016年度普通高等学校本科专业设置工作,经申报.公示.审核等程序,对各地各高校正式申请备案的专业予以备案.同时,根据教育部学科发展与专业设置专家委员会评议结果,以及在征求有关行业部门意见后,确定了审批同

大数据优化 | 以大数据优化为基础构建未来就绪企业

打造未来就绪的企业,并非以"预测未来"为前提,而是面向未来做好准备. 大数据真正的价值即在于为面向未来做好准备,帮助企业规避风险. 戴尔提供专门为大数据目标而设计的端到端体系架构,助力企业通过大数据获得商业洞察,面向未来就绪. 正如纳特·西尔弗(Nate Silver)在他的畅销书<信号与噪声>(The Signal and the Noise)中写的,预测未来是非常困难的,因为"我们选择性地忽略了最难以衡量的风险,即便这些风险对我们的生活构成了最大的威胁&quo

上市公司“掘金”大数据多领域大数据应用受热捧

<关于促进大数据发展的行动纲要>(简称"<纲要>")有着"大数据国家战略"之称,其下发点燃了上市公司掘金大数据产业的热情.据上证报记者最新统计,至今已有近百家上市公司公告涉足该业务,或借力BAT挖掘数据价值与再造,或在定增项目中将大数据作为核心业务. 究竟什么样的数据才是有价值的数据?嫁接BAT.兼并收购是否是大数据变现的有效手段?去伪存真,哪些领域的大数据应用有望率先爆发?记者从多方调研专业人士,以寻求上市公司掘金大数据背后的价值所在. 掘

激发数据价值 IBM大数据深耕华南

ZDNet至顶网软件频道消息:8月15日,IBM大数据与分析高峰论坛在广州举行.IBM宣布其大数据与分析在华南区域的实践获得广泛成果,为越来越多的华南企业提供可视.可应用.可落地的大数据部署方案,实现产业转型和价值突破. IBM大中华区大数据和分析及新市场总经理,全球企业咨询服务部合伙人.副总裁Jason Kelley表示:"经过过去几年的认知和探索阶段,企业已经逐步明确数据作为二十一世纪新自然资源的巨大价值.大数据与分析成为提升企业竞争力的绝对优势,进行转型和创新的巨大动力.作为大数据领域的领

IBM与搜狗共建联合实验室推动下一代数据中心和大数据运算发展

日前,IBM正式宣布和搜狗公司(以下简称"搜狗")合作成立联合实验室,共享平台.技术资源和人才以研发基于System x的下一代数据中心和大数据运算平台.该联合实验室是IBM在华首个面向互联网行业的技术研发联合实验室,旨在通过研发前瞻性的技术来推动互联网行业基础架构的进一步优化,帮助互联网企业应对"大数据"挑战. 强强联手 System x支撑创新平台搜狗是中国最大的搜索引擎公司之一,致力于以搜索技术为核心,专注中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获

张新红：数据开放是大数据战略的突破口

本期光明网理论学术动态导读关注数据开放.网络安全.乡村治理.农村公共文化."扶教".军事"标准化"等话题,欢迎网友踊跃参与讨论. [张新红:数据开放是大数据战略的突破口] 国家信息中心信息化研究部主任张新红指出,建立大数据的基础设施,可以让经济增长潜力迅速迸发出来,这是因为公司可以用这些数据创造价值,进而可能创造新的服务行业.数据已经在那儿了,开放没有什么成本,赢得的却是新的发展机会.需要说明的是,大数据战略中的数据开放,与我们常说的信息公开有所不同.以往的信息公开

猜你喜欢

产品品牌识别度要从听觉视觉元素设计

文章描述:品牌的识别度可以来源于不同的表现形式.可以是听觉,比如诺基亚经典的铃声. 也可以是视觉:从最直观的商标,以及更深入产品内部的各种设计元素. 品牌的识别度可以来源于不同的表现形式.可以是听觉, ...

使用ISO文件安装Linux

一. 准备知识 1. ISO文件我们普遍使用的ISO文件是指包含着整个CD-ROM(ISO-9660 文件系统)内容的映象, 是整个碟片从0扇区到最后一个扇区的完整复制,经常被用来在网络上传输对 ...

Android LibGDX游戏引擎开发教程（三）示例代码详细讲解

承接了上一篇文章中关于环境搭建的简单示例,这一篇我会详细讲解FirstGame和HelloGameActivity类中的代码. 一.ApplicationListener接口详解 1.简单代码示例, ...

关于Android引导画面的多分辨率适配

本文并非关于引导画面该采用何种形式.该如何定义信息.有什么注意事项方面的介绍. 本文描述的是,引导画面该如何才能较好的适配各种分辨率,了解此处有助于更好的定义引导画面,以及保持同设计师.工程师的良好沟 ...

如何解除防火墙的阻止

在使用远程协助功能的时候,可能会被防火墙阻止,此时只要根据系统的提示,进行相关设置,就可以解除防火墙的阻止.具体的操作步骤如下: 1.在弹出的"远程协助"中,单击"修 ...

adapter-在listview中找到点击的行，获取数据

问题描述在listview中找到点击的行,获取数据我使用自定义的 adapter在ArrayList中显示items.每一行item都2个 textViews和1个按钮. 依据一个属性的状态,在图 ...

《企业大数据系统构建实战：技术、架构、实施与应用》——第2章企业大数据职能规划 2.1 大数据组织架构体系

第2章企业大数据职能规划第1章我们介绍了企业大数据在宏观和微观层面的定位,立足于解答企业大数据的商业模式.市场机会.延伸价值.内部功能定义等问题.当企业已经确定要实施大数据战略时,应该如何针对性地 ...

[剑指Offer] 第5章课后题详解

[剑指Offer] 第5章课后题详解目录剑指Offer 第5章课后题详解目录删除指定字符分析解法优化删除重复元素分析解法判断变位词分析解法求助删除指定字符本题为< ...

一分钟了解阿里云产品：媒体转码

一. 概述阿里云发布了众多产品,今天让我们一起来了解下媒体转码这款产品吧. 什么是媒体转码呢? 简单来说,阿里云媒体转码(Media Transcoding) 是 ...

can&#39;t locate ExtUtils/MakeMaker.pm in @INC

[root@luozhonghua FCGI-0.71]# perl Makefile.PL can't locate ExtUtils/MakeMaker.pm in @INC (@I ...

MySQL 的隐式类型转换

换十六进制的值和非数字做比较时,会被当做二进制串,和数字做比较时会按下面的规则处理有一个参数是 TIMESTAMP 或 DATETIME,并且另外一个参数是常量,常量会被转换为 timestamp ...

关于页面重定向的问题

问题描述公司服务器搬迁.现在想做一个页面,只要访问老域名,就会自动显示这个提示页面,提示新的网址,并且五秒之后自动跳转新的网址.这个功能如何实现啊? 问题补充:eclipse07 写道解决方案用 ...

云化趋势下，如何破局企业互联专线难题？

本文讲的是云化趋势下,如何破局企业互联专线难题?云计算技术风起云涌,公有云的崛起和流行,引导着企业数据中心(DC)等基础设施云化,越来越多的企业开始在公有云安家,从而打破了企业IT传统的封闭架构,引领 ...

生产问题导致苹果iPad平板电脑出货量表现平庸

美国市场研究公司iSuppli将该产品今年的出货量预期从2月的4370万台下调至3970万台,下调幅度高达9.1%.iSuppli表示,在生产困境以及需求旺盛的双重作用下,苹果第一季度的iPad 2供 ...

举例讲解iOS开发中拖动视图的实现_IOS

预备知识iOS处理屏幕上的触摸动作,主要涉及到以下几个方法: 复制代码代码如下: touchesBegan:withEvent: //触摸屏幕的最开始被调用 touchesMove ...

JavaScript数据存储 Cookie篇_javascript技巧

1.什么是cookie? 答:cookie是用于在客户端存储会话信息的.2.cookie的组成部分? ①名称:一个唯一确定cookie 的名称.建议区分大小写.cookie 的名称必须是 ...

了解WEB页面工具语言XML(五)好处_XML/RSS

五.XML带来的好处 1更有意义的搜索数据可被XML唯一的标识.没有XML搜索软件必须了解每个数据库是如何构建的.这实际上是不可能的因为每个数据库描述数据都是不同的.有了XML书就可以很容易以标准的 ...

双11数据大屏背后:大规模流式增量计算及应用（附资料）

首先从理解什么是数据流开始今天的分享,其实在真实的世界中,大部分的数据都是连续产生的数据流,比如手机上产生的GPS信号.用户在互联网上的行为.在线搜索.用户的点击.社交网络分享.即时通信以及一些传感器 ...

安卓开发：是否能在我自己的异步登录中调用SDK的登录方法EMChatManager.getInstance().login

问题描述安卓开发:是否能在我自己的异步登录中调用SDK的登录方法EMChatManager.getInstance().login 问题如上,错误信息:SMACK-Voe:enter JNI_OnL ...

互联网-关于学校网络的问题！求大神

问题描述关于学校网络的问题!求大神关于学校局域网,学校的网络在11点半就关网,怎么改变自己电脑的IP在学校网络中的上网时间呢解决方案别想了,没用的,你们是公网IP,你想霸占学校其他机器的IP, ...

Objective-C 杂志发布四月 Android 特刊

在线杂志objc.io本来是专注于Objective-C技术/iOS开发,但四月一期的主题却是Android开发.编辑称,Android特刊的起因是愚人节玩笑,但随后意识到iOS开发者会感兴趣了解另一 ...

如何将json字符串快速转换为list

问题描述我在数据库中存的是json格式的字符串,请问如何将字符串在读取时转为java的list类型,最好有例子,谢谢. 解决方案解决方案二:JSONArrayjsonArr=JSONArray.f ...

流氓软件代理月赚一万网友欲诉遭遇取证难

中介交易 SEO诊断淘宝客云主机技术大厅 "最多一个月,我坐在家里就赚了10000元.但自从打击流氓软件后,生意越来越难做",自称南京某大学中文系研究生的柳洪(化名)昨天下午 ...

携号转网试点2月陷胶着：专家称5年后可自由选择

单向转网还是双向转网?天津模式还是海南模式? 时至今日,携号转网试点已度过了2个月的时间.与试点开始之前的预期一样,在津琼两地开展的携号转网业务并没有引来用户的转网热潮,总体上而言稍显冷清.不过冷清的 ...

Nginx中全局变量整理小结_nginx

Variables The core module supports built-in variables, whose names correspond with the names of vari ...

科学家研发能“自我反省”的量子计算机

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 据媒体报道,西班牙和奥地利的物理学家们密切合作 ...

Pass美国社交APP应用来了!

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅据外媒报道,移动互联网迅速革新,随 ...

上海小将谢文骏首进13秒30

昨天,中国选手谢文骏(中)以13秒28获男子110米栏季军. http://www.aliyun.com/zixun/aggregation/79250.html">本报记者邵剑平 ...

Oracle的dbms_output包的put()和put_line()的区别只是有没有回车换行吗?(转)

答案是否除了自动添加回车换行外,还有就是缓冲区最大容量的问题!! 无论如何设置serveroutput size,10g里 put() 最多只能输出 32767 个byte 而 put_line() ...

白帽子认为2017年网络安全的头号威胁是大规模监控

美国大选受俄罗斯干预的丑闻仍在华盛顿持续发酵,人们忧心忡忡地思索网络安全的发展方向,以及企业和公民如何确保信息不受恶人摆弄. 根据最新调查,近期最可能发生的网络安全威胁是(国内或外国的)政府的大规模监 ...

热搜