大数据运动:数据与CEP并肩而行

今天关键分析进展的核心是大数据,它被视为是大量的结构化和非结构化数据的集合,大部分是来自于Web应用程序、服务器日志和社交媒体网站。虽然大数据应用程序常常是与快速发展的组织有关,这些组织可以快速地对实时数据反馈,但大数据和实时不一定是同义的。

行业专家指出大数据在休息时与大数据在运动时确实存在不同。为了促使它向前发展,外部的帮助是必要的。

虽然MapReduce和Hadoop是现代化的、分布式的和并行的,但他们这两个开源技术都与大数据密切相连,都是面向批处理的。这可以会使一些人感到吃惊,但它们经常在当大数据休息之时,也就是说,除非他们是伴随着相当先进的中间件。内在数据网格或数据库、复杂事件处理(CEP)引擎和低延迟消息传递中间件是应用基础设施软件的几种类型,这种软件要像架构师一样承担起推动大数据运动的挑战。

“快速数据(fast data)”不仅只是一项技术,也是一系列的方法,据英国Ovum 研究集团分析师Tony Baer说。快速数据包含高性能,低延迟CEP应用,数据流在内存中进行处理,从而检测模糊复杂的模式,Baer今年早些时候在一篇博文中写到。

随着用户对大数据越来越熟悉,对于伴随着这种大规模信息池的更加高级的消息中间件类型的需求将会增长,根据Roy Schulte所说,Gartner的分析师。Gartner认为CEP对大数据很重要,因为它可以快速处理即将出现的数据,通过暂时把信息存储在电脑的主要内存中。

衡量系统的扩展性

大数据代表着典型的计算机I/O问题,这些问题中大量的“输入”和“输出”问题是性能的关键瓶颈。通常情况下,在这种问题的处理上有一个趋势就是抛弃硬件,不一定要好的效果。Hadoop框架就是一个例子。

“人们讨论扩展性,但就不讨论关于Hadoop性能方面的事,”Michael Kopp说,他是底特律Compuware公司性能管理团队的技术策略师。“另我印象最深的一方面是人们的假设,因为它是大数据,所以它是快速的大数据。如果你看向Hadoop,你把它看作是面向批处理的。它是快速的,但它永远不是实时的。”

就因为它是开源,并不意味它就为公司省钱。

“人们很纠结。Hadoop确实不便宜,而且很难管理,许多工作的运行速率又不同。抛弃越多的硬件,就会使得管理更难,”他说,还暗示说一些在大数据市场上的NoSQL和其它系统可能会看起来像CEP系统——它们重在速度。

“CEP系统在整个讨论中会占有重要的地位,”他说。虽然他看到了Hadoop和NoSQL开发团队正在努力提高查询的性能和优化数据库,但他认为他们很少优化以高效到适应应用程序实际使用数据的方式。

进入高性能消息传递

低延迟消息传递正在兴起,成为另一个使大数据提速的中间件方法。尽管华尔街金融应用程序仍然是主要用例,但高性能消息传递定位于更广泛的使用。厂商提供这样的工作包括IBM,Informatica,PrismTech,RTI,Red Hat,Software AG,Solace Systems,Tervela,Tibco和其它的一些。

利用传感器或所谓的物联网的大数据应用程序代表用例,这些用例需要华尔街应用程序以外的低延迟中间件。这样的软件已经用于分析应用程序涵盖航空、国防、电力公司、甚至停车系统,根据Angelo Corsaro说,PrismTech公司的首席技术官。Corsaro监控着OpenSplice DDS的工作,OpenSplice DDS支持对象管理集团(Object Management Group)的数据分布服务(DDS)实时系统。

“应用程序使用OpenSplice来分布和缓存高容量的快速变化的数据,”他在电子邮件中告诉SearchSOA.com。“一些技术之间的界线正变得模糊起来。”

“在某种意义上,OpenSplice提供了一些CEP的功能,”他说,并指出其基于内容的订阅,可以像在CEP领域一样连续查询。

“不管外围重叠,技术将继续专业化和集成,”他补充说。

当然有CEP的元素可以区分大数据及其使用。CEP倾向于与小的数据集合工作,Merv Adrian说,Gartner的一位分析师。尽管如此,他看了各种技术在以他们的方式,将加快大数据,就如我们现在知道它一样。

“至今,大数据还未已成为实时的商场。新的方法出现了,但正如他们所说,需要一些组合,” Adrian说。“尽管有点事后诸葛,Hadoop现在是一个工具集。回头看,它你是商业智能。”

实时能力是人们期望从大数据中得到的,Adrian说。“这不久就会实现。但有一些压力,”他说。

大数据工作已经代表了全新的架构,如果与现在现有的方案相比的话,所以很大程度上取决于项目的结果。人们不会自找麻烦,添加新架构来看看过去一年他们都做了什么,Adrian说。

(责任编辑:施柏鹏)

时间: 2024-09-21 08:07:53

大数据运动:数据与CEP并肩而行的相关文章

云中的大数据:数据速度、数据量、种类、真实性

本文重点介绍使用大数据的应用程序,解释大数据分析背后的基本概念,以及如何将这些概念与商业智能 (BI) 应用程序和并行技术相结合,比如 "云扩展" 系列第 3 部分中介绍的计算机视觉 (CV) 和机器学习方法. 大数据分析与视频分析的区别在于所处理数据类型的广度上,而且与所使用的数据挖掘或 MapReduce 方 法相比,所提供的交互式分析和搜索工具可能更加复杂,而且比 Google BigQuery 的运行时间长得多.例如 ,Google BigQuery 使用列式搜索来压缩和加速海

请求网络数据-怎么请求聚合数据的数据,求一个demo,谢谢各位大神

问题描述 怎么请求聚合数据的数据,求一个demo,谢谢各位大神 我自己做的请求不出来数据,下面上一个类的代码.请大神指点指点 package com.action; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.i

触目惊心:2015十大最具影响力的数据泄密事件

2015年,是数据安全事故频发年,也是数据安全防护技术高速发展的一年.回顾整个2015,产业信息化.数字化.网络化进程加速,互联网+已然成为一种不可逆的趋势,互联网.云计算.大数据带来更新式革命,然而新趋势下的数据安全状况变得越发严峻.Verizon最新发布的<2015数据泄露调查报告>显示,500强企业中超半数曾遭受过黑客攻击,来自中国的数据安全问题更加触目惊心,福布斯上榜的中国企业中,大多数企业都曾经不同程度遭受过攻击或出现数据泄露,特别是一些掌握大量民众个人信息的通信运营商及金融领域.明

马云谈大数据:数据时代的“五个新” 做好准备

马云,1964 年9 月10 日生于浙江省杭州,1988 年毕业于杭州师范学院外语系,同年担任杭州电子工业学院英文及国际贸易教师,1995 年创办中国第一家互联网商业信息发布网站"中国黄页",1998 年出任中国国际电子商务中心国富通信息技术发展有限公司总经理,1999 年创办阿里巴巴,并担任阿里集团CEO.董事局主席.2013 年5 月,辞任阿里巴巴集团CEO,继续担任阿里集团董事局主席.6 月30 日,马云当选全球互联网治理联盟理事会联合主席.2016 年5 月8 日,马云任中国企

大统计与数据科学联合会议召开 百分点深入探讨大数据价值挖掘之道

ZD至顶网服务器频道 05月30日 新闻消息:5月27日-29日,由百分点集团.中国人民大学.北京大学.伦敦政治经济学院与统计之都共同主办的中国最大的大数据盛会"大统计与数据科学联合会议"在北京召开.28日,百分点集团与北京大学携手举办"2016百分点数据与价值国际论坛",百分点分享了在互联网经济深度融合.数据爆炸的今天,如何更有效地通过大数据系统的建设,实现从数据到价值的回归,进而支撑企业业务的持续增长.  据了解,"2016百分点数据与价值国际论坛&q

摩拜AI大数据平台“魔方”发布黄金周骑行预测,加州开发 AI 智能公寓

AI大数据平台"魔方"发布黄金周骑行预测 8天长假前,摩拜通过大数据人工智能平台"魔方",对假期全国各地的骑行特征与趋势做了一次预判. 据"魔方"预测,由于海量休闲观光需求的释放,预计"十一"期间的日均骑行量将增长25%:相应地,人均骑行距离将从平均不足2公里增加至近3公里:骑行速度将降低15%,每公里骑行将多花1分钟时间.与工作日的明显早晚双高峰不同,小长假期间的骑行将呈现午前小高峰.下午2点到5点大高峰.晚间8-9点第二小

bmob-求大神帮助,使用Bmob服务器,获取数据解析数据???我还使用异步加载

问题描述 求大神帮助,使用Bmob服务器,获取数据解析数据???我还使用异步加载 //我建立了Bean,里面有一个ImageView,两个TextView, //ImageView id=imgView; //TextView id=tittle; //TextView id=content; //BaseAdapter在最下面列出来: //ListView布局是activity_main; //item布局是item_layout; 我都是按照视频写的,基础差,请见谅 package com.

可穿戴设备上的运动数据可被用来窃取PIN码和密码

据外媒报道,近日美国宾汉姆顿大学及斯蒂文斯理工学院的研究人员在一篇称为<Friend or Foe?: Your Wearable Devices Reveal Your Personal PIN>的论文中指出,他们开发出的一种算法能够通过智能手表或健身追踪器等可穿戴设备收集的运动数据准确地猜测出PIN码和密码. 宾汉姆顿大学托马斯·沃森工程与应用科学学院的助理教授兼这项研究的共同作者Yan Wang表示:"攻击者能够通过'再现'可穿戴设备穿戴者手部运动轨迹,来恢复其在ATM取款机.

从数据仓库到大数据,数据平台这25年是怎样进化的?

" 从「数据仓库」一词到现在的「大数据」,中间经历了太多的知识.架构模式的演进与变革.数据平台这25年究竟是怎样进化的? 我是从2000年开始接触数据仓库,大约08年开始进入互联网行业.很多从传统企业数据平台转到互联网同学是否有感觉:非互联网企业.互联网企业的数据平台所面向用户群体是不同的. 那么,这两类的数据平台的建设.使用用户又有变化?数据模型设计又有什么不同呢? 我们先从两张图来看用户群体的区别. 用户群体之非互联网数据平台用户  企业的boss.运营的需求主要是依赖于报表.商业智能团队的