实时大数据分析是网络分析的一种新方法

RTBDA概述

当被分解到其最简单的形式时,大数据分析包括两部分,以便将自身与数据仓库和商业智能进行区分:

实时行动

分布式,并行处理

大数据分析能够解决处理大量无关且不能存放在一个单一的服务器或数据库的数据集所带来的普遍的挑战问题。而这个问题可以通过使用分布式并行处理分布在多个服务器的大型数据集得以解决,每台服务器处理并行数据的一部分。大数据分析可以与结构化和非结构化数据工作,因为它并不需要一个特定的结构。这种做法的一个例子将使用Hadoop的MapReduce,其也可以看作是大数据对今天的深远影响。

尽管目前有方法来处理大量的数据,大数据处理缩小以便能够在指定的时间内完成。现在,时限这一概念比以往任何时候都越来越都多的与“实时”相关。

尽管RTBDA仍然是一个相对较新的概念,但其解决了实时主动或被动的采取措施的需求。而这是基于互联网内容和服务提供商们了解到了正在发生的事情,检查情况并实时采取行动。

理解“实时”电信

在实时大数据分析:新兴架构大会上,迈克巴洛问道,“所谓的实时到底有多'实时'?”“这取决于你的目标,问题的答案会有动态的变化。在某些情况下,秒或毫秒就足够了,而在另一些情况下,实时需要更快。

这个问题是从电信方面很有趣。它揭示了当前的电信运营商们如果想要成功的解决OTT公司所带来的流量挑战所必须面临的一个潜在的弱点。这样的话,目前在电信行业所能够接受的“实时”的标准就显得不再足够了。

此前,电信网络使用面向连接的技术。程序只能进行集中在一个高度结构化的进程,前一分钟的网络与后一分钟并没有多大的修改,甚至时间跨度一小时也不会有太大改变。在这些情况下,在一致的时间间隔从网络上收集信息就知道发生了什么。该协议的管理信息丰富,能够从一个协议聚集大量的洞察力。在这种情况下,“实时”可以在几秒钟之内甚至几分钟内定义,这就是为什么他们通过每5到15分钟收集呼叫详细记录(CDR)就能充分获得完全的洞察力的原因了。

同样的情形在今天已经不再可能。向LTE的过渡使电信运营商完成过渡到基于以太网和IP的数据包网络,其功能与面向连接的技术和协议是完全不同的。

IP网络的一个基本原则是:网络是自给自足的。网络提供了流量传输的通道,并依据流量拥堵和其他情况进行网络路径重定向。这个特点使网络能够迅速就相关的改变做出回应。缺点是无法确切地预测流量。这种情况又因以太网和IP协议变得复杂,缺乏面向连接的协议所能提供的同等水平的管理信息。

分组传输网络(Packet networks )本质上也是动态的,因为其设计初衷是为多个用户共享相同的基础设施提供服务的。在较长的一段时间,网络的消耗看起来很低,但在现实中流量传输需求很大,可能消耗掉所有可用的带宽。在这种情况下,对IP网络应该做出反馈,确保流量是在稳定的网络上传输。最终,在网络中可能从一个IP包或以太网帧到下一个发生变化。

电信网络管理和数据分析的中心问题是他们都依靠事件详细记录(EDRs),CDRs和IP详细记录(IPDRs)来深入了解实时发生的状况。

在过去,“实时”这一定义每隔几分钟就已经足够了。当我们考虑到以太网帧在10 Gbps网络可以以每帧短短67纳秒的时间在之间以太网帧传输,我们就开始理解在一个分组传输网络的“实时”指的是什么了。在现如今这个快节奏的环境“实时”的概念已经不仅不是分钟,也不是秒来。今天,其是以纳秒为时间间隔了。

实时评估

使用CDRs,EDRs和IPDRs进行大数据分析是一个好主意,这取决于企业正在努力完成的任务。大数据分析可以以两种方式制定决策:

实时决策

根据趋势及预测分析加强规划,以及服务和网络的优化

利用明细记录、以及其他结构化和非结构化数据源进行优化和规划是必要的。这些记录包括丰富的信息,帮助预测有用的趋势。除非辅以分组网络的实时信息,提供关于发生了什么的精确细节,否则这些信息将无法提供一个完整的视图。

不幸的是,详细的记录不能用于实时决策,因为其只是每5至15分钟的时间间隔进行收集。这个时间间隔与我们对什么是真正分组网络实时的理解不兼容。其需要不断收集,存储和分析真正的实时网络信息,进行决策。要理解网络正在发生什么,必须对所有相关的以太网帧与IP数据包进行实时审查。

通过以这种方式捕获和存储网络信息,我们不仅具备了能够分析使用实时信息的能力,同时也可以为我们提供一个了解在信息网络发生了什么事件的基础的详细可靠的方式,以补充其他大数据的活动的洞察。

RTBDA在电信行业的应用

实时数据采集层可以为决策制定提供可操作的、层出不穷的材料。无论是电信管理论坛和IP网络监控的服务质量智能支持(IPNQSIS)项目,以及欧洲Celtic-Plus计划的一部分,都曾研究过这个需求,作为提升各自客户体验管理的努力的一部分。这两个项目的结论是,探头和设备对于了解在网络中正在发生的事情的可靠,实时洞察是必要的。

典型地,探头数据采集器将数据传送到其他管理系统,而设备使用相同的技术,而且能够分析数据,并可以在本地存储信息。通常情况下,设备集中于一个特定的任务,比如性能监控,测试和测量,或安全性,并且往往被视为满足非常具体的要求。在另一方面,探头和设备可以作为大数据分析的实时数据源发挥更多的战术作用,并帮助实现RTBDA战略。下文中提供了一个这样的基础设施如何实现的三个步骤的视图。

实现部署

最初的步骤需要数据采集设备的部署。这里的一个关键因素是以太网帧和IP数据包必须被实时捕获,不管在什么情况下,以线速度且零数据包丢失。这种可见性证实了源源不断的可靠信息的收集。

每帧必须被赋予独特的时间间隔,以保证精确的时间表可以被建立,不仅涵盖本地的设备,同时还能跨多个设备。这些时间间隔精度必须是以纳秒为计量单位。例如,在10 Gbps的网络以太网帧只有67纳秒的时间间隔,时间间隔分辨率必须小于67纳秒。否则,两个以太网帧都会收到相同的时间间隔,使得其很难区分。在一个100 Gbps的网络,这段时间间隔将减少到6.7纳秒。

结合零数据包丢失捕捉纳秒级精度的实时数据,确保了我们能够掌握一致的,准确的数据分析信息流。

存储

其次,收集的信息应该实时被存储。几个设备提供捕捉的数据存储到磁盘,允许实时的数据可以直接存储到本地硬盘。另外,这些数据可以被转移到一个存储区域网络(SAN)或其他位置。捕获的数据可以被用来在网络上创建一个历史年表,以精确的细节记录发生了什么。其可能用来重现到底发生了什么事,当进行重现时,使用这些数据。

这段细节记录历史是数据分析的一个丰富的信息源。这种类型的数据可以为数据信息的使用和行为模式提供洞察。如果设备具有深度数据包检测(DPI)的功能,那么,使用服务,包括互联网服务,可以监视和分析时间,地点和设备类型使用方面的趋势。

这种信息本身对于网络和服务的优化是一种宝贵的资源。可以据此来规划新的,有针对性的服务,以匹配用户的喜好。此外,这些信息可以为互联网内容服务提供商提供洞察,让运营商能够向潜在客户提供令人信服的服务能力。

实时评估

最后,实时的数据存储有助于实现实时决策。捕获到磁盘的历史信息可帮助开发预期行为的配置文件。当数据与网络活动的实时信息并置时,能够检测出意想不到的事件或异常。这些问题可能是一个安全威胁,也有可能是性能下降或有机会为客户提供一个数据扩展包或互补性的服务。

从RTBDA的角度来看,这种能力与OTT内容及服务提供商执行的能力是非常接近的,基于对对目前正在发生的事情,并与过去的事情比较进行理解做出实时的反应。

RTBDA战略基础

遵循这三个步骤来实施,通过探头和设备提供的实时信息可以用来实现RTBDA电信网络以及在大数据分析战略规划中用其他信息来源以补充。

这一技术和产品用来实现战略部署不仅仅是可用的,而且已经被广泛使用了,只是不以这方面的目的。更有趣的是,当今绝大多数企业,金融,政府和电信网络所使用的设备都是基于现成的服务器技术,其是与未来的运营计划相兼容的。

软件定义的网络(SDN)和网络虚拟化功能(NFV)策略的基石都是基于现成的服务器硬件。

RTBDA在未来的电信业的展望

现在是时候需要现代电信网络重新考虑“实时”这一概念的意义,以及他们所使用的大数据分析的信息源了。电信运营商必须开始评估在网络中使用探头和设备技术等更多的战术方法来提供RTBDA了。这样,不仅能够为规划决策提供更准确的信息,同时也可以创造新的机会,提供更好的服务,不仅为最终用户,也为OTT服务提供商自身。这种能力最终可以帮助电信网络的OTT解决流量的货币化问题。

原文发布时间为: 2014年05月15日

本文作者:litao984lt

本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。

时间: 2024-11-30 09:42:45

实时大数据分析是网络分析的一种新方法的相关文章

Ajax: Web应用开发的一种新方法

ajax|web   原文:  http://www.neokeen.com/mornlee/2005/02/21/1108998494781.html Ajax是什么 异步JavaScript + XML(Asynchronous JavaScript + XML)的缩写.Ajax不是某种新技术,只是几种技术的集成创新的一种新方法.其技术组成有:基于标准的表示技术: XHTML , CSS动态显示和交互技术:Document Object Model(文件对象模型)数据互换和操作技术: XML

开发出一种新方法来探测和清除恶意Virut僵尸网络的所有变体

百度(Nasdaq: BIDU )今天宣布,其杀毒软件Baidu Antivirus已开发出一种新方法来探测和清除恶意"Virut"僵尸网络的所有变体,这令Baidu Antivirus成为第一个已知的可完全保护用户免受这一威胁的杀毒程序. Virut僵尸网络通过可执行文件感染传播,并通过使用被盗用的HTML的网站来感染易受攻击的浏览器.受感染的电脑会变成DDoS(分布式拒绝服务)攻击.垃圾邮件.欺诈.数据盗窃和非法每安装付费活动的寄主. 尽管波兰研发组织NASK在2013年1月采取了

使用Storm实现实时大数据分析!

简单和明了,http://www.aliyun.com/zixun/aggregation/13431.html">Storm让大数据分析变得轻松加愉快. 当今世界,公司的日常运营经常会生成TB级别的数据.数据来源囊括了互联网装置可以捕获的任何类型数据,网站.社交媒体.交易型商业数据以及其它商业环境中创建的数据.考虑到数据的生成量,实时处理成为了许多机构需要面对的首要挑战.我们经常用的一个非常有效的开源实时计算工具就是Storm -- Twiitter开发,通常被比作"实时的Ha

让大数据分析更有效的5种技术措施

如今,数据量越来越大.近年来,企业已经意识到数据分析可以带来的价值,并且已经开始采用.企业现在的设备几乎都在监测和测量,并创造了大量的数据,通常比企业处理的更快.其问题是,而正因为大数据定义为"大数据",所以数据收集的小差异或错误可能会导致出现重大问题,错误信息和不准确的推论. 有了大量数据,就能够以业务为中心的方式来分析它的挑战,实现这一目标的唯一方法就是确保企业制定数据管理策略. 然而,有一些技术可以优化企业大数据分析,并最大限度地减少可能渗透这些大数据集的"噪点&quo

大数据法治法治的一种新形态

客观上,我们应当正视一个事实,一个大范围生产.共享和应用数据的时代已经来临.大数据已经不再是美好的愿景而是正在发生的智慧实践.2015年,国务院出台的<促进大数据发展行动纲要>就是标志.因此,大数据法治已不完全是一种理论构想,而是正在具有鲜明时代背景的实践命题.大数据法治实质上是量化法治的一个跃升阶段,是法治的一种新形态,是一种智慧型法治.精准型法治.效率型法治. 大数据法治是什么 根据学界对大数据和治理或法治的论述,我们可以对"大数据法治是什么"这一元命题X进行层层分解.

用SAS大数据分析:准备好建立商业模式新帝国了吗?

CNET科技资讯网 4月23日 北京报道 (文/张晓楠):如果细心研究一下不久前在北京召开的第二届SAS中国用户大会暨商业分析领袖峰会的主题,会发现有意思的变化,本届大会主题是"大数据分析-知变与机遇".对于在数据分析领域已经有40年专业经验的SAS公司来说,其对大数据市场的洞察有着过人之处.大数据概念不仅在今天已经广为人知,而且其价值也在实实在在落地.对于用户来说,如今时代不是发现大数据.考虑用不用大数据的时代,而是如何抓住大数据到来的机遇,给自己企业一个腾飞契机的时代. 对于这一改

Azure平台 对Twitter 推文关键字进行实时大数据分析

Learn how to do real-time sentiment analysis of big data using HBase in an HDInsight (Hadoop) cluster. Social web sites are one of the major driving forces for Big Data adoption. Public APIs provided by sites like Twitter are a useful source of data

Java SE 6.0调用Java编译器的两种新方法

在很多Java应用中需要在程序中调用Java编译器来编译和运行.但在早期的版本中(Java SE5及以前版本)中只能通过tools.jar中的com.sun.tools.javac包来调用Java编译器,但由于tools.jar不是标准的Java库,在使用时必须要设置这个jar的路径.而在Java SE6中为我们提供了标准的包来操作Java编译器,这就是javax.tools包.使用这个包,我们可以不用将jar文件路径添加到classpath中了. 一.使用JavaCompiler接口来编译Ja

Java SE6调用Java编译器的两种新方法

本文为原创,如需转载,请注明作者和出处,谢谢! 本文曾发表于天极网:http://dev.yesky.com/451/3039451.shtml 在很多Java应用中需要在程序中调用Java编译器来编译和运行.但在早期的版本中(Java SE5及以前版本)中只能通过tools.jar中的com.sun.tools.javac包来调用Java编译器,但由于tools.jar不是标准的Java库,在使用时必须要设置这个jar的路径.而在Java SE6中为我们提供了标准的包来操作Java编译器,这就