Hadoop掀起大数据革命 三巨头齐发力

本文讲的是Hadoop掀起大数据革命 三巨头齐发力,开源的数据处理平台凭借其低成本、高扩展性和灵活性的优势已经赢得了多数网络巨头的认可。现在Hadoop将进入更多企业。IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统。上个月Oracle和Microsoft也分别透露了将计划在明年发布基于Hadoop的产品。两家公司都计划提供协助部署服务和企业级支持。Oracle已经承诺将会在大数据设备中预装Hadoop软件。

  大数据革命正以Apache Hadoop为中心如火如荼的进行着。自从开源分布式数据处理平台在5年前发布时讨论之声就不绝于耳。但在过去的18个月中,Hadoop赢得了客户的认可,并得到众多商业化的支持以及众多数据库和数据集成软件商的整合。在众多厂商之中最著名的三个商业数据供应商当属Oracle、IBM和Microsoft。

  Hadoop会在未来成为大数据的重大技术吗?

  Hadoop是一个基于Java的分布式密集数据处理和数据分析的软件框架。Hadoop在很大程度上是受Google在2004年白皮书中阐述的MapReduce的技术启发。MapReduce工作原理是将任务分解为成百上千块的小任务,然后发送到计算机集群中。每台计算机再传送会自己那部分信息,MapReduce则迅速整合这些反馈并形成答案。

  Hadoop的扩展性非常优秀,Hadoop可处理分布在数以千计的低成本X86服务器计算节点中的大型数据。同时由于众所周知的摩尔定律,内存和磁盘的容量也在不断增长。Hadoop对硬件的支持也在加强,现在每个节点可部署16核的处理器,12TB甚至24TB磁盘。Cloudera透露其推出的产品每个节点的成本大约4000美元。这个价格对于关系数据库部署每TB 10000至12000美元来说极具竞争优势。

  这种高容量低成本的组合引人注目,但Hadoop最吸引人的是其处理混合数据类型的能力。

  Hadoop可以管理结构化数据,以及诸如服务器日志文件和Web点击流的数据。同时还可以管理以非结构化文本为中心的数据,如Facebook和Twitter。这种处理多类型数据的能力非常重要。它催生了NoSQL平台和产品。如Cassandra, CouchDB, MongoDB以及Oracle最新的NoSQL数据库。而传统关系型数据库如Oracle,IBM DB2,Microsoft SQL Server和MySQL则都不能处理混合数据类型和非结构化数据。 由于事务处理灵活性的需求,Hadoop获得大多数数据分析厂商的关注和支持。

  Hadoop已被广泛应用

  现今,Hadoop已被认为是非结构化数据的专用技术。低成本、高扩展性和灵活性等优势已成为处理大规模点击流量分析和广告定位等网络巨头(如AOL和comScore)的首选。

  AOL三年多时间一直使用Hadoop。AOL的研发团队在加利福尼亚州的Mountain View部署了300节点的系统,该系统可以存储每天数十亿事件和超过500TB的点击流数据。点击所带来流数据是高度结构化的,但数据量是非常庞大和多样的。所以几乎不可能处理所有的提取、转换和负载工作。AOL为了解决以上问题决定使用Hadoop MapReduce处理分布在数百个计算节点的数据过滤和关联任务。由于Hadoop为业务带来的优势,AOL的Hadoop研发团队在今年四月在其总部部署了700节点的系统。

  Hadoop适用于所有类型数据的特性注定将使Hadoop在更广泛的领域使用。例如提供托管服务和中小型企业应用服务提供商SunGrad。他们将计划推出基于云的托管服务,旨在帮助金融服务公司处理他们基于Hadoop MapReduce的数据处理。

  商用软件厂商Tidemark最近也推出一款SaaS软件,这种基于云的性能管理应用使用MapReduce将混合数据源转化为产品或金融规划方案。

  三巨头大数据领域齐发力

  在上月美国拉斯维加斯举行IOD年度大会上IBM院士、DB2总架构师Curt Cotner宣布IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统。他还表示未来的数据库发展方向是非关系数据库NoSQL。目前Google的BigTable和Amazon的Dynamo都用NoSQL型数据库,而传统的关系数据库在应付超大规模、高并发的SNS、web2.0网站已经力不从心。同时IBM发布了一系列数据分析软件,包括云计算版本的InfoSphere BigInsights。BigInsights是一套建立在Hadoop上的数据分析软件,能够处理企业用户收集大量非结构化资料。

  微软也在10月12日在西雅图举行的SQL PASS 2011峰会宣布将与从雅虎分拆出来的Hortonworks合作开发Hadoop,并将在Apache Hadoop上实现搭建Windows Azure以及Windows Server平台。同时基于Hadoop的Windows Server还会与微软现有的BI工具联合处理任务。

  Oracle作为全球最大的关系型数据库提供商也有所行动。其在2011 Oracle全球大会上推出了Big Data Appliance。Big Data Appliance是一个集成了Hadoop、NoSQL Database、Oracle数据库Hadoop适配器、Oracle数据库Hadoop装载器及R语言的系统。

  Hadoop的未来

  根据目前的状况来看,Hadoop作为企业级数据仓库体系结构核心技术,在未来的数年中将会保持持续增长的势头。包括MapR、Zettaset、Cloudera、HStreaming、Hadapt、DataStax、Datameer这些与Hadoop相关的新公司已经获得投资,为人们所熟知,为各种市场带来最新技术。

  与此同时下一代的MapReduce会完善很多之前不尽人如意的地方。首先节点数将从目前的4000增加到6000-10000,其次并发的任务数从目前的40000增加到100000。另外将继续加大对硬件支持,同时架构也会有所改变,包括更多编程模式的支持。

作者:王玉圆

来源: IT168

原文标题:Hadoop掀起大数据革命 三巨头齐发力

时间: 2025-01-01 13:10:32

Hadoop掀起大数据革命 三巨头齐发力的相关文章

安徽卫视春节攻略大曝光电视剧综艺齐发力(图)

刘欢 维塔斯 赵薇 孙楠 新浪娱乐讯 春节临近,卫视收视之战再度打响,各家卫视也都将推出精心编排的节目以飨观众.记者昨日了解到,安徽卫视此番春节攻略可谓动作不断,用自制剧<夏家三千金>和<花样少年少女>与央视春晚争收视,更请来刘欢.维塔斯.赵薇.姚晨.范冰冰.郭德纲.周立波等当红明星助阵春节荧幕,还有独家上星的经典泰剧火热上演,可谓来势汹汹,锐不可当. 电视剧篇 <夏家三千金>PK央视春晚 春节期间,<夏家三千金>将继续在每晚7点半档的黄金时间段播出.在从第

三大运营商齐发力大数据

当前以大数据.云计算.人工智能为代表的现代信息通信技术,正在引领新一轮的产业革命.大数据能够催生出极具创新力的各类应用产品,激发出全新的商业模式,改变人们的生产和生活方式,同时不断孕育出新的产业,培育出新的经济增长点.到2020年,大数据产业将突破一万亿元的规模,成为推动供给侧结构性改革和经济转型升级的重要的引领,并加速推动人类社会步入智能时代. 三大运营商齐发力大数据 2013年中国电信着手布局大数据业务,发起设立了中国企业大数据的联盟(BDU),推动数据标准的制定.目前电信云公司大数据节点上

三剑齐发 蓄势出击:亚信新一代PaaS产品重磅发布

PaaS:平台即服务,作为云计算的三大领域之一,现在已经不是什么新鲜事物了.早自2013年起,亚信的大数据平台专家技术团队就已组建.历经近3年的研发投入与项目实践,现在已经打造出了亚信分布式数据库系统ADB.高性能云计算平台HPS.大数据云平台DCP三款产品,旨在共同构建一套完整的PaaS平台解决方案.通过该PaaS平台,能将亚信拥有的大数据.CRM.BOSS以及众多核心应用能力逐渐服务化.组件化,由该平台统一承载并提供基于云计算的服务. 近日,亚信数据[三剑齐发 蓄势出击]大数据平台产品发布会

三箭齐发合肥荣事达三洋打造“白电王国”

近日,关于荣事达品牌回归的公告可谓"一石激起千层浪",荣事达品牌回归俨然成为行业的焦点事件.在外界看来,荣事达品牌的回归意味着一个不容忽视的事实,合肥荣事达三洋未来将同时手握帝度.三洋.荣事达三张王牌.依托于国内顶尖的家电技术平台,凭借精工制造与研发能力,三大品牌将以三箭齐发的态势向家电市场全力发起冲击.这样的情形所显现的,正是安徽这一家电大省强势进取的信号,合肥荣事达三洋更作为国内家电行业技术领军者,顺利成章的担纲起这场家电大戏的领衔主演.从梦想到现实 建造"白电王国&qu

搜狗“三箭齐发”扩张逻辑暧昧 王小川称明年揭晓答案

5月3日消息,刚刚公布2012年第一季度财报的搜狗,除了营收184%的同比增长率外,还高调宣布了产品计划和员工人数.包括已有产品及研发中产品,搜狗称已拥有10个产品,PC端和手机端各占一半:员工人数突破1000人,技术员工比例为75%.但是在产品扩张和人数扩张的背后,搜狗究竟打着怎样的算盘?而传说中的上市计划何时付诸实施?王小川称,明年再看. 产品策略 搜狗目前已有产品包括10款,包括PC端5款,移动端5款,目前面世的有:PC端输入法.浏览器.搜索,手机端输入法.输入板以及号码通,其余四款均在尚

三箭齐发多层次资本市场加速前行

改革和完善新股发行体制.发布创业板一整套制度安排.对中关村股份报价转让试点做出五项制度调整--近两个月,主板(含中小板).创业板.股份转让平台三箭齐发,谋划多年的我国多层次资本市场体系建设再提速.在这些密集推出的政策背后,一个立体.系统.有机的多层次资本市场巨厦雏形已现. 一位权威专家曾形象地比喻,我们现在要建立的多层次市场就像盖一座三层楼房,顶层是主板市场,中间是创业板,一楼乃至基石则是以代办转让平台为基础的统一监管下的全国性场外市场.而三层楼之间也不是孤立的,转板机制就像楼梯一样把各个板块有

独播、跨屏、自制三剑齐发芒果TV打造媒体融合新格局

(图:快乐阳光互动娱乐传媒有限公司董事副总裁刘琛良)(图:第九届<综艺>新媒体高峰论坛现场)11月30日下午,由<综艺报>社和芒果TV联合举办的第九届<综艺>新媒体高峰论坛在北京?梅地亚宾馆举行.论坛以"新融合?新思维"为主题,诚邀国内主流电视机构高层.视频新媒体机构高层.业界专家,深度探讨媒介融合进程中的战略与合作,共促行业良性生态的有效构建和节目制播运营业务的顺势升级.本届论坛聚焦"传统媒体与新媒体全面融合发现新蓝海",&qu

电商三巨头相继发力 家电网购价格被拉低三成

商报讯(记者 崇晓萌)在http://www.aliyun.com/zixun/aggregation/30884.html">行业龙头目标的驱动下,电商企业动了真格.昨日,购物搜索一淘网最 新的监测数据显示,近一周内,由天猫.京东商城.苏宁易购等掀起的"史上最大规模价格战",使3C数码家电类超过1.5万件商品的平均降幅为20%-35%. 天猫 电器城3天前宣布,投入2亿元掀起"狂暑季"促销,电器产品通过 限时抢购.团购等方式进行了降价:京东商城迅速

英国储能市场与政策齐发力

2016年以来,一系列储能行业大事件,如200MW英国国家电网先进频率响应(EFR)项目招标的中标技术全部为储能技术,以及2020/21容量市场成功交易了500MW新建电池储能容量等,都使得英国的储能市场引起了国内外电池储能厂商.投资者.政策制定者以及能源行业的其他各方更多的关注. 2017年上半年,英国储能市场依旧活跃,中关村储能产业技术联盟(CNESA)研究部将从项目的发布情况.市场活动以及政策推动等方面分析上半年英国储能市场的发展态势,为读者提供参考. 一.储能项目 ◆电网级电池储能项目