云队列:一个基于Hadoop的大规模消息基础平台

云队列:一个基于Hadoop的大规模消息基础平台

东华大学 史冬冬

本文基于从当前分布式系统消息通信的需求出发,并结合Hadoop云计算平台,提出了一个面向Internet规模的、高性能和高可靠的消息队列服务平台——云队列(Cloudqueue)。通过云队列平台所提供的消息服务实现异步通讯、存储转发、可靠传输、跨互联网等特性,云队列可以在云计算时代为应用程序提供高性能、高可靠、大容量的面向互联网的消息传递服务。 文章从现实需求出发,在分析了消息中间件的相关基础知识和Hadoop关键技术的基础之上,提出了云队列系统的设计目标与整体架构,然后,通过分析相关的关键技术,提出了云队列的技术架构和对象模型。最后,本文详细地介绍了云队列的具体实现和相关接口的定义。 最后,通过实验和分析,证明了本文提出的云队列系统比传统的消息中间件集群系统,有着更高的性能、可靠性和伸缩性。

关键词:云计算 消息中间件 消息队列 Hadoop HBase ZooKeeper

[下载地址]:http://bbs.chinacloud.cn/showtopic-13238.aspx

时间: 2024-11-03 11:52:37

云队列:一个基于Hadoop的大规模消息基础平台的相关文章

基于Hadoop的云计算与存储平台研究与实现

随着互联网技术的发展,数宇信息正在成指数增加,根据Internet Data Cente:发布的Digital Universe报告显示,在未来8年中所产生的数据量将达到40 ZB,相当于每人产生5200 G的数据,如何高效地计算和存储这些海量数据成为互联网企业所要而对的挑战.传统的大规模数据处理大多采用并行计算.网格计算.分布式高性能计算等,耗费昂贵的存储与 计算资源,而且对于大规模数据计算任务的有效分配和数据合理分割都需要复杂的编程才可以实现.基于Hadoop分布式云平台的出现成为解决此类问

第三组:基于云计算的大规模负载测试平台Bench4Q

第三组:各位同学,各位尊敬的嘉宾,大家好,今天我带来一个题目是:基于云计算的大规模负载测试平台,我是陈铁男.不同于刚才两位同学,我们是为服务提供服务的.基于互联网开放的情况下,在用户不可预计的情况下,能否依然为用户提供良好的服务.下面是我们这个项目基本情况的介绍.Bench4Q是基于云计算的大规模负载测试平台.我们拿出的产品是相对学院派的风格,不同于其他,他们是市场化.商业化的情况. 什么是负载测试?通过自动化的测试工具,模拟多种正常的.峰值的.异常的测试条件.它的测试目的很清晰,就是在这种测试

基于Hadoop的智能家居信息处理平台

基于Hadoop的智能家居信息处理平台 徐源吾 王珣 智能家居包含门禁系统.温湿度系统.室内滴灌系统.照明系统等.每一个系统包含了不同的终端,每一个终端安装有不同的传感器,传感器感知周围环境产生大量数据.用户数的不断增加将产生海量数据.本文针对传统的海量数据处理方法会出现硬件成本高.计算瓶颈等问题,在云计算理论的基础上针对智能家居中的门禁系统.温湿度系统.滴灌系统和照明系统搭建了基于Hadoop的数据处理平台.该平台对大量传感信息进行分布式并行处理,并根据处理结果向底层设备发送指令以实现智慧化服

Q+是一个基于Windows系统的开放式应用平台

"Q+"是一个基于Windows系统的开放式应用平台,当用户一键切换到"Q+"后,它接管原有的Windows桌面. 刚才更新腾讯Q+最新版本4.5,看着最新特性的介绍,我心动了,毫不犹豫的点击了升级. 结果发现:以往的Q+应用是独立的,所有添加应用都以独立窗口方式打开,不会跳转到第三方网站.而本次升级,Q+应用直接导入了Q空间应用--每个独立应用以快捷方式出现在Q+桌面,当你点击桌面应用则弹出浏览器网页方式进入QQ空间应用,此举使Q+失去存在价值. 更奇葩的是,原本

基于云计算的大规模性能测试服务平台

基于云计算的大规模性能测试服务平台 陈铁南 唐震 王晓冉 任凯 支孟轩 性能测试是通过自动化的测试工具模拟多种正常.峰值以及异常负载条件来对系统的各项性能指标进行测试.测试对象分为基准测试和非基准测试两种.大规模的性能测试受到所需的大量软硬件资源以及与此规模匹配的管理维护代价的限制,传统的性能测试采用一种1:20的微缩仿真模拟,但这种微缩仿真测试不充分,会带来严重的后果.采用云计算技术,使用其承诺的按需的廉价软硬件资源服务,来构建大规模性能测试服务平台,提供按需定制的测试服务. 基于云计算的大规

基于云计算的医院信息基础平台建设

基于云计算的医院信息基础平台建设 马锡坤 史兆荣 王与荣 于京杰 医院信息基础平台是信息应用平台和运维平台的根基.利用云计 算技术,构建虚拟计算池.存储池.网络池.桌面池.安全池等资源池,建设动态数据中心和虚拟桌面,为数字化医院建设奠定坚实的信息基础平台.文章通过分析 传统医院信息基础平台现状,介绍云计算技术原理,阐述了基于云计算的医院信息基础平台的建设目标,提出应遵循的建设原则,并指出云计算平台是医院信息平台的未来. 基于云计算的医院信息基础平台建设

解读:基于Hadoop的大规模数据处理系统

Hadoop的组成部分 Hadoop是Google的MapReduce一个Java实现.MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行. Hadoop主要由HDFS.MapReduce和HBase等组成.具体的组成如下图: Hadoop的组成图 1. Hadoop HDFS是Google GFS存储系统的开源实现,主要应用场景是作为并行计算环境(MapReduce)的基础组件,同时也是BigTable(如HBase. HyperTable)的

基于Hadoop云计算智能家居信息处理平台

近年来,在物联网等具有海量数据需求的应用变得越来越普遍时,无论是从科学研究还是从应用开发的角度来看,掌握云计算技术已成为一种趋势.智能家居作为物联网应用的主要领域之一,自然离不开云计算.云计算的发展使用户无需关注复杂的内部工作机制.无需具备丰富的分布式系统知识及开发经验,即可实现大规模分布式系统规定部署,以及海量数据的并行处理. Hadoop是目前较为成熟和应用较为广泛的云计算架构之一.Hadoop的核心思想是分布式并行处理.Hadoop技术中的关键技术是 HDFS(分布式文件系统)和Map/R

基于Hadoop的数据仓库Hive基础知识

Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理.特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行. 一.概述 1-1 数据仓库概念 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented).集成的(Integrated).相对稳定的(Non-Volatile).反应历史变化(Time Variant)的数据集合,用于支持