异构大数据存储方法研究

异构大数据存储方法研究

北京交通大学   单旭

主要的研究内容包括以下几个方面:首先,针对大数据的产生及所带来的挑战,从技术的角度论述了非关系数据库的发展历程。从总体上对关系数据库和非关系数据库的特点进行了对比,详细分析了关系数据库的优缺点及在大数据环境下遇到的瓶颈,深入研究了非关系数据库的架构、理论、特征及存储模型,阐述了其相比于关系数据库所存在的优势。然后,从功能上和性能上对微博系统具体的存储要求进行了深入分析,采用非关系数据库中三种具有不同存储模型的数据库,包括Redis、HBase和MongoDB,结合各自的特点来研究微博系统相关存储功能的实现,提出了适合微博系统的数据存储方案,设计了数据存储结构,可以满足对实时性、扩展性、可靠性和并发性的要求。同时使用关系数据库进行设计,通过对比,从理论上证明了非关系数据库研究的合理性。最后,针对微博系统设计的存储结构,选取典型的测试场景,使用不同数据库平台,进行了一系列的验证测试。通过对测试结果的分析与比较,可以证明本文设计的数据存储方案是有效的,能够满足微博系统的存储需求,并为异构大数据环境下具有类似需求的数据存储问题提供解决思路。

异构大数据存储方法研究

时间: 2024-09-17 03:30:14

异构大数据存储方法研究的相关文章

《大数据管理概论》一3.2 大数据存储与管理方法

本节书摘来自华章出版社<大数据管理概论>一书中的第3章,第3.2节,作者 孟小峰,更多章节内容可以访问"华章计算机"公众号查看 3.2 大数据存储与管理方法 闪存.PCM等新型存储介质的引入使得大数据存储架构有了多种选择.但由于新型存储介质在价格.寿命等方面与传统的磁盘相比不具优势,因此目前主流的观点是在大数据存储系统中同时使用新型存储介质和传统存储介质,由此产生了多种基于新型存储的大数据存储架构,如基于PCM的主存架构.基于闪存的主存扩展架构.基于多存储介质的分层存储架构

基于NoSQL数据库的大数据存储技术的研究与应用

基于NoSQL数据库的大数据存储技术的研究与应用 孙中廷 实际工程中采集和处理的数据量特别大,这对传统数据库技术提出巨大挑战.针对传统关系型数据库存储速度慢.对硬件要求高的缺点,提出一种以NoSQL数据库为基础的大数据处理方法,打破了传统数据库的关系模型,数据以一种自由的方式存储,而不依赖固定的表结构.该方法主要是将经验模态分解并与NoSQL数据库技术相结合,应用于大型结构件的变形监测中,构建出一个基于NoSQL数据库系统的大型结构件变形监测系统.仿真结果表明,该方法可以实现大型结构件变形监测数

从政策驱动到技术践行 大数据开辟可持续发展研究新途径

可持续发展及面临的难题 可持续发展是世界对发展道路的审慎选择,也是我国的基本发展战略.随着全球资源枯竭.环境恶化的日益严重以及人类文明的演进和对生态保护理念的不断深化,可持续发展已经成为全球共识,对这一领域的研究也越来越热,日渐深入. 实现可持续发展的关键是如何制定合理的.能够平衡环境.经济和社会需求的复杂决策.然而自然.社会.经济系统本身的高度复杂性.动态性以及不确定性使得实现这一最优或近似最优的决策成为一个巨大的挑战.目前,可持续发展战略的实施仍然停留在政策驱动的层面,如何落实到技术实战,成

中国移动钱岭:电信运营商大数据商务模式研究

[CSDN现场报道]2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研.应用与产业发展为主旨的2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店盛大开幕. 中国移动苏州研发中心大数据产品部总经理钱岭带来的演讲是"电信运营商大数据商务模式研究",通信管道是大数据的一个重要来源,钱岭

应用解析:大数据存储服务选择最佳做法

磁盘存储就像是衣橱,永远不够用,在大数据时代,这一点尤为突出."大数据"意味着需要比传统存储平台处理更多的数据.那么这对于CIO意味着什么呢?意味着他们将需要做出更多的努力,而可供参考的信息却很少. 不过,在为大数据选择存储服务时也并不是完全无迹可寻. 何谓大数据 首先,我们需要清楚大数据与其他类型数据的区别以及与之相关的技术(主要是分析应用程序).大数据本身意味着非常多需要使用标准存储技术来处理的数据.大数据可能由TB级(或者甚至PB级)信息组成,既包括结构化数据(数据库.日志.SQ

未来大数据存储:1PB仅需一张光盘

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;     以后数据存储无论个人用户,抑或不同规模的企业政府机关等,都可更加轻松地进行.来自斯威本科技大学(SwinburneUniversityofTechnology)的研究团队负责人MinGu教授最新开发出了一种全新的数据存储方式,可将1PB(1024TB)的数据存储到一张仅DVD大小的聚合物碟片上. 大数据存储在当今世界已经显得尤为必要,而且我们人类自步入数字时

详解大数据存储:哪些问题最容易出现

"大数据" 通常指的是那些数量巨大.难于收集.处理.分析的数据集,亦指那些在传统基础设施中长期保存的数据.这里的"大"有几层含义,它可以形容组织的大小,而更重要的是,它界定了企业中IT基础设施的规模.业内对大数据应用寄予了无限的期望 商业信息积累的越多价值也越大 只不过我们需要一个方法把这些价值挖掘出来. 也许人们对大数据的印象主要从存储容量的廉价性而来,但实际上,企业每天都在创造大量的数据,而且越来越多,而人们正在努力的从浩如烟海的数据中寻觅有价值的商业情报.另一

实时大数据存储及查询分析解决方案

问题描述 实时大数据存储及查询分析解决方案 上千辆设备每隔10秒上传一次数据,我要把数据存储起来,然后在基于这些数据进行查询分析, 担心传统的做法后期会有很大的性能问题,请教有做过这方面的经验的高手共享一下思路. 解决方案 你这种情况就非常适合使用基于Hadoop的HBase来存储数据,HBase不仅仅适合于做大数据的存储和处理,它的一个突出的性能优势就是写数据, 你的系统每隔10s就要写一次数据,Hbase就比较适合,最好不要使用传统的关系型数据库(例如MySql),这会让你的系统在后期出现许

《大数据存储:MongoDB实战指南》一1.8 几个重要的进程介绍

1.8 几个重要的进程介绍 大数据存储:MongoDB实战指南 通过官网下载的二进制包中有几个重要的可执行文件,这些可执行文件运行后都会对应一个相应的进程. 1.8.1 mongod进程 Mongod.exe为启动此数据库实例进程对应的可执行文件,是整个MongoDB中最核心的内容,负责数据库的创建.删除等各项管理工作,运行在服务器端为客户端提供监听,相当于MySQL数据库中的mysqld进程. 启动数据库实例会用到以下命令. mongod --config E:\MongoDB-win32-i