一种基于NoSQL的并行数据增量处理机制研究

一种基于NoSQL的并行数据增量处理机制研究

华中科技大学  刘炜

云计算为数据处理工作带来了新的机遇与挑战。传统的关系型数据库在大数据的需求面前显得力不从心,而分布式非关系型数据库由于其高可靠性、高可用性的特性,能够满足大数据带来的高并发、高读写需求。然而,分布式非关系型数据库优越的性能是以牺牲SQL数据处理能力为代价的。因此,提高非关系型数据库的数据处理能力就成为一个重要的研究课题。非关系型数据库数据处理能力可以从离线数据处理和在线数据处理两个方面进行提高。在离线数据处理方面,将开源MapReduce数据处理系统Hadoop与非关系型数据库相结合,通过为非关系型数据库实现Hadoop作业配置模块、数据分片模块、数据输入和输出模块,Hadoop能直接对存储在非关系型数据库中的海量数据进行处理,既保留了非关系型数据库高可靠、高可用的特性,又增强了系统对数据的离线批处理能力。而在在线数据处理方面,首先基于非关系型数据库内置的分布式单行事务功能,通过一系列存储控制过程实现分布式多行事务算法。其次通过在数据库表中增加冗余列和为数据库系统调用注册钩子函数的方法,在非关系型数据库中实现类似触发器的消息通知机制。根据多行事务算法和消息通知机制,针对具体应用场景,在非关系型数据库中实现增量数据处理,以满足在线数据处理的需求。针对包含4,200,000条结构化数据记录的数据集进行了测试。

一种基于NoSQL的并行数据增量处理机制研究

时间: 2024-09-22 08:10:12

一种基于NoSQL的并行数据增量处理机制研究的相关文章

一种基于NoSQL的地图瓦片数据存储技术

一种基于NoSQL的地图瓦片数据存储技术 陈超 ,王亮,闫浩文,仇阿根,李玉祥,朱芳菲 本文首先介绍了NoSQL(非关系型数据库)的起源与发展,对比其与关系型数据库的优缺点,提出了基于NoSQL的地图瓦片数据存储策略,通过实验对比分析了面向文档型的NoSQL数据库产品Mongo DB与SQL Serv-er 2000在瓦片入库与并发访问性能上的差异.研究结果表明,Mongo DB在海量空间数据存储与并发访问方面具有明显的高效性. 一种基于NoSQL的地图瓦片数据存储技术

Redis内核基于时间点的备份恢复和基于AOF日志的增量同步机制设计

直播视频回顾 Redis内核支持基于时间点的备份恢复 Redis内存数据库,须有一种机制能够把内存中的数据持久化到硬盘上,再将硬盘中数据备份到备份系统中,才能去做恢复.Redis原生的持久化机制包括RDB持久化和AOF持久化两种. RDB持久化 RDB持久化触发方式有两种: 手动触发:执行BGSAVE命令: 自动触发:配置SAVE选项,在指定时间内发生指定次数的key修改,自动进行后台RDB SAVE. RDB持久化流程如下: 在做RDB SAVE时需要fork一个子进程,每次RDB SAVE生

基于分割的数字图像云存储机制

基于分割的数字图像云存储机制 吕骁博 郭耀 陈向群 随着云计算和数据中心的发展,数据处理和存储工作逐渐转移到云平台上. 通过云服务器存储数字图像可以解决图像存储和共享的问题,但是一些云服务器可能难以保证这些数字图像数据的可靠性和可用性,导致用户隐私泄露. 本文提出了一种基于分割的数字图像云存储机制,并采用了两种不同的图像分割算法:分块分割和分层分割.为了验证该机制,实现了一个支持隐私保护的数字图像云存储工具,针对不同图像分割方法进行了比较分析与实现,对所选的不同云服务器服务质量进行了测试. 通过

基于NoSQL数据库的大数据存储技术的研究与应用

基于NoSQL数据库的大数据存储技术的研究与应用 孙中廷 实际工程中采集和处理的数据量特别大,这对传统数据库技术提出巨大挑战.针对传统关系型数据库存储速度慢.对硬件要求高的缺点,提出一种以NoSQL数据库为基础的大数据处理方法,打破了传统数据库的关系模型,数据以一种自由的方式存储,而不依赖固定的表结构.该方法主要是将经验模态分解并与NoSQL数据库技术相结合,应用于大型结构件的变形监测中,构建出一个基于NoSQL数据库系统的大型结构件变形监测系统.仿真结果表明,该方法可以实现大型结构件变形监测数

基于NoSQL数据库的大数据查询技术的研究与应用

基于NoSQL数据库的大数据查询技术的研究与应用 朱建生  汪健雄  张军锋 基于NoSQL数据库理论,根据应用场景的不同,将NoSQL数据库分为面向高性能读写.面向文档和面向分布式计算的3种类型.对比分析这3种类型数据库的6种代表产品的优缺点,结合铁路客票实名制售票信息综合分析系统中的大数据操作的需求,选用NoSQL数据库中的面向分布式计算的Cassandra数据库.基于Cassandra数据库,提出铁路客票实名制信息综合分析系统的技术架构,并设计反向索引以构建客票实名制乘车信息的查询策略和查

一种基于 JEP 和可配置公式实现用户自定义字段的解决方案

背景 随着 IT 技术的普及和发展,用户的信息化水平越来越高,软件产品除了满足用户的基本需求 之外,还必须越来越照顾到用户的个性化需求,为用户提供深层次的个性化服务.以一个包含报表展示功能的 产品为例,默认呈现给所有用户完全相同的报表,即同一个报表的字段内容和标签对所有用户完全相同.而在 实际中,我们常常会遇到不同的用户由于其业务需求的不同,对于同一张报表,除基本数据字段之外,还要求 额外增加符合该用户特定业务含义的字段,我们称之为用户自定义字段(Custom Metric).这类需求在财务 报

IBM Java Toolbox for i实现三种基于IBM i的身份验证策略

对于从事IBM i平台的应用开发者而言,用户身份验证是保证程序安全性的最基本功能之一.作为访问与操 纵IBM i平台上数据与资源的Java API,IBM Java Toolbox for i从编程的角度,实现了各种用户身份验证策 略,可简单.高效地解决程序的安全性问题.本文将从Web应用的角度,结合具体样例,指导IBM i Web应用程 序开发者如何使用IBM Java Toolbox for i实现不同的身份验证策略.有关IBM Java Toolbox for i的基础知 识,请参见另一篇

一种基于EMF模型的在GEF中判断创建连接线有效性的方法

简介: 结合目前比较受欢迎的 EMF(Eclipse Modeling Framework)和 GEF(Graphical Editing Framework)技术,提出了一种在图形化开发中创建连接线时普遍适用的验证方法. 最后给出了一个创建 连接线时动态 Schema 验证的例子,并根据 Schema 的定义列出创建连接线的真值表.针对该真值表的每 项进行验证,保证不符合 Schema 定义规则的模型对应的图形之间不能创建连接线,降低了 Schema 验证 和修改的复杂性. 一种基于 EMF

DockOne微信分享(一三一):Juice——一种基于MesosFramework的任务云框架

本文讲的是DockOne微信分享(一三一):Juice--一种基于MesosFramework的任务云框架[编者的话]近年来,随着Mesos在生产环境中的普及,使大规模的集群管理变得简单,而基于MesosFramework开发的Juice框架,能够完成分布式任务的分发,处理,对于资源利用率的提高有很大的帮助,今天就为大家介绍一下这套框架. [3 天烧脑式容器存储网络训练营 | 深圳站]本次培训以容器存储和网络为主题,包括:Docker Plugin.Docker storage driver.D