LSM树存储模型

----《大规模分布式存储系统：原理解析与架构实战》读书笔记

之前研究了Bitcask存储模型，今天来看看LSM存储模型，两者虽然同属于基于键值的日志型存储模型。但是Bitcask使用哈希表建立索引，而LSM使用跳跃表建立索引。这一差别导致了两个存储系统的构造出现明显的分化。为此，我还先去捣腾了一番跳跃表的实现.今天算是进入了正题。

LSM的结构

LSM的基本思想是将修改的数据保存在内存，达到一定数量后在将修改的数据批量写入磁盘，在写入的过程中与之前已经存在的数据做合并。同B树存储模型一样，LSM存储模型也支持增、删、读、改以及顺序扫描操作。LSM模型利用批量写入解决了随机写入的问题，虽然牺牲了部分读的性能，但是大大提高了写的性能。

MemTable

LSM本身由MemTable,Immutable MemTable,SSTable等多个部分组成，其中MemTable在内存，用于记录最近修改的数据，一般用跳跃表来组织。当MemTable达到一定大小后，将其冻结起来变成Immutable
MemTable，然后开辟一个新的MemTable用来记录新的记录。而Immutable MemTable则等待转存到磁盘。

Immutable MemTable

所谓Immutable MemTable，即是只能读不能写的内存表。内存部分已经有了MemTable，为什么还要使用Immutable MemTable？个人认为其原因是为了不阻塞写操作。因为转存的过程中必然要保证内存表的记录不变，否则如果新插入的记录夹在两条已经转存到磁盘的记录中间，处理上会很麻烦，转存期间势必要锁住全表，这样一来就会阻塞写操作。所以不如将原有的MemTable变成只读Immutable MemTable,在开辟一个新的MemTable用于写入，即简单，又不影响写操作。

SSTable

SSTable是本意是指有序的键值对集合( a set of sorted key-value pairs )。是一个简单有用的集合，正如它的名字一样，它存储的就是一系列的键值对。当文件较大的时候，还可以为其建立一个键-值的位置的索引，指明每个键在SSTable文件中的偏移距离。这样可以加速在SSTable中的查询。(当然这一点是可选的，同时让我想去了Bitcask模型中hint文件，通过记录键-值的位置 ,来加速索引构建)

使用MemTable和SSTable这两个组件，可以构建一个最简单的LSM存储模型。这个模型与Bitcask模型相比，不存在启动时间长的问题，但是这个模型的读性能非常的差，因为一但在MemTable找不到相应的键，则需要在根据SSTable文件生成的时间，从最近到较早在SSTable中寻找，如果都不存在的话，则会遍历完所有的SSTable文件。

如果SSTable文件个数很多或者没有建立SSTable的文件内索引的话，读性能则会大大下降。

除了在对SSTable内部建立索引外，还可以使用Bloom Fileter,提高Key不在SSTable的判定速度。同样，定期合并旧的SSTable文件，在减少存储的空间的同时，也能提高读取的速度。下面这幅图很好的描述了在LSM的大部分结构和操作

LevelDB如何优化读性能

Leveldb是一个轻量级的，快速的以存储为目的的key-value存储引擎。其使用的正是LSM存储模型。我们可以看看LevelDB是如何来优化读性能的。在LevelDB中，存在一种元信息文件MANIFEST，用于记录leveldb的元信息，比如DB使用的Comparator名，以及各SSTable文件的管理信息：如Level层数、文件名、最小key和最大key等等。相比而言，元信息文件而SSTable文件的数目成正比，一般来说不会太多，是可以载入内存的，因此Level可以通过查询元信息，从而判断哪些文件中存在我们需要的Key对应的记录，减少SSTable文件读取次数。此外，LevelDB的合并操作Compaction是分层次进行的，每一层都有多个SSTable文件，每次合并后除了Level0和内存的MemTable，Immutable
MemTable中会有重复的键值外，LevelN(N>=1)的各层内部的SSTable文件不会再有重复的键值。同时，如果在Level N 层读到了数据，那么就不需要再往后读Level N+1,Level N+2等层的数据了.因为Level N层的数据总是比Level N+1等层的数据更“新鲜”。

实现一个简单的LSM存储模型

根据上面讲述的原理，实现了一个简单的LSM模型(https://github.com/Winnerhust/Code-of-Book/blob/master/Large-Scale-Distributed-Storage-System/lsm_tree.py)。这个模型也内存表为一个跳跃表，SSTable就是简单的有序键值对集合，没有SSTable内部使用索引,没有使用Bloom过滤器。其实能就是将我之前的Bitcask模型进行了简单的改造：

将原来的哈希表换成了跳跃表；
原来读取记录完全依赖哈希表，现在如果在跳跃表中没有的话，就去读取文件SSTable文件中的数据，根据文件编号从大到小进行，编号越大，表示数据越新；
去掉了加载数据的功能(LSM不需要)；

简单起见，没有完成对范围扫描的支持，不过内存表和SSTable都是有序的，因此这个也不是很难。

参考：
详解SSTable结构和LSMTree索引

欢迎光临我的网站----蝴蝶忽然的博客园----人既无名的专栏。

如果阅读本文过程中有任何问题，请联系作者，转载请注明出处！

时间： 2025-01-30 09:47:20

LSM树存储模型的相关文章

Bitcask存储模型

----<大规模分布式存储系统:原理解析与架构实战>读书笔记最近一直在分析OceanBase的源码,恰巧碰到了OceanBase的核心开发者的新作<大规模分布式存储系统:原理解析与架构实战>.看完样章后决定入手,果然物有所值.对于准备学习分布式的同学,这是一本不错的书籍,相对系统,全面的介绍了分布式的相关技术和项目,基本都是干货.还有一半是在介绍OceanBase的内容,对我来说,正是踏破铁鞋无觅处,接下来会有几篇专门研究存储引擎的读书笔记哟.废话不多说,转入正题. 1.存储的介

Learn Jenkins the hard way (3) - Jenkins的存储模型

前言在上篇文章中我们主要讲解了Jenkins的页面与路由,在本章中我们要讲解下Jenkins的数据持久化机制.在Jenkins中数据的持久化是通过文件进行存储的,大家平时使用Hibernate进行持久化的时候,我们只需要关心哪些地方是需要存储的,哪些位置是不需要储存的,并且在不需要存储的位置添加transient关键字即可,持久化的框架会自动帮我做好Java Object与数据库存储之间的序列化与反序列化的过程,而在Jenkins中由于数据的存储都是通过文件的方式进行存储的,有必要让大家了解下

(H2与HBase)面向行or面向列的存储模型?

(H2与HBase)面向行or面向列的存储模型? 目录 0. 示例 1. H2怎么存储pet表的记录? 1. 1 DATA_LEAF页格式 1. 2 DATA_NODE页格式 2. HBase怎么存储pet表的记录? 2. 1 Data Block格式 2. 2 Data Block如何存下面这些记录? 2. 3 leaf索引块的格式:

《并行计算的编程模型》一3.3　OpenSHMEM存储模型

3.3 OpenSHMEM存储模型 OpenSHMEM是单程序.多数据(single program multiple data,SPMD)编程模型,特点是强调单边通信以及数据移动与同步解藕,是提供高性能.高可扩展性通信和同步程序的库.OpenSHMEM程序由松散同步的进程组成,这些进程也叫作处理单元(Processing Element,PE).所有PE同时开始并执行相同的程序,通常在各自集合问题的子域上执行操作,并周期性地与其他PE通信. OpenSHMEM内存模型是PGAS,类似于其他PG

基于HDFS的安全云存储模型

基于HDFS的安全云存储模型林穗黄健姜文超覃国民针对基于HDFS的云存储平台对元数据绝对全权管理控制问题,提出元数据自主组织模型ASOM,通过分析DataNode与NameNode之间的交互过程,ASOM设计并实现了元数据子服务,通过提取HDFS中DataNode元数据信息直接跟元数据子服务器交互,并且由元数据子服务器处理文件与块.块与DataNode之间的映射关系.通过对HDFS源代码进行分析编译和模块替换,搭建原型系统进行测试,测试结果表明:对NameNode中的元数据进行必要的安

基于SaaS的通用评审系统数据存储模型的优化研究

基于SaaS的通用评审系统数据存储模型的优化研究王锋韩学奇主要针对构建基于SaaS模式的通用评审系统时需要解决的数据存储问题展开.着重对传统的可定制数据存储模型中,存储利用率和数据访问性能较低的缺点,结合数据访问热度指标.数据切分理论和元数据驱动的思想,在传统键值对数据存储模型的基础上,提出了适用于可定制的SaaS系统的基于热度的元数据驱动键值对区分调用的存储解决方案:同时,通过引入缓存机制对改进后的可定制数据存储模型进行了优化.最后对新模型和优化算法进行了实验研究,实验结果证明了该优化方

大文件 b树存储-大文件操作利用B树实现的具体原理

问题描述大文件操作利用B树实现的具体原理我们做一个图书馆管理系统,要求是书的信息存储在一个文件中,这个文件需要满足2G的大小,也就是说一个文件中可以同时放下几百万本书籍的信息,通过网上查资料,很多是说用B树来实现,可是我想不明白的是建立B树的索引时索引的指针指向的记录地址怎么确定,也就是说在一个文件里我要查找一本书的信息,需要分批读进内存来进行查找,如果使用了B树,怎么实现查找呢,它是直接可以根据索引找到该书在文件中的位置吗? 解决方案在设计应用软件的时候直接设计数据存储的物理结构,这种做

时间序列数据的存储和计算 - 概述

什么是时间序列数据什么是时间序列(Time Series,以下简称时序)数据?从定义上来说,就是一串按时间维度索引的数据.用描述性的语言来解释什么是时序数据,简单的说,就是这类数据描述了某个被测量的主体在一个时间范围内的每个时间点上的测量值. 对时序数据进行建模的话,会包含三个重要部分,分别是:主体,时间点和测量值.套用这套模型,你会发现你在日常工作生活中,无时无刻不在接触着这类数据. 如果你是一个股民,某只股票的股价就是一类时序数据,其记录着每个时间点该股票的股价. 如果你是一个运维

Nosql大家族介绍

转载请注明:http://blog.csdn.net/kisssun0608/ 原文地址:http://nosql-databases.org/ 非关系数据库世界的终极向导------------------------------------------------------------------------------------------------------------------Nosql定义:下一代数据库大多专注于这几点:非关系型.分布式的.开源并且可以横向扩展. 原意图是成

猜你喜欢

HTML对字体的所有操作详解（经典）

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> /* ...

MOUNT with UUID

# blkid /dev/sda1: UUID="77c06f65-1723-4eba-8355-80575d6eb3be" TYPE="ext4" /dev ...

网页制作教程：CSS 命名规范

css|规范|教程|网页 XHTML-CSS写作建议所有的xhtml代码小写属性的值一定要用双引号("")括起来,且一定要有值每个标签都要有开始和结束,且要有正确的层次空元 ...

利用Winsock下载文件（支持断点续传）

下载第一步,建立工程,引用Winsock(Visual Basic最好打SP6,否则MS有一个Bug),在此省略第二步,具体实现代码步骤1:发送请求说明:(1)这里简单采用了判断是否已经有同名文件 ...

google+登录API使用javascript sdk快速入门图解教程

准备工作: 打开Google API 控制台 : https://code.google.com/apis/console 点击 My Project (我的项目) 按照图示流程,您将完成一个goog ...

SQL Server误区：在破坏日志备份链后需要完整备份来重新开始日志链

误区 #20:在破坏日志备份链之后,需要一个完整备份来重新开始日志链错误事务日志备份会备份自上次事务日志备份以来所有的事务日志(如果从来没有过日志备份的话,那就从上一次完整备份开始).有好几种类型 ...

与众不同windows phone (16)

Media(媒体)之编辑图片, 保存图片到相册, 与图片的上下文菜单"应用程序..."和"共享..."关联, 与 Windows Phone 的图片中心集成介 ...

android中使用线程和Timer实现字体闪烁动画

android字体闪烁动画,使用线程和Timer实现 public class ActivityMain extends Activity { public void onCreate(Bundle ...

lsyncd与rsync实现实时自动同步的配置

一.rsync是类unix系统下的数据镜像备份工具,从软件的命名上就可以看出来了-remote sync 特性如下: 1.可以镜像保存整个目录树和文件系统. 2.可以很容易做到保持原来文件的权限. ...

Win7旗舰版NVIDIA控制面板的位置在哪？

NVIDIA控制面板相信很多人都不陌生,它是新一代NVIDIA硬件控制应用,支持用户充分利用屡获殊荣的NVIDIA硬件和ForceWare驱动程序的众多特性. Win7旗舰版NVIDIA控制面板的 ...

win8 WiFi和飞行模式开关不见了该怎么办？

如今,win8已经走进了大众的生活,新鲜的开始界面就让大家眼前一新,不过新鲜的同时,问题也会产生,小编就曾遇到过WiFi图标在电脑卡死之后消失的情况,吓了一跳,不过顺利解决, 现在给大家分享一下, ...

反向链接的类型

综观各类网站,其反向链接的类型不外乎以下几种:(1)站内链接:分为两种,一种是实际存在的,而另一种是虚拟存在的:一种是为浏览者设计的,而另一种是专为搜索引擎设计的.(2)镜象站的链接:分为两种,一种是 ...

WordPress用户密码算法规则分析

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 WordPress系统的用户密码是 ...

java-Java中怎么把函数作为参数传给另一个函数

问题描述 Java中怎么把函数作为参数传给另一个函数我想把fun().funQ().funR().funP()传到out函数中,然后out函数根据传进来的具体函数把函数从k=1到10的值输出,现在怎 ...

更新-eclipse 怎样安装sdk，在线安装会不会耗时啊

问题描述 eclipse 怎样安装sdk,在线安装会不会耗时啊 sdk Manager 是怎么用的,那个进度条显示的是什么?,离线安装包可以用吗 ?需要更新时怎么办? 解决方案离线包可以用,在线更新 ...

如何使用图形界面Webmin管理linux服务器

一台典型的linux服务器运行命令行环境中,并已经包括了一些用于安装和配置各种没有界面的服务的基本工具.和一些成熟的具有图形界面的桌面软件相比,就安全性.资源消费和速度来说,仅需要少量的设置无疑是一个 ...

Android应用程序安装过程源代码分析

转自 :http://blog.csdn.net/luoshengyang/article/details/6766010 Android系统在启动的过程中,会启动一个应用程序管理服务PackageM ...

工信部统计称去年我国手机出口增长9%

3月2日消息,根据工信部的统计,去年我国手机出口22.3亿美元,增长9%.不过,这与海关总署的统计数据不太吻合. 据中国海关之前的统计显示,2009年上半年我国手机出口2.3亿部,出口额为160.82 ...

这个世界为什么需要程序员

可能你还没遇到这个问题但即将遇到这些问题,也可能你我如他般被这些问题困扰,这便是题目的答案~ 2015.9.23号下午15点13分,我又重新被这些问题虐了一遍,以一名低级程序猿的身份和视角. 起因是准 ...

java web 分页解决方案

web开发中经常需要用到分页,我然来的做法是每次需要分页时都把代码copy一份,比如有10个页面有分页,那么我分页的代码就有10个版本.这样导致代码的重用性太低了. 那么如何解决呢? 把分页的页面和逻 ...

全球领先的软件服务公司傲游全新发布Android手机v2.6.9版本浏览器

此次新版最大亮点是加入了全新阅读模式,高效简洁,为用户http://www.aliyun.com/zixun/aggregation/1148.html">提供最佳浏览体验.以及,还优 ...

Log4j配置

问题描述现在有这个要求,要根据为某个包下一级包进行日志隔离,但有多少一级包不确定.如:包结构是这样的: package.subpackage1 package.subpackage2现在要将subp ...

SOA专题---Dropwizard与Spring Boot比较

在这篇文章中我们将讨论的Java轻量级框架Dropwizard和Spring Boot的相似性和差异. 首先,这是一个选择自由和速度需要,无论你在Dropwizard和Spring Boot选择哪 ...

Lucene 多条件查询是用must not报错，请大家看看可能是什么原因

问题描述 Lucene多条件查询是用mustnot报错了,使用must没问题,请大家指点:报错信息:atorg.apache.lucene.util.OpenBitSetDISI.inPlaceAnd ...

关于ajax select 无限极联动修改时自动创建并选中时的问题

问题描述页面:<tr><td>产品名称</td><thid="proContent"><selectid="pro ...

JavaScript 精粹读书笔记(1,2)_javascript技巧

第1章精华 JavaScript的特性中有一部分特性带来的麻烦远远超出它们的价值.其中,一些特性是因为规范很不完善,从而可能导致可移植性的问题:一些特性会导致生成难以理解和修改的代码:一些特性促使我 ...

一个js随机颜色脚本（用于标签页面，也可用于任何页面）_javascript技巧

看见有人要这个东西,发上来.237个字节的东西.很小吧? 把下面代码添加到tag.asp的<div id="mainContent-bottomimg">前面即可. 这 ...

Android开发-之环境的搭建（图文详解）_Android

关于Android开发可以使用的工具有eclipse和Android studio等,这两个工具都各有各的好处和不足.studio是谷歌推出的一款开发工具,而我们都知道Android就是谷歌公司的,所 ...

js Li来实现的效果_javascript技巧

蓝色背景的LI 蓝色背景的LI 蓝色背景的LI 蓝色背景的LI 蓝色背景的LI

关于getClass()的疑问

问题描述 importjava.util.*;publicclassEqualsTest{publicstaticvoidmain(String[]args){}}classEmployee{//构造 ...

热搜

© 2025 iVAN | info#iamivan.net | 11 q. 0.024 s.