LevelDB性能分析和表现

Leveldb是一个google实现的非常高效的kv数据库，目前的版本1.2能够支持billion级别的数据量了。在这个数量级别下还有着非常高的性能，主要归功于它的良好的设计。特别是LSM算法。

那么数据库最怕的的随机IO他是如何解决的呢?

先说随机写，它的写都是先记录到日志文件去的，在日志文件满之前只是简单的更新memtable,那么就把随机写转化成了顺序写。在日志满了后，把日志里面的数据排序写成sst表同时和之前的sst进行合并，这个动作也是顺序读和写。大家都知道传统磁盘raid的顺序读写吞吐量是很大的，100M左右是没有问题。在写日志文件的时候，用到是buffer IO，也就是说如果操作系统有足够的内存，这个读写全部由操作系统缓冲，效果非常好。即使是sync写模式，也是以数据累计到4K为一个单位写的，所以效率高。

那么随机读呢?这个它解决不了。但是ssd盘最擅长随机读了。这个硬件很自然的解决了这个问题。

所以leveldb的绝配是ssd盘的raid.

leveldb标准版本编译见浅谈LevelDB在ubuntu 11.04下编译失败的问题，由于标准版本用到了c++ 0x的特性，在RHEL平台下没得到支持，所以为了移植性, basho为它做了标准c++版本的port, 见目录c_src/leveldb. 他之所以用c++ 0x标准主要是用到里面的原子库，basho的port用了libatomicops搞定这个问题.

我们的测试采用的就是这个版本, 我们分别测试了1000万， 1亿，10亿数据量下的leveldb表现，发现随着数据集的变化性能变化不大。

由于leveldb默认的sst文件是2M, 在数据集达到100G的时候要占用几万个文件，我修改了：

version_set.cc：23 static const int kTarget">FileSize = 32 * 1048576;

让默认的文件变成32M,减少目录的压力。

我的测试环境是:

$uname -r 2.6.18-164.el5 #RHEL 5U4 # 10* SAS 300G raid卡，fusionIO 320G,
Flashcache,内存96G, 24 * Intel(R)
Xeon(R) CPU

top说:

21782 root 18 0 1273m 1.1g 2012 R 85.3 1.2 1152:34 db_bench

iostat说:

$iostat -dx 5 ... sdb1 0.40 0.00 3.40 0.00 30.40 0.00 8.94 0.02 4.65 4.65 1.58 fioa 0.00 0.00 2074.80 3.80 16598.40 30.40 8.00 0.00 0.13 0.00 0.00 dm-0 0.00 0.00 1600.00 0.00 16630.40 0.00 10.39 0.25 0.15 0.15 24.76 ...

该测试中请注意snappy压缩没有打开，如果有压缩性能还会高很多，因为IO少了一半。

write_buffer_size=$((256*1024*1024))，log大小设成256M，这样减少切换日志的开销和减少数据合并的频率。

同时应该注意到db_bench是单线程程序，还有一个compact线程，所以最多的时候这个程序只能跑到200%的cpu, IO util也不是很高. 换句话说如果是多线程程序的话性能还要N倍的提高。

我们来看下实际的性能数字：

#1千万条记录 $sudo ./db_bench --num=10000000 --write_buffer_size=$((256*1024*1024)) LevelDB: version 1.2 Date: Fri May 27 17:14:33 2011 CPU: 24 * Intel(R) Xeon(R) CPU X5670 @ 2.93GHz CPUCache: 12288 KB Keys: 16 bytes each Values: 100 bytes each (50 bytes after compression) Entries: 10000000 RawSize: 1106.3 MB (estimated) FileSize: 629.4 MB (estimated) write_buffer_size=268435456 WARNING: Snappy compression is not enabled ------------------------------------------------ fillseq : 2.134 micros/op; 51.8 MB/s fillsync : 70.722 micros/op; 1.6 MB/s (100000 ops) fillrandom : 5.229 micros/op; 21.2 MB/s overwrite : 5.396 micros/op; 20.5 MB/s readrandom : 65.729 micros/op; readrandom : 43.086 micros/op; readseq : 0.882 micros/op; 125.4 MB/s readreverse : 1.200 micros/op; 92.2 MB/s compact : 24599514.008 micros/op; readrandom : 12.663 micros/op; readseq : 0.372 micros/op; 297.4 MB/s readreverse : 0.559 micros/op; 198.0 MB/s fill100K : 349.894 micros/op; 272.6 MB/s (10000 ops) crc32c : 4.759 micros/op; 820.8 MB/s (4K per op) snappycomp : 3.099 micros/op; (snappy failure) snappyuncomp : 2.146 micros/op; (snappy failure) #1亿条记录 $sudo ./db_bench --num=100000000 --write_buffer_size=$((256*1024*1024)) LevelDB: version 1.2 Date: Fri May 27 17:39:19 2011 CPU: 24 * Intel(R) Xeon(R) CPU X5670 @ 2.93GHz CPUCache: 12288 KB Keys: 16 bytes each Values: 100 bytes each (50 bytes after compression) Entries: 100000000 RawSize: 11062.6 MB (estimated) FileSize: 6294.3 MB (estimated) write_buffer_size=268435456 WARNING: Snappy compression is not enabled ------------------------------------------------ fillseq : 2.140 micros/op; 51.7 MB/s fillsync : 70.592 micros/op; 1.6 MB/s (1000000 ops) fillrandom : 6.033 micros/op; 18.3 MB/s overwrite : 7.653 micros/op; 14.5 MB/s readrandom : 44.833 micros/op; readrandom : 43.963 micros/op; readseq : 0.561 micros/op; 197.1 MB/s readreverse : 0.809 micros/op; 136.8 MB/s compact : 123458261.013 micros/op; readrandom : 14.079 micros/op; readseq : 0.378 micros/op; 292.5 MB/s readreverse : 0.567 micros/op; 195.2 MB/s fill100K : 1516.707 micros/op; 62.9 MB/s (100000 ops) crc32c : 4.726 micros/op; 826.6 MB/s (4K per op) snappycomp : 1.907 micros/op; (snappy failure) snappyuncomp : 0.954 micros/op; (snappy failure) #10亿条记录 $sudo ./db_bench --num=1000000000 --write_buffer_size=$((256*1024*1024)) Password: LevelDB: version 1.2 Date: Sun May 29 17:04:14 2011 CPU: 24 * Intel(R) Xeon(R) CPU X5670 @ 2.93GHz CPUCache: 12288 KB Keys: 16 bytes each Values: 100 bytes each (50 bytes after compression) Entries: 1000000000 RawSize: 110626.2 MB (estimated) FileSize: 62942.5 MB (estimated) write_buffer_size=268435456 WARNING: Snappy compression is not enabled ------------------------------------------------ fillseq : 2.126 micros/op; 52.0 MB/s fillsync : 63.644 micros/op; 1.7 MB/s (10000000 ops) fillrandom : 10.267 micros/op; 10.8 MB/s overwrite : 14.339 micros/op; 7.7 MB/s ...比较慢待补充

总结: Leveldb是个很好的kv库，重点解决了随机IO性能不好的问题，多线程更新的性能非常好.

(责任编辑：吕光)

时间： 2024-10-24 16:21:06

LevelDB性能分析和表现的相关文章

MySQL性能分析系统

对于MySQL慢查询日志的分析,现已由多种工具来提供:最原始的mysqldumpslow,功能比较齐全的 mysqlsla和percona的 pt-query-digest:以上工具大大提高了DBA来分析数据库的性能效率,减少了过多的猜测过程: 如果能实现定时分析SQL并且进行可视化展示呢? 适用过Query-Digest-UI-master 这个UI插件,在配合 percona的 pt-query-digest工具,只是简单做到一个可视化的结果:如果对于多个服务器的分析,这个表现的就很吃力:

PHP 性能分析与实验：性能的微观分析

在上一篇文章中,我们从 PHP 是解释性语言.动态语言和底层实现等三个方面,探讨了 PHP 性能的问题.本文就深入到 PHP 的微观层面,我们来了解 PHP 在使用和编写代码过程中,性能方面,可能需要注意和提升的地方. 在开始分析之前,我们得掌握一些与性能分析相关的函数.这些函数让我们对程序性能有更好的分析和评测. 一.性能分析相关的函数与命令 1.1.时间度量函数平时我们常用 time() 函数,但是返回的是秒数,对于某段代码的内部性能分析,到秒的精度是不够的.于是要用 microtime

使用SLS和ODPS进行系统的性能分析

在对计算机系统,尤其是分布式系统的搭建和验证过程中,性能因素是需要着重考虑的因素之一.更激进一点说,判断架构设计的正确与否,性能的好坏.是否可控.是否可预期绝对是最有效的衡量指标. 不幸的是,现有的性能工具大部分是针对代码级的运行时间进行分析,目标是诊断代码的性能bug.但目前我们并没有(或者我还没见到)针对大型的分布式系统的系统级性能分析工具. 虽然这样,但我们可以发扬DIY精神,卷起袖子自己来做这样的性能分析.通过简单日志服务(SLS)对性能日志进行收集,并使用SLS的离线通道将性能相关的数

PHP 性能分析（三）: 性能调优实战

在本系列的第一篇中,我们介绍了 XHProf .而在第二篇中,我们深入研究了 XHGui UI, 现在最后一篇,让我们把 XHProf /XHGui 的知识用到工作中! 性能调优不用运行的代码才是绝好的代码.其他只是好的代码.所以,性能调优时,最好的选择是首先确保运行尽可能少的代码. OpCode 缓存首先,最快且最简单的选择是启用 OpCode 缓存.OpCode 缓存的更多信息可以在这里找到. 在上图,我们看到启用 Zend OpCache 后发生的情况.最后一行是我们的基准

Winsock五种I/O模型的性能分析

五种I/O模型的性能分析重叠I/O模型的另外几个优点在于,微软针对重叠I/O模型提供了一些特有的扩展函数.当使用重叠I/O模型时,可以选择使用不同的完成通知方式. 采用事件对象通知的重叠I/O模型是不可伸缩的,因为针对发出WSAWaitForMultipleEvents调用的每个线程,该I/O模型一次最多都只能支持6 4个套接字.假如想让这个模型同时管理不止64个套接字,必须创建额外的工作者线程,以便等待更多的事件对象.因为操作系统同时能够处理的事件对象是有限的,所以基于事件对象的I/O模型不

Mysql Join语法解析与性能分析

原文:Mysql Join语法解析与性能分析一．Join语法概述 join 用于多表中字段之间的联系,语法如下: ... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditiona table1:左表:table2:右表. JOIN 按照功能大致分为如下三类: INNER JOIN(内连接,或等值连接):取得两个表中存在连接匹配关系的记录. LEFT JOIN(左连接):取得左表(table1)完全记录,即是右表(table2)并无对应匹配记录

Pury — 一个新的 Android App 性能分析工具

本文讲的是Pury - 一个新的 Android App 性能分析工具, 手机应用存在的目的,就是在帮助用户做他们想做的事情的同时,提供最好的用户体验 -- 而用户体验的重中之重是应用的性能.但有时候开发者们却以性能为借口,既没有达到既定目标,又写着低质量并难以维护的代码.在这里我想引用 Michael A. Jackson 的一句话: "程序优化守则第一条:别去做它.程序优化守则第二条(仅限于专业人员):别去做它,现在还不是时候." 在开始任何优化之前,我们要先认清问题的症结所在.

PHP 性能分析（一）: XHProf & XHGui 介绍

什么是性能分析? 性能分析是衡量应用程序在代码级别的相对性能.性能分析将捕捉的事件包括:CPU的使用,内存的使用,函数的调用时长和次数,以及调用图.性能分析的行为也会影响应用性能. 影响的程度取决于基准测试.基准测试在外部执行,用于衡量应用真实性能.所谓真实性能,即终端用户所体验的应用表现. 什么时候应该进行性能分析? 在考虑是否进行性能分析时,你首先要想:应用是否存在性能问题?如果有,你要进一步考虑:这个问题有多大? 如果你不这样做,将会陷入一个陷阱--过早优化,这可能会浪费你的时间. 为了评

Linux性能分析工具汇总合集

出于对Linux操作系统的兴趣,以及对底层知识的强烈欲望,因此整理了这篇文章.本文也可以作为检验基础知识的指标,另外文章涵盖了一个系统的方方面面.如果没有完善的计算机系统知识,网络知识和操作系统知识,文档中的工具,是不可能完全掌握的,另外对系统性能分析和优化是一个长期的系列. 本文档主要是结合Linux 大牛,Netflix 高级性能架构师 Brendan Gregg 更新 Linux 性能调优工具的博文,搜集Linux系统性能优化相关文章整理后的一篇综合性文章,主要是结合博文对涉及到的原理和性

猜你喜欢

在应用开发中实现对上下文（Context）数据的统一管理

在应用开发中,我们经常需要设置一些上下文(Context)信息,这些上下文信息一般基于当前的会话 (Session),比如当前登录用户的个人信息:或者基于当前方法调用栈,比如在同一个调用中涉及的多个 ...

隐形门病毒是什么

名称:Backdoor/HookSSDT 变种数量: 35 累计感染计算机: 123404 累计上报次数: 196468 病毒中文名:"隐形门" 病毒类型:后门危险级别:★★ ...

Win8应用默认安装路径修改方法

Win8系统的Metro应用不能随意修改安装路径,默认就安装到我们的系统盘了.之前大家使用操作系统时给C盘分配的大小也就是XP时代的10G. Win7时代的20--30G,Win8?你得分多少G?我看 ...

Word绘画工具栏的详解

绘画工具栏,故名思议,肯定是关于Word中用户绘画的一些工具了.为了方便大家在以后的使用中更加的熟悉,小编就将它的所有工具都介绍一遍,大家一定要好好学习一下阿. Word2003的"绘图 ...

WindowsXP系统下使用QQ马赛克截图的方法

WindowsXP系统下使用QQ马赛克截图的方法具体如下: 1.登陆QQ,随意打开一个QQ好友聊天对话框,点击"剪刀"图标的截图链接工具; 2.拖动区域 ...

文件系统-fuse挂载hadoop的问题

问题描述 fuse挂载hadoop的问题我想把hadoop挂在到linux本地文件系统上,看到网上说用fuse可以实现,于是照着步骤一步步下来,但是到编译libhdfs的时候出现问题了,提示说bui ...

android 手机号码归属地问题

问题描述 android 手机号码归属地问题想一次性查询通讯录中的号码归属地,一种方法是使用webservice,但是使用webservice免费用户每天只能使用一百次,可是一般通讯录中的号码何止一 ...

string-C++.NET项目属性中常规中的字符集选择项是什么作用？？

问题描述 C++.NET项目属性中常规中的字符集选择项是什么作用?? 假如将这个选择项设置为"使用Unicode字符集",但是我的程序字符串是用std::string和char,而 ...

从高考到程序员---一个五年程序员的回忆及建议

(本文参加CSDN的"从高考到程序员"征文活动,谢谢!) 每年的六月初,有关高考的信息就会见诸于报纸.网络等,让我这位多年之前参加高考的.已工作多年的人不由得也回忆起了自己高考时的 ...

linux c-新手求助关于密码隐藏

问题描述新手求助关于密码隐藏貌似linux c不支持关于getch的使用,请问谁有更好的办法使密码隐藏么解决方案 http://download.csdn.net/detail/lz200515 ...

第一人称射击游戏之父卡马克公开反对软件专利

[导读]如果你玩过CS或<半条命>,你应该了解下这个程序员.本期主题为"了不起的程序员"系列.第一人称射击游戏之父:卡马克约翰·卡马克是一位美国游戏程序员,也是id S ...

在Unity3D的网络游戏中实现资源动态加载

用Unity3D制作基于web的网络游戏,不可避免的会用到一个技术-资源动态加载.比如想加载一个大场景的资源,不应该在游戏的开始让用户长时间等待全部资源的加载完毕.应该优先加载用户附近的场景资源,在游 ...

jQuery制作简单柱状图实例_jquery

本文实例讲述了jQuery制作简单柱状图的方法.分享给大家供大家参考.具体实现方法如下: Html部分: 复制代码代码如下: <head> <title>柱状图</t ...

PostgreSQL 10.0 preview 功能增强 - 后台运行(pg_background)

标签 PostgreSQL , 10.0 , 后台运行 , pg_background_launch , pg_background_result , pg_background_detach , p ...

优先级-CSS加在TagName上的样式要怎么清除掉

问题描述 CSS加在TagName上的样式要怎么清除掉用了别人的两个css文件.文件1在input的tagname上加了border样式,文件2加了 input 的class,这个class中也有b ...

这款路由器号称能通过空气传输千兆网络信号

近期,一家名为Starry的创业公司宣布,这家公司将为消费者带来超速互联网接入服务,价格不高于目前的平均宽带费.这家公司表示,他们无需铺设造价昂贵的光纤,而是借助空气来传输信号. 对于消费者来说,&q ...

智慧城市发展提速内陆与香港进入深度合作时代

今年李克强总理在两会上指出,中国要深入推进新型城镇化,打造智慧城市,这说明随着智慧城市发展日趋成熟,智慧城市建设速度也达到前所未有的高度.目前,中国内地已有超过500个城市进行智慧城市试点,计划投资金 ...

使用xmldom在服务器端生成静态html页面_XML/RSS

服务器端的生成的页面数据,为了提高访问速度,往往需要生成静态的htm页面.通常,可以使用fso生成静态的htm页.但如果是fso被禁止或没有使用fso的权限,就需要其他的方法来解决.利用xmldom, ...

JS快速实现移动端拼图游戏_javascript技巧

最近做的一个简陋的手机端拼图游戏,代码简单易懂,废话不多说了,让大家证明一切吧! 先看下效果图: <!DOCTYPE html> <html lang="en"& ...

ASP.NET jQuery 实例17 通过使用jQuery validation插件校验ListBox_jquery

这里我们举例校验ListBox两个规则: •校验必选项 •选择范围在0~4项界面代码: 复制代码代码如下: <form id="form1" runat="se ...

google adsense pin码收不到人工填表单验证教程

我们在pin码验证界面会有一个请填写此表单,并附上显示有收款人姓名和邮寄地址(与您帐户内的相应信息一致)的政府签发的身份证.银行对帐单或话费单数码图片相关说明了,我们点击"请填写此表单& ...

pageinsepect分析brin索引

brin索引是postgresql9.5版本中新增的功能,这个索引的特点就是占用空间特别小,原理是这样的,它是将表的数据页面按每128个数据块(页面)分配一条索引记录,记录这个区间的最大值和最小值,当 ...

如何利用arcgis engine在地图中进行经纬度定位

问题描述经纬度在数据库中,那么怎么实现定位呢,并标注点解决方案解决方案二:同问已解决方案了请给我一份(540931017qq.com)谢谢解决方案三:你们俩估计连SDK长什么样子都不知道吧解决方 ...

水晶报表动态合并列单元格

问题描述给水晶报表动态生成的分组,合并分组内对应的某列值如:配货号品牌数量(需要合并的列)001A10001B8001C7002A11(根据配货号在同一页内新生成的一组数据)002B20002C0. ...

iOS数据持久化之二——归档与设计可存储化的数据模型基类

iOS数据持久化之二--归档与设计可存储化的数据模型基类一.引言在上一篇博客中,我们介绍了用plist文件进行数据持久化的方法.虽然简单易用,但随着开发的深入,你会发现,这种方式还 ...

小心网络传销

本报讯(记者彭颂通讯员孙爱军刘晓杰) 近日,工商李沧分局开展了"创建无传销社区"."关爱学生,远离传销,创建安全校园"等针对传销的系列活动,在校园等场所 ...

sql server-用php写的后台，底层用c++写的系统

问题描述用php写的后台,底层用c++写的系统为什么经常性粘贴一些代码上去,然后保存,代码之后的内容就不见了这是一个类似于论坛的系统,系统用的是sqlserver,请问有谁遇到过这种情况吗,是怎 ...

迅雷网游加速器白金会员只需15元

2004年,一款名为迅雷的下载客户端把网络江湖搅得天翻地覆,短短数年便发展了近3亿用户,实现八成下载市场占有率,坐稳下载软件头把交椅. 在迅雷会员3周年来临之际,迅雷公司首次宣布"迅雷白金会 ...

vs2010连接暑数据库问题

问题描述 vs2010连接暑数据库问题代码如下,问题在代码后 using System; using System.Collections.Generic; using System.Compone ...

iOS中 Bugly iOS 符号表手动配置详细教程韩俊强的博客

每日更新关注:http://weibo.com/hanjunqiang 新浪微博!iOS开发者交流QQ群: 446310206 官方教程官方的符号表工具iOS文档版使用指南不是很详细,于是自己动手 ...

热搜