MongoDB的真正性能

最近开始研究MySQL和MongoDB，发现这方面资料不多。尤其是真正的说到点子上的文章，太少了。

有一些对比测试的文章基本上都是瞎测，测试方法都测到了马腿上，得出的结论基本上都是NoSQL毫无价值

容我借用Russell Smith 的那句话：不是MongoDB不行，是你不懂。

让我来分析一下MongoDB的真正性能吧。

有说MongoDB慢

　　反对：不设其他唯一索引的情况下，只用_id 在普通办公电脑上每秒插入几万，在普通x86服务器上每秒插入十几万，你好意思说这个性能低？比mysql强出一个数量级。

赞同：检索是真的慢，和sql数据库不同，越复杂的条件搜索MangoDB越吃亏，CPU和IO的双重压力。面对那些直接把SQL查询改写成MangoDB的用法，别转了，你不会收获任何性能提升。

你不行：说你不行还是真的不行，MongoDB领导了NoSQL运动，NoSQL请注意，我们最主要反对的就是SQL的方法论，按SQL方法使用MangoDB你只能收获失望。再想想MongoDB的设计思想：文档化。_id 就是文件名，MongoDB是个文件系统。全文检索？别闹了，用文件名找文件，一个文件名对应一个文件，你绝对不会失望。

那么MongoDB究竟应该怎么用呢？

首先，忘记SQL

你应该忘记你学过的那些优雅无敌的SQL，不是说为了提升检索性能，扔索引就有好处。

有一个简单的事实如下：只有一个默认的_id 索引，此时插入性能为1，你再加一个索引，插入性能约1/2,再加一个约1/3 ,以此类推......

如果这个事实对你是很震撼的，那说明你还没有忘记SQL，接着忘。

MongoDB的索引对插入性能有着不可忽略的拖后腿效应，所以，我们应该使用且仅使用 _id 作为插入key，作为查询key，作为所有的那个key。

其次，直接忘记搜索这件事。

把MongoDB当做你的硬盘，给他文件名去操作文件.这就是Key-Value数据库的做法，你稍加设计就能这么用。

那么其实你所有的操作可以简化为两个指令，逻辑上就是一个字典

你给他_id,往字典里插一个数据，或者拿一个数据。

Save({_id:xxx,.....})

FindOne({_id:xxx})

要想高性能，善用那个_id,把你原来准备当主键的那个玩意，hash成_id.

把你原来准备的查询条件，什么？查询，拿_id来，别的全砍掉。

第三、这不是数据表

记住，这不是数据表，一个_id对应的东西不是一行数据，而是一个文件。

文件存储和表存储有什么不同呢？

我举个例子，比如我们要存储用户列表和每个用户的道具列表。

数据表的做法是建一张用户表，一张道具表，道具表里有个字段表示他属于哪个用户。

然后，你就离不开万恶的查询了。

然后如果一个用户有100条道具，100万用户意味着道具表有一亿条记录。

这时候就开始考验你的小数据库了，但这都是过去式了，这一亿的道具，用MongoDB，根本不是个事儿

因为MongoDB的方法是当做文件存，只设计一个用户集合，每个用户的信息是一个文件，然后这100个道具就分开存在每个用户的文件里。

然后来比较一下，我们取得用户的记录，然后从中拿出100个道具，NoSQL方法。

查一亿的表，找出属于某个用户的记录。

熟快熟慢？

然后你可能回想，SQL方法，我也可以搞个道具字段，把用户的100个道具用某种协议打包，然后操作啊，一样可以取得巨大的优化呀。

没错，你的想法很好，你正在用NOSQL的方式用SQL。

第四、文件存储的精华之处

如果问题止于此处，MongoDB就毫无优势可言了，如果这个方法在SQL数据库上也是如此容易使用，那还费劲搞MongoDB干什么？

我们再折腾一点，如果每个道具还要存100条转手记录，你还是可以打包，但你这个打包字段已经1M了。

于是每次存取这个打包字段都是一个系统工程了，还要负担1M的流量。

MongoDB这边呢？我们可以直接对文件的一部分进行读写，比如我只返回一个用户的第二个道具的信息，和返回第二个道具的第1~30条转手记录。

这，是一种怎样的差距啊。

你想要一张美女的照片，你朋友有，但是他只有一个压缩包，他那里没有解包工具，于是他把整个包传给了你。他想问你要一张照片，但是他没有压缩工具，为了存档需要，他让你再压进包里传给他。

这个朋友就是你的用户表的一行，如果换成真实世界的事件是多么的不可思议，这就是在一个字段里打包数据的问题。

MongoDB的一条记录就是一个脑筋更正常的朋友，你要他一张照片，他从包里找出来给你。你给他一张照片，他分门别类的放置到他的包里去。

用文件的思维去访问，MongoDB是一个更好的朋友。

审视一下你项目中的大部分的数据需求，是不是都可以用这种方式去组织呢？

如果是，加入NOSQL吧，我们的口号是：很暴力不SQL

还有什么好处

1.不用逻辑关心的水平切分

　　无需多言，对MongoDB而言，这是运维人员的工作了

2.不用对齐的数据结构

　　不用对齐意味着你不用为以前表结构变化的迁移烦恼，有些文件里有一个部分，有些没有，这对MongoDB而言，很正常。

原文发布时间为：2013-05-08

时间： 2024-08-31 14:17:01

MongoDB的真正性能的相关文章

mongodb sharding写入性能问题

问题描述 mongodb sharding写入性能问题 mongodb做分片后如果增加服务器,写入性能可以提高吗?比如3台服务器时每秒可写入20000条数据,那么增加到6台服务器,每秒能写入40000条数据吗? 解决方案记一次MongoDB性能问题记一次MongoDB性能问题解决方案二: 会有提升,不过具体提升多少要测试,以及看性能瓶颈在什么地方

使用情景开始之前,我们先设定这样一个情景: 1.一百万注册用户的页游或者手游,这是不温不火的一个状态,刚好是数据量不上不下的一个情况.也刚好是传统MySql数据库性能开始吃紧的时候. 2.数据库就用一台很普通的服务器,只有一台.读写分离.水平扩展.内存缓存都不谈.一百万注册用户如果贡献度和活跃度都不高,恐怕公司的日子还不是那么宽裕,能够在数据库上的投资也有限. 以此情景为例,设每个用户都拥有100个道具,用户随时会获得或失去道具. 我们就来看看这一亿的道具怎么搞. 道具一般要使用原型.实例的设

MongoDB生产环境性能和可靠性注意事项

本文是翻译http://www.aliyun.com/zixun/aggregation/13461.html">MongoDB Manuel中的MongoDB Production Notes一节内容.这节内容重点关注生产环境中影响性能和可靠性的各种注意事项,值得正在部署MongoDB的工作者们关注.本文详细描述了影响MongoDB,特别是生产环境的关键系统配置.以下是正文. 安装包确保你安装了最新的稳定版本.这是了解最新版本的最佳场所,即使你稍后选择从包管理器安装. 生产环境始终使用

浅析Mongodb性能优化的相关问题_MongoDB

前言如何能让软件拥有更高的性能?我想这是一个大部分开发者都思考过的问题.性能往往决定了一个软件的质量,如果你开发的是一个互联网产品,那么你的产品性能将更加受到考验,因为你面对的是广大的互联网用户,他们可不是那么有耐心的.严重点说,页面的加载速度每增加一秒也许都会使你失去一部分用户,也就是说,加载速度和用户量是成反比的.那么用户能够接受的加载速度到底是多少呢? 如图,如果页面加载时间超过10s那么用户就会离开,如果1s–10s的话就需要有提示,但如果我们的页面没有提示的话需要多快的加载速度呢?是

MongoDB查询性能优化验证及验证_MongoDB

结论: 1. 200w数据,合理使用索引的情况下,单个stationId下4w数据.mongodb查询和排序的性能理想,无正则时client可以在600ms+完成查询,qps300+.有正则时client可以在1300ms+完成查询,qps140+. 2. Mongodb的count性能比较差,非并发情况下client可以在330ms完成查询,在并发情况下则需要1-3s.可以考虑估算总数的方法,http://blog.sina.com.cn/s/blog_56545fd30101442b.htm

MongoDB性能优化及监控_MongoDB

MongoDB 是一个基于分布式文件存储的数据库.由 C++ 语言编写.旨在为 WEB 应用提供可扩展的高性能数据存储解决方案. MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的. 一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存在system.indexes 中,且默认总是为_id创建索引,它的索引使用基本和MySQL 等关系型数据库一样.其实可以这样说说,索引是凌驾于数据存储系统之上的另一层系统,所以各种结构迥异的存

Discuz!NT千万级数据量上的两驾马车--TokyoCabinet,MongoDB

在Discuz!NT的企业版设计过程中,处理大数据表一直是一个让人头疼的问题,特别是像主题表 (topic),用户表(user)等,因为对于一个流量和发帖量都很大的论坛而言,在运行几年之后,这两个表的数据量可能会破千万(注:因为帖子表采用分表机制,所以这里暂未涉及,但出于性能考虑,也提供了本文中类似的解决方案).当时考虑的架构设计中有两种思路来解决这种问题: 一种是采用类似MYSPACE的方式,即按一定记录KEY值(比如用户表的UID)来对大数据表中的记录进行分割,比如前200万用户(即:

MongoDB资料汇总

与大家共勉~ 1.MongoDB是什么 MongoDB介绍PPT分享 MongoDB GridFS介绍PPT两则初识 MongoDB GridFS MongoDB GridFS 介绍一个NoSQL与MongoDB的介绍PPT MongoDB:下一代MySQL? 写给Python程序员的MongoDB介绍又一篇给Python程序员的MongoDB教程 MongoDB源码研究系列文章白话MongoDB系列文章 MongoDB Tailable Cursors 特性介绍 MongoDB 文档阅

mysql和mongodb对比互补

1.mysql没有必要存放所有的数据,尤其是分析.归纳.汇总的日志数据 2.mongodb的一个重要概念就是以空间换时间 3.MongoDB性能的一个关键点就是索引,索引是不是能有比较好的使用效率,索引是不是能够放在内存中,这样能够提升随机读写的性能.如果你的索引不能完全放在内存中,一旦出现随机读写比较高的时候,它就会频繁地进行磁盘交换,这个时候,MongoDB的性能就会急剧下降,会出现波动. 4.mysql也可以考虑使用归档型的存储引擎 5.MongoDB官方就自带一个分布式文件系统,可以很方