设为首页收藏本站

LinuxTone | 运维专家网论坛 - 最棒的Linux运维与开源架构技术交流社区!

 找回密码
 注册

用新浪微博连接

一步搞定

QQ登录

只需一步,快速开始

查看: 2160|回复: 1

[NOSQL] MongoDB与内存探讨 [复制链接]

Rank: 6Rank: 6

签到
78
注册时间
2008-6-13
最后登录
2014-7-17
在线时间
219 小时
阅读权限
70
积分
8668
帖子
971
主题
181
精华
0
UID
74

LT粉丝

发表于 2011-9-3 21:36:45 |显示全部楼层
好久没有发贴了,没有什么新东西发,刚看到一篇关与Mongodb的文章转过来。
原文请参照: http://huoding.com/2011/08/19/107


但凡初次接触MongoDB的人,无不惊讶于它对内存的贪得无厌,至于个中缘由,我先讲讲Linux是如何管理内存的,再说说MongoDB是如何使用内存的,答案自然就清楚了。


据说带着问题学习更有效,那就先看一个MongoDB服务器的top命令结果:
shell> top -p $(pidof mongod)Mem:  32872124k total, 30065320k used,  2806804k free,   245020k buffersSwap:  2097144k total,      100k used,  2097044k free, 26482048k cached VIRT  RES  SHR %MEM1892g  21g  21g 69.6这台MongoDB服务器有没有性能问题?大家可以一边思考一边继续阅读。
先讲讲Linux是如何管理内存的在Linux里(别的系统也差不多),内存有物理内存和虚拟内存之说,物理内存是什么自然无需解释,虚拟内存实际是物理内存的抽象,多数情况下,出于方便性的考虑,程序访问的都是虚拟内存地址,然后操作系统会把它翻译成物理内存地址,至于程序是如何使用虚拟内存的,可以参考Playing with Virtual Memory,这里就不多费口舌了。
很多人会把虚拟内存和Swap混为一谈,实际上Swap只是虚拟内存引申出的一种技术而已:操作系统一旦物理内存不足,为了腾出内存空间存放新内容,就会把当前物理内存中的内容放到交换分区里,稍后用到的时候再取回来,需要注意的是,Swap的使用可能会带来性能问题,偶尔为之无需紧张,糟糕的是物理内存和交换分区频繁的发生数据交换,这被称之为Swap颠簸,一旦发生这种情况,先要明确是什么原因造成的,如果是内存不足就好办了,加内存就可以解决,不过有的时候即使内存充足也可能会出现这种问题,比如MySQL就有可能出现这样的情况,解决方法是限制使用Swap:
shell> sysctl -w vm.swappiness=0查看内存情况最常用的是free命令:
shell> free -m             total       used       free     shared    buffers     cachedMem:         32101      29377       2723          0        239      25880-/+ buffers/cache:       3258      28842Swap:         2047          0       2047新手看到used一栏数值偏大,free一栏数值偏小,往往会认为内存要用光了。其实并非如此,之所以这样是因为每当我们操作文件的时候,Linux都会尽可能的把文件缓存到内存里,这样下次访问的时候,就可以直接从内存中取结果,所以cached一栏的数值非常的大,不过不用担心,这部分内存是可回收的,操作系统的虚拟内存管理器会按照LRU算法淘汰冷数据。还有一个buffers,也是可回收的,不过它是保留给块设备使用的。
知道了原理,我们就可以推算出系统可用的内存是free + buffers + cached:
shell> echo $((2723 + 239 + 25880))28842至于系统实际使用的内存是used – buffers – cached:
shell> echo $((29377 - 239 - 25880))3258除了free命令,还可以使用sar命令:
shell> sar -rkbmemfree kbmemused  %memused kbbuffers  kbcached  3224392  29647732     90.19    246116  26070160shell> sar -Wpswpin/s pswpout/s    0.00      0.00希望你没有被%memused吓到,如果不幸言中,重读本文。
再说说MongoDB是如何使用内存的目前,MongoDB使用的是内存映射存储引擎,它会把数据文件映射到内存中,如果是读操作,内存中的数据起到缓存的作用,如果是写操作,内存还可以把随机的写操作转换成顺序的写操作,总之可以大幅度提升性能。MongoDB并不干涉内存管理工作,而是把这些工作留给操作系统的虚拟内存管理器去处理,这样做的好处是简化了MongoDB的工作,但坏处是你没有方法很方便的控制MongoDB占多大内存,幸运的是虚拟内存管理器的存在让我们多数时候并不需要关心这个问题。
有时候,即便MongoDB使用的是64位操作系统,也可能会遭遇OOM问题,出现这种情况,多半是因为限制了内存的大小所致,可以这样查看当前值:
shell> ulimit -a | grep memory多数操作系统缺省都是把它设置成unlimited的,如果你的操作系统不是,可以这样修改:
shell> ulimit -m unlimitedshell> ulimit -v unlimited注:ulimit的使用是有上下文的,最好放在MongoDB的启动脚本里。
有时候,MongoDB连接数过多的话,也可能影响性能,可以通过serverStatus查询:
mongo> db.serverStatus().connections每个连接都是一个线程,需要一个Stack,而Linux下缺省的Stack设置一般比较大:
# ulimit -a | grep stackstack size              (kbytes, -s) 10240所有连接消耗的内存加起来会相当惊人,推荐把Stack设置小一点,比如说1024:
shell> ulimit -s 1024注:从MongoDB1.8.3开始,MongoDB会在启动时自动设置Stack。
有时候,出于某些原因,你可能想释放掉MongoDB占用的内存,不过前面说了,内存管理工作是由虚拟内存管理器控制的,所以通常你只能通过重启服务来释放内存,你一定不齿于这样的方法,幸好可以使用MongoDB内置的closeAllDatabases命令达到目的:
mongo> use adminmongo> db.runCommand({closeAllDatabases:1})另外,通过调整内核参数drop_caches也可以释放缓存:
shell> sysctl -w vm.drop_caches=1平时可以通过mongo命令行来监控MongoDB的内存使用情况,如下所示:
mongo> db.serverStatus().mem:{    "resident" : 22346,    "virtual" : 1938524,    "mapped" : 962283}还可以通过mongostat命令来监控MongoDB的内存使用情况,如下所示:
shell> mongostatmapped  vsize    res faults  940g  1893g  21.9g      0其中内存相关字段的含义是:
  • mapped:映射到内存的数据大小
  • visze:占用的虚拟内存大小
  • res:占用的物理内存大小
注:如果操作不能在内存中完成,结果faults列的数值不会是0,视大小可能有性能问题。
在上面的结果中,vsize是mapped的两倍,而mapped等于数据文件的大小,所以说vsize是数据文件的两倍,之所以会这样,是因为本例中,MongoDB开启了journal,需要在内存里多映射一次数据文件,如果关闭journal,则vsize和mapped大致相当。
如果想验证这一点,可以在开启或关闭journal后,通过pmap命令来观察文件映射情况:
shell> pmap $(pidof mongod)到底MongoDB配备多大内存合适?宽泛点来说,多多益善,如果要确切点来说,这实际取决于你的数据及索引的大小,内存如果能够装下全部数据加索引是最佳情况,不过很多时候,数据都会比内存大,比如本文所涉及的MongoDB实例:
mongo> db.stats(){    "dataSize" : 1004862191980,    "indexSize" : 1335929664}本例中索引只有1G多,内存完全能装下,而数据文件则达到了1T,估计很难找到这么大内存,此时保证内存能装下热数据即可,至于热数据是多少,取决于具体的应用。如此一来内存大小就明确了:内存 > 索引 + 热数据,最好有点富余,因为前面提到过,连接本身也要消耗一定的内存,另外,操作系统本身正常运转也需要消耗一部分内存。
关于MongoDB与内存的话题,大家还可以参考官方文档中的相关介绍
工作太忙,不上QQ/MSN,但每天会上LinuxTone学习!

Rank: 7Rank: 7Rank: 7

注册时间
2008-9-20
最后登录
2014-7-18
在线时间
481 小时
阅读权限
100
积分
33745
帖子
2189
主题
48
精华
0
UID
307

LT元老

发表于 2011-9-20 13:48:14 |显示全部楼层
新的nosql之所以快,和大量使用内存也不无关系。

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

IT运维专家网感谢您的支持

合作联系: QQ:67888954/MSN:cnseek@msn.com/mail:netseek@linuxtone.org

Archiver|手机版|感谢所有关心和支持过LinuxTone的朋友们 转载本站内容请注明原作者名及出处 ( 京ICP备08103151 )   |

GMT+8, 2014-7-28 16:16 , Processed in 0.019019 second(s), 11 queries , Apc On.

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部