MongoDB运行状态、性能监控与分析

日期: 2011-10-31 作者:neilxp 来源:TechTarget中国 英文

  使用任何一个产品,必不可少的一项工作就是对存储的监控,监控可以让你更了解存储的运作方式,让你更早的发现使用上的问题,下面文章转自泛城科技技术博客,对MongoDB的监控做了详细深入的探讨。推荐给各位使用MongoDB的朋友。

  这篇文章的目的是让你知道怎么了解你正在运行的Mongdb是否健康。

  mongostat详解

  mongostat是mongdb自带的状态检测工具,在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态,并输出。如果你发现数据库突然变慢或者有其他问题的话,你第一手的操作就考虑采用mongostat来查看mongo的状态。

  

  它的输出有以下几列:

  •   inserts/s 每秒插入次数
  •   query/s 每秒查询次数
  •   update/s 每秒更新次数
  •   delete/s 每秒删除次数
  •   getmore/s 每秒执行getmore次数
  •   command/s 每秒的命令数,比以上插入、查找、更新、删除的综合还多,还统计了别的命令
  •   flushs/s 每秒执行fsync将数据写入硬盘的次数。
  •   mapped/s 所有的被mmap的数据量,单位是MB,
  •   vsize 虚拟内存使用量,单位MB
  •   res 物理内存使用量,单位MB
  •   faults/s 每秒访问失败数(只有Linux有),数据被交换出物理内存,放到swap。不要超过100,否则就是机器内存太小,造成频繁swap写入。此时要升级内存或者扩展
  •   locked % 被锁的时间百分比,尽量控制在50%以下吧
  •   idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了
  •   q t|r|w 当Mongodb接收到太多的命令而数据库被锁住无法执行完成,它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度,都为0的话表示mongo毫无压力。高并发时,一般队列值会升高。
  •   conn 当前连接数
  •   time 时间戳

  使用profiler

  类似于MySQL的slow log, MongoDB可以监控所有慢的以及不慢的查询。

  

  Profiler默认是关闭的,你可以选择全部开启,或者有慢查询的时候开启。

  > use test
  switched to db test
  > db.setProfilingLevel(2);
  {“was” : 0 , “slowms” : 100, “ok” : 1} // “was” is the old setting
  > db.getProfilingLevel()

  查看Profile日志

  > db.system.profile.find().sort({$natural:-1})
  {“ts” : “Thu Jan 29 2009 15:19:32 GMT-0500 (EST)” , “info” :
  ”query test.$cmd ntoreturn:1 reslen:66 nscanned:0 query: { profile: 2 } nreturned:1 bytes:50″ ,
  ”millis” : 0} …

  3个字段的意义

  •   ts:时间戳
  •   info:具体的操作
  •   millis:操作所花时间,毫秒

  不多说,此处有官方文档。注意,造成满查询可能是索引的问题,也可能是数据不在内存造成因此磁盘读入造成。

  使用Web控制台

  Mongodb自带了Web控制台,默认和数据服务一同开启。他的端口在Mongodb数据库服务器端口的基础上加1000,如果是默认的Mongodb数据服务端口(Which is 27017),则相应的Web端口为28017

  

  这个页面可以看到

  •   当前Mongodb的所有连接
  •   各个数据库和Collection的访问统计,包括:Reads, Writes, Queries, GetMores ,Inserts, Updates, Removes
  •   写锁的状态
  •   以及日志文件的最后几百行(CentOS+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)

  可以参考上图

  db.stat()

  获取当前数据库的信息,比如Obj总数、数据库总大小、平均Obj大小等

  > use test
  switched to db test
  > db.stats()
  {
  ”collections” : 9,
  ”objects” : 4278845,
  ”avgObjSize” : 224.56603031892953,
  ”dataSize” : 960883236,
  ”storageSize” : 1195438080,
  ”numExtents” : 59,
  ”indexes” : 13,
  ”indexSize” : 801931264,
  ”fileSize” : 6373244928,
  ”ok” : 1
  }

  db.serverStatus()

  获取服务器的状态

  {
  ”version” : “1.6.5”,
  ”uptime” : 7208469,
  ”uptimeEstimate” : 7138829,
  ”localTime” : “Wed Oct 26 2011 22:23:07 GMT+0800 (CST)”,
  ”globalLock” : {
  ”totalTime” : 7208469556704,
  ”lockTime” : 4959693717,
  ”ratio” : 0.000688036992871448,
  ”currentQueue” : {
  ”total” : 0,
  ”readers” : 0,
  ”writers” : 0
  }
  },
  ”mem” : {
  ”bits” : 64,
  ”resident” : 3131,
  ”virtual” : 6172,
  ”supported” : true,
  ”mapped” : 4927
  },
  ”connections” : {
  ”current” : 402,
  ”available” : 2599
  },
  ”extra_info” : {
  ”note” : “fields vary by platform”,
  ”heap_usage_bytes” : 832531920,
  ”page_faults” : 8757
  },
  ”indexCounters” : {
  ”btree” : {
  ”accesses” : 2821726,
  ”hits” : 2821725,
  ”misses” : 1,
  ”resets” : 0,
  ”missRatio” : 3.543930204420982e-7
  }
  },
  ”backgroundFlushing” : {
  ”flushes” : 120133,
  ”total_ms” : 73235923,
  ”average_ms” : 609.6236920746173,
  ”last_ms” : 1332,
  ”last_finished” : “Wed Oct 26 2011 22:22:23 GMT+0800 (CST)”
  },
  ”cursors” : {
  ”totalOpen” : 0,
  ”clientCursors_size” : 0,
  ”timedOut” : 238392
  },
  ”repl” : {
  ”ismaster” : true
  },
  ”opcounters” : {
  ”insert” : 269351,
  ”query” : 19331151,
  ”update” : 14199331,
  ”delete” : 1,
  ”getmore” : 145575,
  ”command” : 55982302
  },
  ”asserts” : {
  ”regular” : 0,
  ”warning” : 0,
  ”msg” : 0,
  ”user” : 27,
  ”rollovers” : 0
  },
  ”ok” : 1
  }

  需要关心的地方:

  •   connections 当前连接和可用连接数,听过一个同行介绍过,mongodb最大处理到2000个连接就不行了(要根据你的机器性能和业务来设定),所以设大了没意义。设个合理值的话,到达这个值mongodb就拒绝新的连接请求,避免被太多的连接拖垮。
  •   indexCounters:btree:misses 索引的不命中数,和hits的比例高就要考虑索引是否正确建立。你看我的”missRatio” : 3.543930204420982e-7,很健康吧。所以miss率在mongostat里面也可以看
  •   其他的都能自解释,也不是查看mongo健康状况的关键,就不说明了。

  db.currentOp()

  Mongodb 的命令一般很快就完成,但是在一台繁忙的机器或者有比较慢的命令时,你可以通过db.currentOp()获取当前正在执行的操作。

  在没有负载的机器上,该命令基本上都是返回空的

  > db.currentOp()
  { “inprog” : [ ] }

  以下是一个有负载的机器上得到的返回值样例:

{ “opid” : “shard3:466404288”, “active” : false, “waitingForLock” : false, “op” : “query”, “ns” : “sd.usersEmails”, “query” : { }, “client_s” : “10.121.13.8:34473”, “desc” : “conn” },

  字段名字都能自解释。如果你发现一个操作太长,把数据库卡死的话,可以用这个命令杀死他

  > db.killOp(“shard3:466404288”)

  MongoDB Monitoring Service

  

  MongoDB Monitoring Service(MMS)是Mongodb厂商提供的监控服务,可以在网页和Android客户端上监控你的MongoDB状况。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

neilxp
neilxp

相关推荐