便民 发表于 2018-12-25 10:10:26

nagios监控memcached

  最近根据程序员需要在一台服务器上面部署了memcached服务,虽然用上了,但是对他还不是非常了解。于是开始收集整理他的相关资料,其中一部分就是对他的监控了。
  目前我所知道的监控方法大概有以下几种:
  一、memcache.php 这个东东算是最简单的了,只要支持php环境就能用,把这个文件放到你的网页存放目录下就可以了访问方法 http://ip/memcache.php
http://p.blog.csdn.net/images/p_blog_csdn_net/magicbreaker/EntryImages/20091221/111.jpg
  下载地址 http://livebookmark.net/memcachephp/memcachephp.zip
  http://blogimg.chinaunix.net/blog/upfile2/081230231118.zip
  需要注意的是,使用之前要修改里面的几个选项
  vim memcache.php
  .....
  define('ADMIN_USERNAME','memcache');    // 定义用户名
  define('ADMIN_PASSWORD','password');    // 定义密码
  .....
  $MEMCACHE_SERVERS[] = 'mymemcache-server:11211'; //定义要查看的ip和端口
  $MEMCACHE_SERVERS[] = 'mymemcache-server2:11212'; //可添加多个
  其他内容略
  上面的图就是访问时的效果,是不是很直观?
  二、利用memcached自身的命令来检查
  telnet localhost 11211
  Trying 127.0.0.1...
  Connected to localhost.localdomain (127.0.0.1).
  Escape character is '^]'.
  stats
  STAT pid 24567
  STAT uptime 6576
  STAT time 1261035123
  STAT version 1.4.3
  .....
  STAT bytes 64035
  STAT curr_items 41
  STAT total_items 96
  STAT evictions 0
  END
  不过这个方法我觉得不太方便,从网上搜到了另一个好办法,那就是利用nagios的check_tcp (mixi的方法)
  check_tcp -H localhost -p 11211 -t 5 -E -s 'stats/r/nquit/r/n' -e 'uptime' -M crit 输出结果和上面差不多
  TCP OK - 0.001 second response time on port 11211 [STAT pid 10663
  STAT uptime 76444
  STAT time 1259641750
  STAT version 1.4.2
  .....中间省略
  STAT bytes 1385408560
  STAT curr_items 227799
  STAT total_items 5012750
  STAT evictions 0
  END]|time=0.001142s;;;0.000000;5.000000
  这样我们就能在nagios里面添加命令来查看他的运行状态了
  不过这样还不够,我还需要在memcached出现问题的时候通过邮件或者短信来通知我,下面来介绍一个更好的办法
  三、Nagios的check_memcached
  下载地址:
  http://search.cpan.org/CPAN/authors/id/Z/ZI/ZIGOROU/Nagios-Plugins-Memcached-0.02.tar.gz
  http://cpan.uwinnipeg.ca/cpan/authors/id/Z/ZI/ZIGOROU/Nagios-Plugins-Memcached-0.02.tar.gz
  这个脚本是用perl编的,所以你要先确保自己的机器里面是否有perl环境,不过一般都会默认安装
  # which perl
  /usr/bin/perl
  下载下来后安装
  # tar xzvf Nagios-Plugins-Memcached-0.02.tar.gz
  # cd Nagios-Plugins-Memcached-0.02
  # perl Makefile.PL
  执行后会出现一些提示让你选择,按照自己想法选或者一路回车都能通过
  # make
  这时他会下载一些运行时需要的东西
  # make install
  默认会吧check_memcached文件放到/usr/bin/check_memcached
  没关系 把他拷贝到nagios的libexec下
  在 commands.cfg里面加上这么几条(这里我没有把check_memcached装在memcached服务器上,而是通过Nagios的 check_memcached直接去访问memcached服务器的11211端口,当然你也可以把他装在memcached服务器上利用 check_nrpe来取他的值)
  define command {
  command_name check_memcached_11211
  command_line $USER1$/check_memcached -H 192.168.1.139:11211 --size-warning 80 --size-critical 90
  }
  上面这个是来监控memcached的内存使用比例
  define command {
  command_name memcached_response_11211
  command_line /usr/local/bin/check_memcached -H 192.168.1.139 -w 300 -c 500
  }
  这个是用来监控memcached是否还有应答
  define command {
  command_name check_memcached_hit
  command_line /usr/local/bin/check_memcached -H 192.168.1.139 --hit-warning 10 --size-critical 5
  }
  这个就是命中率啦
  最后要在services.cfg里面加点东西
  define service{
  host_name               babeltimeWeb1
  service_description   memcached_11211
  check_command         check_memcached_11211
  max_check_attempts      3
  normal_check_interval   3
  retry_check_interval    2
  check_period            24x7
  notification_interval   10
  notification_period   24x7
  notification_options    w,u,c,r
  contact_groups          babelgroup
  }
  其他的可以按照自己要求添加..
  好了,让我们重新启动下nagios服务
  /etc/init.d/nagios restart
  看看结果
http://p.blog.csdn.net/images/p_blog_csdn_net/magicbreaker/EntryImages/20091221/222.jpg
  呵呵好了,Nagios监控memcached基本就搞定了。
  另外还可以根据check_tcp -H localhost -p 11211 -t 5 -E -s 'stats/r/nquit/r/n' -e 'uptime' -M crit
  的输出结果自己编写脚本来检测memcached,这里我就不多说了...
  还可以利用check_tcp的结果结合CACTI 来制作memcached的流量视图,当然Cacti也有专门针对memcached的模板(不过我的模板一直抓不到数据...)

页: [1]
查看完整版本: nagios监控memcached