设为首页 收藏本站
查看: 1087|回复: 0

Nagios监控平台之五:监控linux主机的CPU温度

[复制链接]

尚未签到

发表于 2019-1-15 08:45:06 | 显示全部楼层 |阅读模式
  我的机房没有温度报警装置,我用此方法实现对机房温度的掌控,如果只有一台报警,则可认为单机故障,如果几台同时报警,则可认为机房空调出现了问题。具体实现方法如下:
  

  环境:被监控机:CentOS 6.3
  1、安装硬件传感器监控软件 sensors
#yum install lm_sensors*  2、运行sensors-detect进行传感器检测
  #sensors-detect ##一路回车即可,此步我在虚拟机下报错,但在物理机上没有问题
  3、运行sensors看是否能读取数据,如下像下面这样表示正常:
  [root@rd02 ~]# sensors
  coretemp-isa-0000
  Adapter: ISA adapter
  Core 0: +32.0°C (high = +76.0°C, crit = +100.0°C)
  Core 1: +32.0°C (high = +76.0°C, crit = +100.0°C)
  4、#vi /usr/local/nagios/libexec/check_cputemp ##粘贴如下#号之间的内容
  ##########################################################
  #!/bin/sh
  #########check_cputemp###########
  #date : May 2011
  #Licence GPLv2
  #INSTALLATION
  #the script need to install lm_sensors
  #sensors's output need like below format
  #########################################
  #coretemp-isa-0000#
  #Adapter: ISA adapter#
  #Core 0: +27°C (high = +85°C)#
  #
  #coretemp-isa-0001#
  #Adapter: ISA adapter#
  #Core 1: +25°C (high = +85°C) #
  #########################################
  #you can use NRPE to define service in nagios
  #check_nrpe!check_cputemp.sh
  # Plugin return statements
  STATE_OK=0
  STATE_WARNING=1
  STATE_CRITICAL=2
  STATE_UNKNOWN=3
print_help_msg(){
  $Echo "Usage: $0 -h to get help."
  }
  print_full_help_msg(){
  $Echo "Usage:"
  $Echo "$0 [ -v ] -m sensors -w cpuT -c cpuT"
  $Echo "Sepicify the method to use the temperature data sensors."
  $Echo "And the corresponding Critical value must greater than Warning value."
  $Echo "Example:"
  $Echo "${0} -m sensors -w 40 -c 50"
  }
  print_err_msg(){
  $Echo "Error."
  print_full_help_msg
  }
  to_debug(){
  if [ "$Debug" = "true" ]; then
  $Echo "$*" >> /var/log/check_sys_temperature.log.$$ 2>&1
  fi
  }
  unset LANG
  Echo="echo -e"
  if [ $# -lt 1 ]; then
  print_help_msg
  exit 3
  else
  while getopts :vhm:w:c: OPTION
  do
  case $OPTION
  in
  v)
  #$Echo "Verbose mode."
  Debug=true
  ;;
  m)
  method=$OPTARG
  ;;
  w)
  WARNING=$OPTARG
  ;;
  c)
  CRITICAL=$OPTARG ;;
  h)
  print_full_help_msg
  exit 3
  ;;
  ?)
  $Echo "Error: Illegal Option."
  print_help_msg
  exit 3
  ;;
  esac
  done
  if [ "$method" = "sensors" ]; then
  use_sensors="true"
  to_debug use_sensors
  else
  $Echo "Error. Must to sepcify the method to use sensors."
  print_full_help_msg
  exit 3
  fi
  to_debug All Values are \" Warning: "$WARNING" and Critical: "$CRITICAL" \".
fi
  #########lm_sensors##################
  if [ "$use_sensors" = "true" ]; then
  sensorsCheckOut=`which sensors 2>&1`
  if [ $? -ne 0 ];then
  echo $sensorsCheckOut
  echo Maybe you need to check your sensors.
  exit 3
  fi
  to_debug Use $sensorsCheckOut to check system temperature
  TEMP1=`sensors | head -3 | tail -1 | gawk '{print $3}' | grep -o [0-9][0-9]`
  TEMP2=`sensors | head -4 | tail -1 | gawk '{print $3}' | grep -o [0-9][0-9]`
  SUM=$(( $TEMP1 + $TEMP2 ))
  TEMP=$(($SUM/2))
  if [ -z "$TEMP" ] ; then
  $Echo "No Data been get here. Please confirm your ARGS and re-check it with Verbose mode, then to check the log."
  exit 3
  fi
  to_debug temperature data is $TEMP
  else
  $Echo "Error. Must to sepcify the method to use sensors"
  print_full_help_msg
  exit 3
  fi
  ######### Comparaison with the warnings and criticals thresholds given by user############
  CPU_TEMP=$TEMP
  #if [ "$WARNING" != "0" ] || [ "$CRITICAL" != "0" ]; then
  if [ "$CPU_TEMP" -gt "$CRITICAL" ] && [ "$CRITICAL" != "0" ]; then
  STATE="$STATE_CRITICAL"
  STATE_MESSAGE="CRITICAL"
  to_debug $STATE , Message is $STATE_MESSAGE
  elif [ "$CPU_TEMP" -gt "$WARNING" ] && [ "$WARNING" != "0" ]; then
  STATE="$STATE_WARNING"
  STATE_MESSAGE="WARNING"
  to_debug $STATE , Message is $STATE_MESSAGE
  else
  STATE="$STATE_OK"
  STATE_MESSAGE="OK"
  to_debug $STATE , Message is $STATE_MESSAGE
  fi
  echo "The TEMPERATURE "$STATE_MESSAGE" "-" The CPU's Temperature is "$CPU_TEMP" ℃ !"
  exit $STATE
  ##########################################################
  5、赋予上述脚本执行权限:
  #chmod +x /usr/local/nagios/libexec/check_cputemp
  6、配置nrpe.cfg,添加如下一行:
  command[check_cputemp]=/usr/local/nagios/libexec/check_cputemp -m sensors -w 38 -c 45
  注意:以上六步均在被监控机上完成。
  7、在Nagios服务器配置服务:
  define service{
  use generic-service
  host_name
  service_description CPU Temperature
  check_command check_nrpe!check_cputemp
  }
  保存后重启nagios服务即可。
  最后挂个公司网站的连接:移动支付




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-663403-1-1.html 上篇帖子: nagios+NRPE+pnp4nagios+ndoutils+mysql监控项目部署(2) 下篇帖子: nagios实例监控远程主机[阮胜昌]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表