设为首页 收藏本站
查看: 1215|回复: 0

[经验分享] Zabbix的集中式监控

[复制链接]

尚未签到

发表于 2015-9-9 09:46:11 | 显示全部楼层 |阅读模式
  相对于传统的ZABBIX硬件系统级监控(CPU,内存,硬盘,网卡),应用级的监控就显得有些复杂了。
  如果对不同的应该来不同的应用,配置会很多的。
  如果我们能在一个指定的AGENT上监控所有的APACHE,NGINX,MYSQL,PHP-FPM,TOMCAT之类的话,
  那后期维护就是比较简单的事了。
  且对于MYSQL,WEB这种,可以直接手动建一个AGENT,利用自动发现功能,LOW DISCOVERY,弄好图表和触发器,然后维护相关的配置文件即可。(在ZABBIX SERVER进行类似监控,在压力不大的情况下,也是一个好主意~)
  相关模板和脚本附后。
  http://files.cnblogs.com/files/aguncn/TemplateAppNginx.xml
  http://files.cnblogs.com/files/aguncn/nginx_monitor.sh
  我们的自定义用户参数,可以这样来:



UnsafeUserParameters=1
#mysql
UserParameter=MySQL.BBS,/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.3 -P 3306 -e "show processlist" | wc -l` \- 1
UserParameter=MySQL.WWW,/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.2 -P 3306 -e "show processlist" | wc -l` \- 1
UserParameter=MySQL.WEND,/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.1 -P 3306 -e "show processlist" | wc -l` \- 1
UserParameter=MySQL.JIJ/usr/bin/expr `/usr/bin/mysql -uzabbix -pxxx -h1.1.1.4 -P 3306 -e "show processlist" | wc -l` \- 1
#http
UserParameter=web.site.discovery,/etc/zabbix/alertscripts/web_site_code_status web_site_discovery
UserParameter=web.site.code
  • ,/etc/zabbix/alertscripts/web_site_code_status web_site_code $1
    #nginx
    UserParameter=nginxSiteDiscovery,/etc/zabbix/alertscripts/nginx_monitor.sh nginxSiteDiscovery
    UserParameter=getNginxStatus
  • ,/etc/zabbix/alertscripts/nginx_monitor.sh getNginxStatus "$1" "$2"
    #php-fpm
    UserParameter=php.site.discovery,/etc/zabbix/alertscripts/php-fpm-status php_site_discovery
    UserParameter=php.site.code
  • ,/etc/zabbix/alertscripts/php-fpm-status php_site_code "$1" "$2"
    UserParameter=PhpSiteDiscovery,/etc/zabbix/alertscripts/php_monitor.sh PhpSiteDiscovery
    UserParameter=getPhpStatus
  • ,/etc/zabbix/alertscripts/php_monitor.sh getPhpStatus "$1" "$2"
      
      ======================
      转一篇可以用这种方式扩展的东东。感谢这个聪明的朋友:)
      http://qicheng0211.blog.iyunv.com/3958621/1557695
      
      
      ==========================
      
      “nginx统一监控”意思是在一台Linux服务器上集中监控所有nginx站点的status状态。我们把这个服务器叫做“nginx监控服务器”,可以是装有zabbix agent的zabbix server,或是其他装agent的被监控客户端。
      思路:把所有nginx站点的URL写入到“nginx监控服务器”上的一个配置文件中。增加或删除nginx监控站点只需要修改这个配置文件,利用zabbix的low-level discovery动态监控这些站点。“nginx监控服务器”的zabbix-agent调用nginx监控脚本,获取nginx_status后,利用zabbix-sender把监控数据发送到zabbix服务器端。
      配置步骤如下:
      一、在被监控nginx站点上配置stub_status模块
      开启stub_status模块监控,在server块中加入location就行了。
      假设“nginx监控服务器”的IP地址为192.168.0.1,配置如下:







    1

    2

    3

    4

    5

    6

    7

    8




        location /nginx_status{

            stub_status on;

            access_log off;

            allow 127.0.0.1;

            # 要允许“nginx监控服务器”访问nginx status

            allow 192.168.0.1;

            deny all;

        }
      重启nginx,然后请求http://domain/nginx_status 就行了,下面是结果:







    1

    2

    3

    4




    Active connections: 1

    server accepts handled requests

    16672 16672 16769

    Reading: 0 Writing: 1 Waiting: 0
      二、在nginx监控服务器上配置监控脚本
      首先,在nginx监控服务器上安装好zabbix-agent和zabbix-sender,推荐yum安装。
      注意:设置zabbix_agentd.conf里Timeout=30。减少因脚本执行超时,agent获取不到数据的情况。
      然后,建立脚本文件的目录/etc/zabbix/monitor_scripts。







    1




    shell# mkdir -p /etc/zabbix/monitor_scripts
      把监控脚本nginx_monitor.sh放到/etc/zabbix/monitor_scripts目录下。
      nginx_monitor.sh脚本内容如下,需要修改AGENT_CONF变量的值:







    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    20

    21

    22

    23

    24

    25

    26

    27

    28

    29

    30

    31

    32

    33

    34

    35

    36

    37

    38

    39

    40

    41

    42

    43

    44

    45

    46

    47

    48

    49

    50

    51

    52

    53

    54

    55

    56

    57

    58

    59

    60

    61

    62

    63

    64

    65

    66

    67

    68

    69

    70

    71

    72

    73

    74

    75

    76

    77

    78

    79

    80

    81

    82

    83

    84

    85

    86

    87

    88

    89




    #!/bin/bash

    #

    # Filename:    nginx_monitor.sh

    # Revision:    1.0

    # Date:        2014/09/24

    # Author:      Qicheng

    # Email:

    # Website:     http://qicheng0211.blog.iyunv.com

    # Description: nginx统一监控脚本

    # Notes:      

    #



    # 修改AGENT_CONF的值为本地zabbix agent的配置文件路径

    AGENT_CONF="/etc/zabbix/zabbix_agentd.conf "

    # nginx站点的配置文件路径

    NGINX_SITE_CONF="/etc/zabbix/monitor_scripts/nginx_site.conf"

    # zabbix_sender的路径

    ZBX_SENDER="/usr/bin/zabbix_sender"



    FUNCTION=$1

    HOST_NAME=$2

    NGINX_SITE=$3

    CURL="/usr/bin/curl"

    TIMEOUT=30



    # nginx site low-level discovery

    function nginxSiteDiscovery()

    {

        nginx_site=($(grep '^[^#]' ${NGINX_SITE_CONF}))

        max_index=$[${#nginx_site[@]}-1]

        printf '{\n'

        printf '\t"data":['

        for key in `seq -s' ' 0 $max_index`

        do

            printf '\n\t\t{'

            printf "\"{#NGINX_SITE}\":\"${nginx_site[${key}]}\"}"

            if [ $key -ne $max_index ];then

                printf ","

            fi

        done

        printf '\n\t]\n'

        printf '}\n'

    }



    # 获取nginx status,把数据发送到zabbix server

    function getNginxStatus()

    {

        nginx_status_url="${NGINX_SITE}/nginx_status"

        # 获取nginx_status后,保存到下面的文件里

        nginx_status_file="/tmp/nginx_status_$(echo ${NGINX_SITE} | sed 's#^http.*://##; s#/#_#g').log"

        :>"$nginx_status_file"



        # curl获取nginx_status

        ${CURL} -s --connect-timeout ${TIMEOUT} "$nginx_status_url" 2>&1 | tee "$nginx_status_file"

        line_num=$(cat "$nginx_status_file" | wc -l)

        # 判断是否正确获取nginx_status

        [ $line_num -ne 4 ] && { echo "ERROR: $nginx_status_file is not correct."; exit 1;}



        active=$(cat "$nginx_status_file" | grep 'Active' | awk '{print $NF}')

        reading=$(cat "$nginx_status_file" | grep 'Reading' | awk '{print $2}')

        writing=$(cat "$nginx_status_file" | grep 'Writing' | awk '{print $4}')

        waiting=$(cat "$nginx_status_file" | grep 'Waiting' | awk '{print $6}')

        accepts=$(cat "$nginx_status_file" | awk NR==3 | awk '{print $1}')

        handled=$(cat "$nginx_status_file" | awk NR==3 | awk '{print $2}')

        requests=$(cat "$nginx_status_file" | awk NR==3 | awk '{print $3}')

        echo "Sending the data to zabbix server..."

        # 将特定格式的数据发送到zabbix server,每行的格式为:<hostname> <key> <value>

        cat << EOF | ${ZBX_SENDER} -c ${AGENT_CONF} -i -

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,active]" "${active}"

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,reading]" "${reading}"

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,writing]" "${writing}"

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,waiting]" "${waiting}"

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,accepts]" "${accepts}"

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,handled]" "${handled}"

    "${HOST_NAME}" "nginx_status[$NGINX_SITE,requests]" "${requests}"

    EOF

    }



    [ $# -eq 0 ] && { echo "ERROR: The script needs at least one parameter."; exit 1;}



    case $FUNCTION in

        nginxSiteDiscovery|getNginxStatus)

            $FUNCTION

            ;;

        *)

            echo "ERROR: Bad parameters."

            exit 1

            ;;

    esac
      创建nginx站点配置文件nginx_site.conf:







    1

    2




    shell# touch /etc/zabbix/monitor_scripts/nginx_site.conf

    shell# chown -R zabbix:zabbix /etc/zabbix/monitor_scripts
      把所有被监控nginx站点的URL写入到nginx_site.conf文件中,每一行一个URL,如下图:
    DSC0000.jpg
      在zabbix_agentd.conf最后面添加自定义参数:







    1

    2




    UserParameter=nginxSiteDiscovery,bash /etc/zabbix/monitor_scripts/nginx_monitor.sh nginxSiteDiscovery

    UserParameter=getNginxStatus
  • ,bash /etc/zabbix/monitor_scripts/nginx_monitor.sh getNginxStatus "$1" "$2"
  •   最后重启zabbix agent。
      在zabbix server端执行zabbix_get命令测试:
    DSC0001.jpg
      如上图所示,说明环境部署好了。
      三、zabbix WEB端
      1、导入模板
      导入"Template App Nginx.xml"模板,附件有下载。
    DSC0002.jpg
      模板的Item prototypes如下: DSC0003.jpg
      “get nginx status of {#NGINX_SITE}”监控项是Zabbix agent类型,用于调用脚本获取nginx_status。其他item是Zabbix trapper类型,用于接收zabbix-sender发来的nginx_status。
      模板配置了触发器,如果获取不到nginx_status则发出告警。
          2、创建nginx监控主机并链接模板
      “nginx监控主机”的配置中要填写Agent interfaces,并链接模板Template App Nginx。
       DSC0004.jpg
          3、数据展示
    DSC0005.jpg
      
    DSC0006.jpg
      本文出自 “启程的Linux博客” 博客,请务必保留此出处http://qicheng0211.blog.iyunv.com/3958621/1557695
      
      

  • 运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
    2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
    3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
    4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
    5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
    6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
    7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
    8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

    所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-111341-1-1.html 上篇帖子: 自动化运帷之分布式监控-zabbix 配置指南 下篇帖子: zabbix email报警
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    扫码加入运维网微信交流群X

    扫码加入运维网微信交流群

    扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

    扫描微信二维码查看详情

    客服E-mail:kefu@iyunv.com 客服QQ:1061981298


    QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


    提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


    本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



    合作伙伴: 青云cloud

    快速回复 返回顶部 返回列表