设为首页 收藏本站
查看: 869|回复: 0

[经验分享] Zabbix监控Tengine 后端服务器健康检查

[复制链接]

尚未签到

发表于 2019-1-21 06:00:21 | 显示全部楼层 |阅读模式
  一 应用场景描述:

  前端使用Tengine作为负载均衡器,需要对监控Tengine到后端服务器的健康状况,利用Tengine提供的接口可以获取每一个后端主机的状态,是up还是down等。
  

  二 编写Zabbix监控脚本
  Tengine的ngx_http_upstream_check_module 模块提供后端监控检查功能。可以使用html,csv,json三种格式查看后端主机状态,这里我们使用json格式便于编写脚本
/status?format=html
/status?format=csv
/status?format=json{"servers": {"total": 1,"generation": 3,"server": [{"index": 0, "upstream": "backend", "name": "106.187.48.116:80", "status": "up", "rise": 58, "fall": 0, "type": "http", "port": 80}]}}  

  tengine_status.py
#!/usr/bin/env /usr/bin/python
'''
    curl 127.0.0.1/up_status?format=json
'''
import json
import optparse
import socket
import urllib2
import subprocess
import tempfile
import os
import logging
logging.basicConfig(filename='/opt/logs/zabbix/tengine_zabbix.log', level=logging.WARNING, format='%(asctime)s %(levelname)s: %(message)s')
#logging.basicConfig(filename='/tmp/tengine_zabbix.log', level=logging.INFO, format='%(asctime)s %(levelname)s: %(message)s')
class Tengine(object):
    '''Class for Tengine Management API'''
    def __init__(self,host_name='',conf='/opt/app/zabbix/conf/zabbix_agentd.conf', senderhostname=None):
        self.host_name = host_name or socket.gethostname()
        self.conf = conf or '/opt/app/zabbix/conf/zabbix_agentd.conf'
        self.senderhostname = senderhostname if senderhostname else host_name
    def call_api(self,tmpfile=None,write='no'):
        ##### change url here
        url = 'http://127.0.0.1/up_status?format=json'
        logging.debug('Get tengine upstream status')
        up_status=json.loads(urllib2.urlopen(url).read())
        upstreams = []
        for upserver in up_status['servers']['server']:
            logging.debug("Discovered upserver " + upserver['upstream'] + upserver['name'] + str(upserver['index']))
            element = {'{#UPSTREAM}': upserver['upstream'],
                       '{#UPNAME}': upserver['name'],
                       '{#UPINDEX}': upserver['index']
                      }
            upstreams.append(element)
            if write is 'yes' and tmpfile is not None:
              for item in [ 'status','rise','fall','type' ]:
                key = '"tengine.upstream_status[{0},{1},{2},{3}]"'.format(upserver['index'], upserver['upstream'], upserver['name'],item)
                value = upserver[item]
                #print key + ":" + str(value)
                logging.debug("SENDER_DATA: - %s %s" % (key,value))
                tmpfile.write("- %s %s\n" % (key, value))
        #print upstreams
        return upstreams
    def check_data(self):
        return_code = 0
        #### use tempfile module to create a file on memory, will not be deleted when it is closed , because 'delete' argument is set to False
        rdatafile = tempfile.NamedTemporaryFile(delete=False)
        self.call_api(rdatafile,write='yes')
        rdatafile.close()
        return_code = self._send_status_data(rdatafile)
        #### os.unlink is used to remove a file
        os.unlink(rdatafile.name)
        return return_code

    def _send_status_data(self, tmpfile):
        '''Send the status data to Zabbix.'''
        '''Get key value from temp file. '''
        args = '/opt/app/zabbix/sbin/zabbix_sender -c {0} -i {1}'
        if self.senderhostname:
            args = args + " -s " + self.senderhostname
        return_code = 0
        process = subprocess.Popen(args.format(self.conf, tmpfile.name),
                                           shell=True, stdout=subprocess.PIPE,
                                           stderr=subprocess.PIPE)
        out, err = process.communicate()
        logging.debug("Finished sending data")
        return_code = process.wait()
        logging.info("Found return code of " + str(return_code))
        if return_code != 0:
            logging.warning(out)
            logging.warning(err)
        else:
            logging.debug(err)
            logging.debug(out)
        return return_code
def main():
    choices=['list_upservers','upstream_status']
    parser = optparse.OptionParser()
    parser.add_option('--hostname', help='Tengine server hostname',
                      default=socket.gethostname())
    parser.add_option('--conf', default='/opt/app/zabbix/conf/zabbix_agentd.conf')
    parser.add_option('--senderhostname', default='', help='Allows including a sender parameter on calls to zabbix_sender')
    parser.add_option('--check', type='choice',choices=choices,help='Type of check')
    (options, args) = parser.parse_args()
    logging.debug("Started trying to process data")
    if not options.check:
        parser.error('At least one check should be specified')
    logging.debug("Started trying to process data")
    api = Tengine(host_name=options.hostname,conf=options.conf, senderhostname=options.senderhostname)
    if options.check == 'list_upservers':
        print json.dumps({'data': api.call_api(tmpfile=None,write='no')},indent=4,separators=(',',':'))
    elif options.check == 'upstream_status':
        print api.check_data()
if __name__ == '__main__':
    main()  

  tengine_status.conf
UserParameter=tengine.discovery_upstream,/usr/bin/python /opt/app/zabbix/sbin/tengine_status.py  --check='list_upservers'
UserParameter=tengine.upstream_status
  • ,/usr/bin/python /opt/app/zabbix/sbin/tengine_status.py  --check='upstream_status'  

      脚本中url根据自己的情况进行修改,还有脚本中使用zabbix_sender进行监控数据的发送工作,zabbix_sender发送数据时需要指定的主机名和Zabbix上被监控主机的主机名相同才会发送成功。
    如果 --check选项的参数是list_upservers 则只会列出各个upstream后端主机,对应的zabbix key是tengine.discovery_upstream
    {
        "data":[
            {
                "{#UPNAME}":"172.28.16.140:80",
                "{#UPSTREAM}":"test",
                "{#UPINDEX}":0
            },
            {
                "{#UPNAME}":"172.28.16.143:80",
                "{#UPSTREAM}":"test",
                "{#UPINDEX}":1
            },
            {
                "{#UPNAME}":"172.28.16.144:80",
                "{#UPSTREAM}":"test",
                "{#UPINDEX}":2
            },
            {
                "{#UPNAME}":"172.28.16.158:80",
                "{#UPSTREAM}":"test",
                "{#UPINDEX}":3
            }
        ]
    }  如果 --check参数是upstream_status则会通过zabbix_sender将一个临时文件rdatafile中的key,value对发送到zabbix proxy或者zabbix server。这里需要注意一下,zabbix_sender是不会主动发送数据过去的,需要有操作触发zabbix_sender才会发送,也就是
    /usr/bin/python /opt/app/zabbix/sbin/tengine_status.py  --check='upstream_status'  这个执行需要定时任务执行或者通过zabbix agent或者zabbix agent(active)触发执行

      脚本中的各种文件路径根据自己情况修改。
      在模板中使用一个类型为Zabbix agent(active)的key来定期执行这个脚本,然后其他的监控数据就通过zabbix_sender上报给zabbix proxy或者zabbix server
      tengine.upstream_status[send_data]                              
      

      

      tengine.upstream_status[{#UPINDEX},{#UPSTREAM},{#UPNAME},fall]
    tengine.upstream_status[{#UPINDEX},{#UPSTREAM},{#UPNAME},rise]
      tengine.upstream_status[{#UPINDEX},{#UPSTREAM},{#UPNAME},status]
    tengine.upstream_status[{#UPINDEX},{#UPSTREAM},{#UPNAME},type]
      这几个key的类型都是Zabbix trapper

      

      添加一个报警,当后端主机的status值为down时就报警
      {Template Tengine Status:tengine.upstream_status[{#UPINDEX},{#UPSTREAM},{#UPNAME},status].str(down)}=1
      

      脚本测试的时候,最好是在zabbix proxy后者zabbix server上使用zabbix_get 来测试
      zabbix_get -s 172.28.16.139 -k tengine.discovery_upstream
      返回数据正常则测试成功

      

      zabbix_get -s 172.28.16.139 -k tengine.upstream_status[send_data]
      

      返回值为0则发送数据成功,可以在zabbix页面查看相应的数据
      返回值为非0则发送数据失败,需要检查下脚本中的url,zabbix_sender,conf配置文件路径,日志文件权限,主机名是否匹配等
      

      

      三 制作Zabbix监控模板
      模板参见附件
      
      
      参考文档:
      http://tengine.taobao.org/
      http://tengine.taobao.org/document_cn/http_upstream_check_cn.html
      



    附件:http://down.运维网.com/data/2368448


  • 运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
    2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
    3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
    4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
    5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
    6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
    7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
    8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

    所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-665707-1-1.html 上篇帖子: zabbix 理论 下篇帖子: Zabbix 利用Windows性能监视器添加对系统各项资源监控
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    扫码加入运维网微信交流群X

    扫码加入运维网微信交流群

    扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

    扫描微信二维码查看详情

    客服E-mail:kefu@iyunv.com 客服QQ:1061981298


    QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


    提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


    本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



    合作伙伴: 青云cloud

    快速回复 返回顶部 返回列表