zabbix监控之二
4.station32受控端安装zabbix4.1:下载所需要用的的程序包:只有受控端是主动模式时才需要装zabbix-sender
# yum -y localinstall \
zabbix-2.2.3-1.el6.x86_64.rpm\ # 主程序server端/agent端都需要
zabbix-agent-2.2.3-1.el6.x86_64.rpm\ # 受控端安装agent程序
zabbix-sender-2.2.3-1.el6.x86_64.rpm\ # 受控端主动发送数据到主控端程序
# tree /etc/zabbix/
/etc/zabbix/
|--zabbix_agentd.conf 受理端配置文件
`--zabbix_agentd.d
`-- userparameter_mysql.conf
# vim zabbix_agentd.conf
23 LogFile=/var/log/zabbix/zabbix_agentd.log
86 Server=192.168.1.31 主控服务器IP
128 ServerActive=192.168.1.31 主控服务器IP,保留默认127.0.0.1,就会报错如下
139 Hostname=station32.example.com 受控端主机名/IP
需要注意的是代理端的设定参数“Hostname= station32.example.com”要和配置时填入的主机名称一致,不然日志中将会报“host {主机名}not found”的错误。
# service zabbix-agent start
# netstat -nutlp | grep zabbix
tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 1690/zabbix_agentd
tcp 0 0 :::10050 :::* LISTEN 1690/zabbix_agentd
# chkconfig zabbix-agent on
# tail/var/log/zabbix/zabbix_agentd.log
Q5:1695:20140617:001526.629active check configuration update from started to fail(cannot connect to [:10051]: Connection refused)
# vimzabbix_agentd.conf
修改128ServerActive=192.168.1.31 主控服务器IP
# service zabbix-agent restart
在configuration->hosts面板下点击菜单createhost添加新受控主机station32,
http://s3.运维网.com/wyfs02/M02/3C/FE/wKioL1PDpROh9nGwAAGJyzcM5R4521.jpg
有station32主机条目,还需添加监控项目,点击create item
http://s3.运维网.com/wyfs02/M01/3D/01/wKiom1PDp6bA6RjIAAHwfVXf1c4014.jpg
http://s3.运维网.com/wyfs02/M00/3D/01/wKioL1PDp5iDwtUxAAG6B1YUYF8867.jpg
http://s3.运维网.com/wyfs02/M02/3D/01/wKioL1PDp5jBPeoaAAFzYqKePVE338.jpg
点击Graphs创建图形creategraphs,
http://s3.运维网.com/wyfs02/M00/3D/02/wKiom1PDqAHAhnOdAAGCbWnb858221.jpg
http://s3.运维网.com/wyfs02/M01/3D/02/wKiom1PDqAGxEh4bAAGVjaz-gNs234.jpg
5. 触发器(trigger):用于评估某监控对象的特定item内所接收到数据是否在合理范围内---阈值的特定表达式;
触发器表达式格式:
{:key.()}
设置入站流量>400就启动触发器
点击ExpressionConstructor表达式生成器,Edit, Select,Network Inbound Rating
URL指定满足触发条件,打开的链接。
http://s3.运维网.com/wyfs02/M01/3D/02/wKiom1PDqIigR58MAADO-VFverU849.jpg
Insert->Add
http://s3.运维网.com/wyfs02/M02/3D/02/wKioL1PDqH-zwm2gAAFHywnXSAc159.jpg
http://s3.运维网.com/wyfs02/M01/3D/02/wKiom1PDqMKDTX2VAADUbkEPwBQ172.jpg
http://s3.运维网.com/wyfs02/M00/3D/03/wKiom1PDqN_wVVdjAAGqBG4cxHc763.jpg
最后一刻的最大流量599>400, 肯定启动触发器
http://s3.运维网.com/wyfs02/M00/3D/03/wKiom1PDqQfAIkcBAADTHNDdsDI736.jpg
触发器仅触发事件,但没有进一步动作。
6.动作(action):特定事件事先定义的处理方法,包含操作(发送通知)和条件(何时执行操作);一旦异常情况发生,击发触发器,需要采取一定动作(action),如报警或执行远程命令;并非所有击发触发器事件都需人工干预,触发器状态从"OK"转"Problem"必须报警通知监控人员,当数据再次回归到合理范围时,其状态从" Problem"转" OK "则无需干预;
7.实现zabbix通知功能
1.定义所需媒介(media):发送信息的途径,如邮件,Jabber,SMS等;
2.配置动作(action):发送信息至某媒介;
8.动作(action)由"条件"(condition)和"操作"(operation)组成,"条件"满足时执行相应"操作",最基本操作"发送通知"和"执行远程命令";
10.新建媒体类型 Administration-->Media Type
http://s3.运维网.com/wyfs02/M00/3D/03/wKiom1PDqaeCGAShAAGK9mk-jjo524.jpg
11. 定义动作configuration->action
zabbix的宏macros就是预定义函数,
帮助文档https://www.zabbix.com/documentation/2.2/manual/appendix/macros/supported_by_location
动作是要做什么,例如下图要sendmessage的内容
http://s3.运维网.com/wyfs02/M01/3D/02/wKioL1PDqbrT5WAhAAF4STtc1Ww959.jpg
满足"条件",才下一步"操作"
http://s3.运维网.com/wyfs02/M01/3D/03/wKioL1PDqhzBJnzyAAF95F__Uco163.jpg
操作是怎么做operation:
1.Remote command如监控Haproxy服务中断了,远程命令一重启就恢复,则无需send message.
否则2. 再发送邮件
Defaultoperation step duration:默认操作间隔3600秒=1小时,最小60秒=1分钟。总不能不停执行操作。一般取长值。
http://s3.运维网.com/wyfs02/M01/3D/03/wKiom1PDqo3SV8p9AAG19gMWuJU484.jpg
新建媒介
http://s3.运维网.com/wyfs02/M01/3D/03/wKioL1PDqruRo5f_AADW2a5bslo554.jpg
三种状态才启用触发,三者AND
A. 不在维护状态
B.触发器从ok到problem
C.自定义触发器启用
http://s3.运维网.com/wyfs02/M02/3D/03/wKiom1PDqzKhxe4_AAE5BWBgCMY911.jpg
在station31上不停pingstation32
http://s3.运维网.com/wyfs02/M02/3D/03/wKioL1PDq0HSWQ8OAAICP3BsYYw812.jpg
HeirloomMail version 12.4 7/29/08.Type ? forhelp.
"/var/spool/mail/root":7 messages 3 new 5 unread
N9zabbix@localhost.exaWed Jun 1823:3023/1076"OK: Network inbound traffic toohigh"
& 9
Message9:
Fromzabbix@localhost.example.comWed Jun 1823:30:57 2014
Return-Path:
X-Original-To:root@localhost
Delivered-To:root@localhost.example.com
From:
To:
Date:Wed, 18 Jun 2014 23:30:57 +0800
Subject: OK: Network inbound traffic too high
Content-Type:text/plain; charset="UTF-8"
Status:R
Trigger: Network inbound traffic too high
Triggerstatus: OK
Triggerseverity: High
TriggerURL:
Item values:
1. Network Inbound Rating(station32.example.com:net.if.in): 370
2.*UNKNOWN* (*UNKNOWN*:*UNKNOWN*): *UNKNOWN*
3.*UNKNOWN* (*UNKNOWN*:*UNKNOWN*): *UNKNOWN*
Originalevent ID: 384&
页:
[1]