Zabbix 完整的监控流程
Zabbix完整的监控流程前面学习了zabbix的工作原理和安装方法,今天我们学习zabbix 添加监控主机:
1、添加一台主机( 配置--主机--添加主机)
https://s1.运维网.com/wyfs02/M02/9C/AA/wKioL1l0WAeiLRFqAAC9QI1gqHM991.png-wh_500x0-wm_3-wmp_4-s_1394497965.png
https://s2.运维网.com/wyfs02/M01/9C/AA/wKioL1l0WPei3vCYAAHbL8m_Nkg550.jpg-wh_500x0-wm_3-wmp_4-s_2104293867.jpg
这样 node2 就被添加上来了。
2、添加node2 的应用集(aplication)
选择node2 应用集--创建应用集--名称为cpu stats(再创建一个memory stats)
https://s2.运维网.com/wyfs02/M00/9C/AA/wKiom1l0WZrDGPFEAABWz8vOw94352.jpg-wh_500x0-wm_3-wmp_4-s_1436373407.jpg
https://s2.运维网.com/wyfs02/M00/9C/AB/wKiom1l0WmThF9aaAACNL2yKz_0889.jpg-wh_500x0-wm_3-wmp_4-s_126664833.jpg
3、添加item (选择node2 item--创建item)
https://s2.运维网.com/wyfs02/M00/9C/AB/wKiom1l0XxSQEwkGAADMGZbl0DE047.jpg-wh_500x0-wm_3-wmp_4-s_1127324341.jpg
https://s1.运维网.com/wyfs02/M00/9C/AB/wKioL1l0X5uBp7VBAAA_d3mAxjc179.jpg-wh_500x0-wm_3-wmp_4-s_2348548914.jpg
注:如果监控网卡进/出站流量,先创建一个关于net 的aplication 再创建item,选择 item 时key 值选择 net.if.in
4、 默认Item 有多种类型,
zabbix-agent 工作模式有:passive,active
网卡流量相关:
net.if.in //if 接口,如eth0 ;mode :bytes,packets,errors,dropped
net.if.out
net.if.total
监控端口相关:
net.tcp.listen //监听了哪些端口
net.tcp.port //监听了某IP哪些端口
net.tcp.service //监听在哪个IP的服务,哪个端口
进程相关:
kernel.maxfiles//进程允许打开的最大连接数
kernel.maxproc //kernel允许运行的最大进程数
cpu相关:
system.cpu.intr//中断次数
system.cpu.load [,]//cpu 的负载
自定义item:
关键:选取一个唯一的key:
命令:收集数据的命令或脚本
5、定义Triggers (可以存在依赖关系的组件)
选择node2--Triggers--创建Triggers
Trigger的状态一般就2种,要么OK ,要么Problem超出定义的数值就显示Problem,即一个事件发生
每次接受到一个item的新数据时都会对item的当前采样值进行判断(与triggers的表达式比较)
一个triggers 只能属于一个item,一个item 可以有多个trigger
https://s2.运维网.com/wyfs02/M00/9C/AB/wKioL1l0avzzAulxAADF9RIvTWI112.jpg-wh_500x0-wm_3-wmp_4-s_2244417998.jpg
https://s3.运维网.com/wyfs02/M02/9C/AB/wKioL1l0axXxir5RAACG0QgAeH8922.jpg-wh_500x0-wm_3-wmp_4-s_2666512110.jpg
6、 定义Graph( 选择node2--Graph--创建Graph)
https://s3.运维网.com/wyfs02/M02/9C/AB/wKiom1l0aHnjV2FKAACeaMGEQX0377.jpg-wh_500x0-wm_3-wmp_4-s_581013416.jpg
7、定义Actions
(1)触发条件一般为事件:
Trigger events: ok---problem
Discovery events: zabbix的network discovery 工作时发现主机
Auto registration events: 主动模式的agent注册时产生的事件
Internal events :Item 变成不再被支持或Trigger变成未知状态
https://s5.运维网.com/wyfs02/M01/9C/AC/wKioL1l0bpmjvAZYAACkpbcf-IM600.jpg-wh_500x0-wm_3-wmp_4-s_1435260220.jpg
(2)operations 的功能:
动作:send message 、Remote command
配置send message:
(1)定义media---(2)定义好用户---(3)配置要发送的消息---(4)报警升级
所以我们要定义一个操作时,事先要定义好media、用户等
https://s2.运维网.com/wyfs02/M01/9C/AE/wKiom1l0ltChlmJmAADKDhwYqUE510.jpg-wh_500x0-wm_3-wmp_4-s_2827469346.jpg
https://s3.运维网.com/wyfs02/M01/9C/AE/wKioL1l0luLwVDMpAABuPkFVgfA940.jpg-wh_500x0-wm_3-wmp_4-s_2790709799.jpg
https://s5.运维网.com/wyfs02/M02/9C/AE/wKiom1l0lvHB7QdqAADXseBEfM8544.jpg-wh_500x0-wm_3-wmp_4-s_4253151594.jpg
8、定义media types https://s4.运维网.com/wyfs02/M01/9C/AE/wKiom1l0mKSQzumsAACmfrJfbPg829.jpg-wh_500x0-wm_3-wmp_4-s_4107661195.jpg
9、定义用户有三个选项,
(1)用户-----》
https://s3.运维网.com/wyfs02/M02/9C/AE/wKiom1l0mjKgC5RSAACKB2gP5N0266.jpg-wh_500x0-wm_3-wmp_4-s_123606725.jpg
(2)报警媒介------》
https://s5.运维网.com/wyfs02/M00/9C/AE/wKiom1l0mw6AALEZAACaHYJ9lso120.jpg-wh_500x0-wm_3-wmp_4-s_1648865180.jpg
(3)权限------!
https://s4.运维网.com/wyfs02/M00/9C/AE/wKiom1l0nBTQFg6YAAC2SOqhJmw860.jpg-wh_500x0-wm_3-wmp_4-s_396131794.jpg
11、定义好用户、报警媒介、权限后回头再来action的条件、操作等
https://s1.运维网.com/wyfs02/M00/9C/AF/wKiom1l0nYCjPFxQAACaTHZs7m8580.jpg-wh_500x0-wm_3-wmp_4-s_2658617699.jpg
这样就定制了一个完整的监控报警机制,一旦触发一个事件,就会以定义的媒介通知定义的管理员。
页:
[1]