gaojinguan 发表于 2019-1-24 13:46:32

Zabbix 完整的监控流程

                  Zabbix完整的监控流程

  前面学习了zabbix的工作原理和安装方法,今天我们学习zabbix 添加监控主机:
  

  1、添加一台主机( 配置--主机--添加主机)
  

https://s1.运维网.com/wyfs02/M02/9C/AA/wKioL1l0WAeiLRFqAAC9QI1gqHM991.png-wh_500x0-wm_3-wmp_4-s_1394497965.png
https://s2.运维网.com/wyfs02/M01/9C/AA/wKioL1l0WPei3vCYAAHbL8m_Nkg550.jpg-wh_500x0-wm_3-wmp_4-s_2104293867.jpg
  这样 node2 就被添加上来了。
  

  2、添加node2 的应用集(aplication)
  选择node2 应用集--创建应用集--名称为cpu stats(再创建一个memory stats)

https://s2.运维网.com/wyfs02/M00/9C/AA/wKiom1l0WZrDGPFEAABWz8vOw94352.jpg-wh_500x0-wm_3-wmp_4-s_1436373407.jpg
https://s2.运维网.com/wyfs02/M00/9C/AB/wKiom1l0WmThF9aaAACNL2yKz_0889.jpg-wh_500x0-wm_3-wmp_4-s_126664833.jpg
  

  3、添加item (选择node2 item--创建item)
https://s2.运维网.com/wyfs02/M00/9C/AB/wKiom1l0XxSQEwkGAADMGZbl0DE047.jpg-wh_500x0-wm_3-wmp_4-s_1127324341.jpg
https://s1.运维网.com/wyfs02/M00/9C/AB/wKioL1l0X5uBp7VBAAA_d3mAxjc179.jpg-wh_500x0-wm_3-wmp_4-s_2348548914.jpg
  

  注:如果监控网卡进/出站流量,先创建一个关于net 的aplication 再创建item,选择 item 时key 值选择 net.if.in
  

  4、 默认Item 有多种类型,
        zabbix-agent 工作模式有:passive,active

        网卡流量相关:

              net.if.in //if 接口,如eth0 ;mode :bytes,packets,errors,dropped

              net.if.out

              net.if.total

        监控端口相关:

              net.tcp.listen //监听了哪些端口

              net.tcp.port //监听了某IP哪些端口
              net.tcp.service //监听在哪个IP的服务,哪个端口

        进程相关:

              kernel.maxfiles//进程允许打开的最大连接数

              kernel.maxproc   //kernel允许运行的最大进程数

        cpu相关:

              system.cpu.intr//中断次数

              system.cpu.load [,]//cpu 的负载

  

      自定义item:

              关键:选取一个唯一的key:

              命令:收集数据的命令或脚本

  

  

  

  

  5、定义Triggers (可以存在依赖关系的组件)

  选择node2--Triggers--创建Triggers

  Trigger的状态一般就2种,要么OK ,要么Problem超出定义的数值就显示Problem,即一个事件发生

  每次接受到一个item的新数据时都会对item的当前采样值进行判断(与triggers的表达式比较)

  一个triggers 只能属于一个item,一个item 可以有多个trigger

https://s2.运维网.com/wyfs02/M00/9C/AB/wKioL1l0avzzAulxAADF9RIvTWI112.jpg-wh_500x0-wm_3-wmp_4-s_2244417998.jpg
  

https://s3.运维网.com/wyfs02/M02/9C/AB/wKioL1l0axXxir5RAACG0QgAeH8922.jpg-wh_500x0-wm_3-wmp_4-s_2666512110.jpg
  6、 定义Graph( 选择node2--Graph--创建Graph)
https://s3.运维网.com/wyfs02/M02/9C/AB/wKiom1l0aHnjV2FKAACeaMGEQX0377.jpg-wh_500x0-wm_3-wmp_4-s_581013416.jpg
  

  7、定义Actions

  (1)触发条件一般为事件:

  Trigger events: ok---problem

  Discovery events: zabbix的network discovery 工作时发现主机

  Auto registration events: 主动模式的agent注册时产生的事件

  Internal events :Item 变成不再被支持或Trigger变成未知状态

  

https://s5.运维网.com/wyfs02/M01/9C/AC/wKioL1l0bpmjvAZYAACkpbcf-IM600.jpg-wh_500x0-wm_3-wmp_4-s_1435260220.jpg
  

  (2)operations 的功能:

  动作:send message 、Remote command

  配置send message:

  (1)定义media---(2)定义好用户---(3)配置要发送的消息---(4)报警升级

  所以我们要定义一个操作时,事先要定义好media、用户等

  

  

https://s2.运维网.com/wyfs02/M01/9C/AE/wKiom1l0ltChlmJmAADKDhwYqUE510.jpg-wh_500x0-wm_3-wmp_4-s_2827469346.jpg
  

https://s3.运维网.com/wyfs02/M01/9C/AE/wKioL1l0luLwVDMpAABuPkFVgfA940.jpg-wh_500x0-wm_3-wmp_4-s_2790709799.jpg
https://s5.运维网.com/wyfs02/M02/9C/AE/wKiom1l0lvHB7QdqAADXseBEfM8544.jpg-wh_500x0-wm_3-wmp_4-s_4253151594.jpg
  8、定义media types      https://s4.运维网.com/wyfs02/M01/9C/AE/wKiom1l0mKSQzumsAACmfrJfbPg829.jpg-wh_500x0-wm_3-wmp_4-s_4107661195.jpg
  

  9、定义用户有三个选项,
  (1)用户-----》
https://s3.运维网.com/wyfs02/M02/9C/AE/wKiom1l0mjKgC5RSAACKB2gP5N0266.jpg-wh_500x0-wm_3-wmp_4-s_123606725.jpg
  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  (2)报警媒介------》
https://s5.运维网.com/wyfs02/M00/9C/AE/wKiom1l0mw6AALEZAACaHYJ9lso120.jpg-wh_500x0-wm_3-wmp_4-s_1648865180.jpg
  (3)权限------!
https://s4.运维网.com/wyfs02/M00/9C/AE/wKiom1l0nBTQFg6YAAC2SOqhJmw860.jpg-wh_500x0-wm_3-wmp_4-s_396131794.jpg
  

  

  11、定义好用户、报警媒介、权限后回头再来action的条件、操作等
https://s1.运维网.com/wyfs02/M00/9C/AF/wKiom1l0nYCjPFxQAACaTHZs7m8580.jpg-wh_500x0-wm_3-wmp_4-s_2658617699.jpg
  

  这样就定制了一个完整的监控报警机制,一旦触发一个事件,就会以定义的媒介通知定义的管理员。



页: [1]
查看完整版本: Zabbix 完整的监控流程