新风花雪月 发表于 2019-1-23 11:29:05

zabbix学习(四)IT_Service管理

什么是IT Services
  服务器或者某项服务、业务的可用率,不懂技术的上级领导会过问最近服务器可用率如何、所有api的状况怎么样?通常一些技术人员会说负载怎么样,哪些cpu使用率怎么样,硬盘使用情况,api的响应速度都保持在多少、响应时间都在多少?还没等说完,领导就打断了。他不关心这些细节,更不懂这些技术。他想要的是一个结果。比如说服务器故障率在0.001,api的响应率在99.99%。这就是IT Services的功能。
  IT service结构如下:
http://s3.运维网.com/wyfs02/M00/58/B8/wKioL1S553qjJhGZAABZVdDXomw699.jpg
  IT Sverices示例
  举个例子,API的SLA,各个子Service都有他的可用率,然后XXX网站API可以统计到整个API的可用率,当领导过问起来,给他看这个就行了。
http://s3.运维网.com/wyfs02/M00/58/BB/wKiom1S55xvxzrVzAABrqEvXYpI973.jpg
  那这些可用率是怎么计算出来的呢?根据你的触发器,除了未分类和信息这两类,其他严重性级别,例如警告(warnning)等等都会记入故障率
  配置IT Services
  configuration->IT Services->单击root->Add services
  http://s3.运维网.com/wyfs02/M01/58/B9/wKioL1S58dGxKjx0AAHNCEmBG_8292.jpg
  创建服务器在线率
http://s3.运维网.com/wyfs02/M01/58/BB/wKiom1S56inSXdkzAAEwJtusvCQ901.jpg
  service说明
  name:名称
  Parent service:上级节点,这边是root
  Status calculation algorithm:计算付费,共有三个选项

[*]  Do not calculate – 不加入计算
[*]  Problem, if at least one child has a problem – 子项至少一个发生故障(一般用这个)
[*]  Problem, if all children have problems – 所有子项都发生故障,才加入计算
  Acceptable SLA (in %):可接受的可用率百分比,如果在大于这个百分比那么现实绿色,如果小于那么就是红色显示
  Trigger:触发器,可以选触发器也可以不选,不过大家要记住,可用率计算的就是这些触发器的可用率,如果没有触发器根本无法计算。最上级的可以不选触发器,子项一定记得选择触发器,否则就失去意义了。
  添加子service
http://s3.运维网.com/wyfs02/M02/58/B8/wKioL1S566TRX1TgAAGYuf0smYw165.jpg
http://s3.运维网.com/wyfs02/M02/58/BB/wKiom1S560Sjw3bnAAFoQ4pACC8551.jpg
  依赖标签
  这边我们不增加依赖,在后面我们专门来谈谈这个依赖
http://s3.运维网.com/wyfs02/M00/58/B8/wKioL1S57GyQLdtqAAEE4vg3xHs035.jpg
  Time这边如果默认,那么就是24×7
http://s3.运维网.com/wyfs02/M00/58/BB/wKiom1S57A-COxGbAAFUnMyoEII142.jpg
  Time说明
  Service times:定义好的工作时间
  New service time:一共有三个选项

[*]  Downtime – 在这个时间段,不计入SLA
[*]  One-time downtime – 在这个时间段,不计入SLA,指定一个时间(只有一次)
[*]  Uptime :工作时间,在这个时间内出现故障都计入SLA
  看看效果,monitoring–>IT services
http://s3.运维网.com/wyfs02/M00/58/BB/wKiom1S57MKxDYKiAAG96xx8uvA631.jpg
  IT Services依赖
  分为hard和soft依赖,例如我们增加一个C服务器,他需要依赖其他IT树下的services,首先它不能链接触发器,在依赖那边选择其他树下依赖即可,可以添加多个,软依赖是灰色的标识,硬件依赖则是直接把整个service挪过来。如果C服务器使用软依赖,那么可以直接删除C服务器Service,如果是硬依赖,需要先移除依赖,才能删除。
http://s3.运维网.com/wyfs02/M01/58/BB/wKiom1S57g-yjb62AAF6T4cgff8324.jpg
  soft不勾选,表示为硬依赖
http://s3.运维网.com/wyfs02/M01/58/B9/wKioL1S570HhSQnMAAFCYy717a4971.jpg
  如下,原本“测试”和“服务器在线率”在同一个层级,都归属于root,但是加了硬依赖之后,直接到了test3服务器之下了
http://s3.运维网.com/wyfs02/M02/58/BB/wKiom1S571PxVvV4AAJCuR9jods394.jpg
  接着来看看软依赖,勾选soft,就是软依赖了
http://s3.运维网.com/wyfs02/M00/58/B9/wKioL1S58Izx2_WPAAFC1gLa32Y994.jpg
  效果图如下:
http://s3.运维网.com/wyfs02/M00/58/BB/wKiom1S58NOwLHYTAAJ-DVUMm90234.jpg
  注:
  本文模型:http://www.ttlsa.com/zabbix/zabbix-it-services/

页: [1]
查看完整版本: zabbix学习(四)IT_Service管理