lchl0388 发表于 2019-1-20 06:36:37

处理Zabbix历史数据库办法一

  一 问题描述
  随着Zabbix监控的主机和监控项目增多,Zabbix的历史数据会越来越多,MySQL数据库磁盘空间很容易就爆满,同时Zabbix前端查询数据会变得越来越慢。特别是通过Zabbix的API生成自定义Screen的情况下,打开每个Screen非常慢
  查看Zabbix数据库目录文件

# ls -lh|grep G
total 248G
-rw-rw---- 1 mysql mysql 4.7G May5 21:34 alerts.ibd
-rw-rw---- 1 mysql mysql 3.4G May5 21:34 events.ibd
-rw-rw---- 1 mysql mysql95G May5 21:34 history.ibd
-rw-rw---- 1 mysql mysql25G May5 21:34 history_text.ibd
-rw-rw---- 1 mysql mysql 112G May5 21:34 history_uint.ibd
-rw-rw---- 1 mysql mysql 2.9G May5 21:34 trends.ibd
-rw-rw---- 1 mysql mysql 4.3G May5 21:34 trends_uint.ibd  

  整个Zabbix数据库目录大小为248G,history和history_text以及history_uint几张表就占用了大部分磁盘空间
  

  

  二 解决办法
  如果不想保留太长时间的历史数据,例如只保留一个月的历史数据可以使用以下方法
  1.停掉zabbix server

  service zabbix-server stop
  

  这里需要特别注意一下,在部署Zabbix架构的时候最好选择Zabbix server ---- Zabbix proxy --- Zabbix --- agent的架构。即使只有几台主机最好也部署一个proxy,根据不同应用或者不同的机房可以部署多个proxy。部署zabbix有以下几个好处:
  proxy专门收集和暂存agent发来的数据,可以减轻server端的压力
  使用proxy可以实现分布式监控,例如监控不同网络互相不通的服务器

  增强安全性,不直接暴露zabbix server的信息

  维护的时候很方便,例如清理zabbix的历史数据,zabbix停掉后的监控数据可以设置在proxy端保留时间长些,等维护好后proxy会同步数据到server端,尽量减少数据丢失。
  

  
  

  在停掉zabbix server之前需要注意zabbix proxy的两个参数
  ProxyLocalBuffer=3
  设置zabbix proxy暂存在本地mysql的监控数据的时间。默认是0,不暂存。即使zabbix proxy已经把数据发送给了zabbix server,还是会暂存数据在本地设置的时间。取值范围是0~720小时

  

  ProxyOfflineBuffer=5
  设置当zabbix proxy与zabbix server无法连接时保留监控数据的时间间隔。默认是1小时,取值是1~720小时。这个参数特别有用,我就是在之前的几次维护中,停掉zabbix server后没有设置zabbix proxy的这个参数,所以当维护结束后启动zabbix server,会发现有段时间内的数据没有。这是因zabbix proxy按照默认的保留时间执行housekeeper把过期的数据删除了。

  这个时间根据最好根据要维护的时间来设定,比如要维护10个小时,那么就要设置ProxyOfflineBuffer=10
  这样就不至于这10个小时之间的数据都丢失了。也有一个问题,如果时间间隔太大的话,zabbix proxy重新推送数据到zabbix server会导致双方的服务器压力都会增大。
  

  

  

  

  

  

  

  2.创建新表
  create table history_new like history;

  create table history_uint_new like history_uint;
  create table history_text_new like history_text;
  

  3.将近期(一个月)的数据插入到新的表中
  insert into history_new select * from history where clock > '1459785600';
  insert into history_text_new SELECT * FROM history_text WHERE clock > '1461945600';
  insert into history_uint_new SELECT * FROM history_uint WHERE clock > '1461945600';
  

  这里的clock是UNIX时间戳
  

  

  这里根据数据量的大小可以能会花费好几个小时的时间
  

  

  

  4.重新更改表名
  alter table history rename history_old;
  alter table history_new renamehistory;
  

  alter table history_uint rename history_uint_old;
  alter table history_uint_new rename history_uint;
  

  alter table history_text renamehistory_text_old;
  alter table history_text_new renamehistory_text;
  

  5.重新启动zabbix server

  重新启动zabbix后,有段时间会不停地报zabbix agent不可用的报警信息,过段时间就会恢复正常。
  

  6.删除旧表
  drop table history_old;
  drop table history_text_old;
  drop table history_uint_old;
  


  另外可以更改items表的history字段
  UPDATE items SET history = '15' WHERE history > '30'
  

  这样就将每个item的history保留时间设置为15天。但是这样设置的话如果想看几个月之前的数据就看不到了。
  

  

  

  这种方法处理起来效率非常低,必须要停掉zabbix server,然后导入一个月内的数据到新的表,如果数据量很大会很花时间。
  

  




页: [1]
查看完整版本: 处理Zabbix历史数据库办法一