~]# yum install zabbix-2.4.6-1.el7.x86_64.rpm zabbix-server-2.4.6-1.el7.x86_64.rpm zabbix-server-mysql-2.4.6-1.el7.x86_64.rpm zabbix-agent-2.4.6-1.el7.x86_64.rpm zabbix-sender-2.4.6-1.el7.x86_64.rpm zabbix-web-2.4.6-1.el7.noarch.rpm zabbix-get-2.4.6-1.el7.x86_64.rpm zabbix-web-mysql-2.4.6-1.el7.noarch.rpm trousers-0.3.11.2-4.el7_1.x86_64.rpm
说明:CentOS 7.1安装zabbix-2.4.6-1.el7,其与trousers-0.3.11.2-3不兼容,需要升级trousers至0.3.11.2-4.el7_1。 创建数据库:
server和proxy的运行都依赖于数据库,agent则不需要。 以MySQL数据库为例:
shell> mysql -uroot -p
mysql> create database zabbix character set utf8 collate utf8_bin;
mysql> grant all privileges on zabbix.* to zabbix@localhost> mysql> quit;
shell> mysql -uzabbix -p network < database/mysql/schema.sql
# stop here if you are creating database for Zabbix proxy
shell> mysql -uzabbix -p network < database/mysql/images.sql
shell> mysql -uzabbix -p network< database/mysql/data.sql 配置zabbix:
(1) zabbix_server
server的配置文件为zabbix_server.conf,至少应该为其配置数据库等相关的信息;
例如:
LogFile=/var/log/zabbix/zabbix_server.log
LogFileSize=0
PidFile=/var/run/zabbix/zabbix_server.pid
DBHost=192.168.0.189
DBName=zabbix
DBUser=zbxuser
DBPassword=zbxpass
DBSocket=/var/lib/mysql/mysql.sock
SNMPTrapperFile=/var/log/snmptt/snmptt.log
AlertScriptsPath=/usr/lib/zabbix/alertscripts
ExternalScripts=/usr/lib/zabbix/externalscripts
(2) 配置php环境
编辑/etc/httpd/conf.d/zabbix.conf,添加如下项。
php_value date.timezone Asia/Shanghai
启动httpd服务:systemctl start httpd.service
访问zabbix web
http://your_host/zabbix
登录:Admin/zabbix
(3) 配置zabbix_agent
agent的配置文件为zaabix_agentd.conf,至少应该为其指定server的IP地址;
https://www.zabbix.com/documentation/2.4/manual/config/items/itemtypes/zabbix_agent
各key的获取位置 源码安装:
下载地址:http://www.zabbix.com/download.php
# tar -zxvf zabbix-2.0.0.tar.gz
创建用户:
# groupadd network
# useradd -g network zabbix
注意:同时安装了server和agent的节点上,建议其运行用户不要相同。 创建数据库:
server和proxy的运行都依赖于数据库,agent则不需要。 以MySQL数据库为例:
mysql> CREATE DATABASE zabbix CHARACTER SET utf8 COLLATE utf8_bin;
mysql> GRANT ALL ON zabbix.* TO zbuser@'%'> # 请按需要修改用户名和密码;
shell> mysql -u -p network < database/mysql/schema.sql
# 如果仅为proxy创建数据库,只导入schema.sql即可;否则,请继续下面的步骤;
shell> mysql -u -p network< database/mysql/images.sql
shell> mysql -u -p network < database/mysql/data.sql 编译安装zabbix:
图二六:windows性能监视器
Zabbix可以通过相关参数直接获取windows系统的监控值并以图形的方式呈现。下面列出一些常见的windows监控参数。
Combined CPU Utilization % CPU利用率
Physical Disk Percent> Paging File % Usage 虚拟内存利用率
Average Read Transfer Time to Disk _Total 磁盘平均读周期
Average Write Transfer Time to Disk _Total 磁盘平均写周期
IIS Current Connections IIS当前连接数
ASP.Net Requests/Sec .NET请求数
SQL: Number of Connections SQL连接数
SQL: % Processor Time SQL的CPU利用率
SQL: Number Failed Jobs SQL失败的作业数 2.5 菜单栏介绍
2.4.1一级菜单栏 “监控”Monitoring项(图三)提供监控设备的详细数据,共十项二级菜单,包括:“仪表盘”项Dashboard、“总览”项Overview、WEB项、“最新数据”项Latest data、“触发器”项Triggers、“事件”项Events、“图形”项Graphs、“多图显示”项Screen、“拓扑图”项Maps、IT Services项。
图四:Inventory菜单
2.5.3一级菜单栏Reports“报告”项(图五)主要提供被监控设备的性能报告(较少使用)。二级菜单包括“可用性报告”Avaliablity report、“前100个触发数据”Triggers top 100、“柱形图”Bar reports。
图五:Reports菜单 2.6 Zabbix常用功能介绍 2.6.1 设备故障事件详情
登入zabbix后首先进入“maps”项查看整体网络的状况,存在问题的服务器会显示警告状态(如图六所示)。点击该问题服务器后在弹出的菜单中选择“status of triggers”可查看该问题的具体描述(如图七所示),在图七中详细记录了问题服务器的主机名称、问题等级、问题的持续时间等状态,其中名称项“name”中记录了触发问题的原因,点击该栏会弹出触发器的菜单项,其中的图形“graph”项中以图形方式显示数据(如图八所示)。本例中服务器故障的触发原因是“Low Percent free disk space on 192.168.0.58 volume c:”C盘空间不足,还可以通过图形项“graph”中找到该服务器显示C盘占用空间(如图九所示),需要注意的是要选择正确的组“group”和主机“host”及显示的图形“C:Used Disk Space Pie Graph”。
图二十三:时间说明图
除了上面几种方式查看图表外,也可以直接选定相应的曲线查看详细的数据图,如图二十三。上图中第2处即为手工选定方式查看数据,其中图中灰色部份(标识1)表示下班时间,白色部份表示上班时间(周一至周五,8:30至17:30)。 2.6.5 常见图形“Graph”的说明
当选中主机所有的组“group”和相应的主机“host”后,就需选择和该主机相关的显示图形,常用的性能监控图有以下几种。 C: Used Disk Space Pie Graph
C盘可用空间图,记录C盘整体空间大小和已使用空间的详细值和占用百分比,当C盘的可用空间低于整个C盘的5%时会触发“C盘可用空间不足5%的报警,如图十所示。
图十四:内存空间图 Read/Write Disk Response Time
磁盘读/写响应时间,记录物理磁盘的读响应时间“PhysicalDisk(_Total)\Avg. Disk sec/Read”以及写响应时间“PhysicalDisk(_Total)\Avg. Disk sec/Write”。其中在10分钟内如果磁盘读操作时间超过30ms或写操作时间超过50ms将触发报警提示。如图十五所示。
图二七:availability图
可用性“Availability”项主要记录内存和磁盘的可用性共包含9项内容,分别是:
Free disk space on c: C盘可用空间
Free disk space on d: D盘可用空间
Free memory 可用内存空间
Memory Commit Limit (RAM plus Page File) 内存可用数(包括虚拟内存)
Percent Free disk space on c: C盘可用空间百分比
Percent Free disk space on d: D盘可用空间百分比
Total disk space on c: C盘容量
Total disk space on d: D盘容量
Total memory 内存大小 3.1.2 CPU
CPU项(如图二八所示)主要记录CPU的性能及CPU的使用情况共包含6项内容:
图二八:CPU图
Combined CPU Utilization % CPU处理非闲置进程的百分比
CPU Count CPU内核数量(个数*核*线程数)
CPU Utillization CPU利用率
Processor load CPU负载(一分钟)
Processor load15 CPU负载(十五分钟)
Processor load5 CPU负载(五分钟) 3.1.3 磁盘“DISK”
DISK项(如图二九所示)记录磁盘的性能,包括磁盘的读、写、队列的传输及空闲使用等指标,共包含5项内容:
图二九:DISK图
Average Read Transfer Time to Disk _Total 磁盘平均读响应时间
Average Write Transfer Time to Disk _Total 磁盘平均写响应时间
Avg. Combined(Read/Write) Transfer Operation to Disk 磁盘读写响应时间
Physical Disk Avg. Queue Length 磁盘平均数据队列响应
Physical Disk Percent> 3.1.4 文件系统“Filesystem”
Filesystem项(如图三十所示)记录磁盘文件传输时队列的磁盘传输时间,共2项内容:
图三十:Filesystem图
Average disk read queue length 磁盘队列读周期(平均)
Average disk write queue length 磁盘队列写周期(平均) 3.1.5 通用“General”、内存“Memory”、操作系统“OS”
General项记录主机的开机时间,而Memory项主要记录虚拟内存的利用率,OS记录主机的线程数量(如图三一所示),共3项内容:
图三一:Memory、General、OS图
Host uptime (in sec) 主机已运行时间
Paging File % Usage 虚拟内存利用率
Number of threads 主机上运行的线程数量 3.1.6 网络“Network”
Network项(如图三二)记录主机网卡的流量,包括两个方向(IN、OUT),共2项内容:
图三三:Performance图
Average disk read queue length 读取请求(磁盘在实例间隔中列队的)的平均数
Physical Disk Avg. Queue Length 磁盘上平均的请求数量
Physical Disk Current Queue Length 磁盘上当前的请求数量 3.1.8 IIS
IIS项(图三四)记录IIS及WEB相关的性能值,包括服务的状态和相关的性能点,共9项内容:
图三四:IIS图
HTTP SSL: Service State SSL服务状态
IIS Admin: Service State IIS Admin服务状态
IIS Current Anonymous Users 当前IIS匿名访问用户数
IIS Current Connections IIS当前连接数
IIS Current NonAnonymous Users IIS当前非匿名用户数
IIS Get Requests/s IIS Get请求数/秒
IIS Head Requests/s IIS Head请求数/秒
IIS Post Requests/s IIS Post请求数/秒
Microsoft IIS: Service State IIS服务状态 3.1.9 MSSQL
MSSQL项(图三五)记录microsoft SQL数据库的性能,包括服务状态及相关性能值,共15项内容:
图三五:MSSQL图
SQL: Buffer cache hit ratio SQL缓冲管理器/缓冲命中率
SQL: Data File> SQL: Database Pages SQL缓冲管理器/数据库页
SQL: Full Tables Scans/sec SQL访问方法/完全访问/秒
SQL: Lazy writes/sec SQL缓冲管理器/惰性写入/秒
SQL: Lock Waits per second SQL锁等待/秒
SQL: Log File> SQL: Number Failed Jobs 失败的作业数
SQL: Number of Connections 当前的SQL连接数
SQL: Number of Deadlocks per second SQL每秒死锁数
SQL: Service State - SQL Server SQL服务状态
SQL: SQLServer Buffer Manager Total pages SQL缓冲管理器/全部页
SQL: Target Server Memory SQL目标服务器内存
SQL: Total Server Memory SQL总的服务器内存
SQL: Transactions per second SQL每秒大容量复制的数据量 3.2 报表功能Reports
在zabbix中关于报表的功能有三项:
Avaliability report:(图三六)整个系统可用的系统报表提供过滤功能。
图三六:avaliability report图
Most busy triggers top 100:(图三七)提供最常用的triggers 预览。
图三七:triggers top 100图
Bar report :(图三八)可定制报表可以报多个报表整合到一起。