|
|
|
|
|
|
|
| 模板 | 监控项 | 触发报警条件 | 发送报警等级 |
|
| BASE-Window | ping值监测 | icmpping[{IPADDRESS},3,30,,100] | 服务器无法ping通 | 灾难报警 |
|
| cpu使用率 | perf_counter[\Processor(_Total)\% Processor Time] | CPU使用率大于95% CPU使用率大于99% | 严重报警 灾难报警 |
|
| c盘空闲空间 | vfs.fs.size[c:] |
| 只取值,无触发器,无报警 |
|
| d盘空闲空间 | vfs.fs.size[d:] |
| 只取值,无触发器,无报警 |
|
| 内存空闲率 | vm.memory.size[pfree] | 内存空闲内存小于5% 内存空闲内存小于1% | 严重报警 灾难报警 |
|
| 系统运行时间 | system.uptime | 系统刚重启 | 严重报警 |
|
| c盘空闲率 | vfs.fs.size[c:,pfree] | C盘剩余空间小于10% | 严重报警 |
|
| d盘空闲率 | vfs.fs.size[d:,pfree] | D盘剩余空间小于10% | 严重报警 |
|
| 磁盘繁忙率 | perf_counter[\PhysicalDisk(_Total)\% Idle Time] | 磁盘繁忙时间大于95% | 警告报警 |
|
| zabbix客户端取值 | status | zabbix取不到数据 | 警告报警(只发送给监控组人员) |
|
| 网卡in流量 | net.if.in[{IPADDRESS}] | 流量超过80M | 严重报警 |
|
| 网卡out流量 | net.if.out[{IPADDRESS}] |
| 只取值,无触发器,无报警 |
|
| 每秒出错页面数量 | perf_counter[\Memory\Page Faults/sec] |
| 只取值,无触发器,无报警 |
|
| 虚拟内存使用率 | perf_counter[\Paging File(_Total)\% Usage] |
| 只取值,无触发器,无报警 |
|
| c盘空间 | vfs.fs.size[c:,free] | C盘剩余空间小于2G | 灾难报警 |
|
| d盘空间 | vfs.fs.size[d:,free] | D盘剩余空间小于2G | 灾难报警 |
|
| 内存使用量 | vm.memoryUSED |
| 只取值,无触发器,无报警 |
|
| cpu空闲率 | perf_counter[\Processor(_Total)\% Idle Time] |
| 只取值,无触发器,无报警 |
|
| 线程数 | perf_counter[\System\threads] |
| 只取值,无触发器,无报警 |
|
| CPU负载监测 | perf_counter[\System\threads] |
| 只取值,无触发器,无报警 |
|
| CPU负载监测 | system.cpu.load[,avg5] |
| 只取值,无触发器,无报警 |
|
| 当前操作系统监测 | system.uname |
| 只取值,无触发器,无报警 |
|
| 内存使用量 | vm.memory.size.used |
| 只取值,无触发器,无报警 |
|
| c盘空间剩余 | vfs.fs.size[c:,used] | C盘剩余空间小于2G | 灾难报警 |
|
| d盘空间剩余 | vfs.fs.size[d:,used] | D盘剩余空间小于2G | 灾难报警 |
|
| 平均磁盘队列长度 | perf_counter[\PhysicalDisk(_Total)\Avg. Disk Queue Length] |
| 只取值,无触发器,无报警 |
|
| IO数据字节/秒 | perf_counter[\Process(_Total)\IO Data Bytes/sec] |
| 只取值,无触发器,无报警 |
|
| IO读字节/秒 | perf_counter[\Process(_Total)\IO Read Bytes/sec] |
| 只取值,无触发器,无报警 |
|
| IO写字节/秒 | perf_counter[\Process(_Total)\IO Write Bytes/sec] |
| 只取值,无触发器,无报警 |
|
| 页面读取时间 | perf_counter[\Memory\Pages/sec] |
| 只取值,无触发器,无报警 |
|
| CPU负载监测 | system.cpu.load[,avg15] | high load (8核心) cpu负载大于12,则判断负载过高 | 只取值,无触发器,无报警 |
|
| BASE-Linux | ping值监测 | icmpping[{IPADDRESS},3,30,,100] | 服务器无法ping通 | 灾难报警 |
|
| CPU利用率 | Combined_CPU_Utilization |
| 只取值,无触发器,无报警 |
|
| 根分区剩余空间 | vfs.fs.size[/,free] | 根分区剩余空间小于2G | 灾难报警 |
|
| 根分区空闲空间 | vfs.fs.size[/,pfree] | 根分区剩余空间小于5% 根分区剩余空间小于2G | 严重报警 灾难报警 |
|
| 分区空闲空间 | vfs.fs.size[/opt,pfree] |
| 只取值,无触发器,无报警 |
|
| cpu使用率 | system.cpu.util[,idle,avg1] | CPU使用率大于90% CPU使用率大于99% | 严重报警 灾难报警 |
|
| 系统重启 | system.uptime | 系统刚重启 | 严重报警 |
|
| zabbix客户端取值 | status | zabbix取不到数据 | 警告报警(只发送给监控组人员) |
|
| 系统密码更改 | vfs.file.cksum[/etc/passwd] | 系统密码有更改 | 发送警告报警 |
|
| 网卡in流量 | net.if.in[em1,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡in流量 | net.if.in[eth0,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡in流量 | net.if.in[eth1,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡in流量 | net.if.in[lo,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡out流量 | net.if.out[em1,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡out流量 | net.if.out[eth0,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡out流量 | net.if.out[eth1,bytes] |
| 只取值,无触发器,无报警 |
|
| 网卡out流量 | net.if.out[lo,bytes] |
| 只取值,无触发器,无报警 |
|
| 进程数监测 | proc.num[,,run] |
| 只取值,无触发器,无报警 |
|
| CPU负载监测 | system.cpu.load[,avg1] |
| 只取值,无触发器,无报警 |
|
| CPU负载监测 | system.cpu.load[,avg5] |
| 只取值,无触发器,无报警 |
|
| 当前操作系统信息监测 | system.uname |
| 只取值,无触发器,无报警 |
|
| 登录用户数监测 | system.users.num |
| 只取值,无触发器,无报警 |
|
| /boot磁盘空闲空间 | vfs.fs.size[/boot,pfree] |
| 只取值,无触发器,无报警 |
|
| 内存空闲百分比 | vm.memory.size[pfree] |
| 只取值,无触发器,无报警 |
|
| CPU负载监测 | system.cpu.load[,avg15] | high load(8核) cpu负载大于8,则判断负载过高 | 不发送报警 |
|
| BASE-IIS | 连接数值监测 | perf_counter[\Web Service(_Total)\Current Connections] | 链接数过高(超过3000) | 灾难报警 |
|
| ISAPI数值监测 | perf_counter[\Web Service(_Total)\Current ISAPI Extension Requests] | ISAPI大于500 ISAPI大于1000 | 严重报警 灾难报警 |
|
| IIS重启监测 | perf_counter[\web service(_total)\service uptime] | IIS刚重启 | 严重报警 |
|
| IIS运行状态监测 | service_state[W3SVC] | IIS未运行 | 严重报警 |
|
| Pool重启监测 | perf_counter[\ASP.NET\Application Restarts] | Application Pool Restart (Pool重启) | 警告报警 |
|
| 错误量监测 | perf_counter[\ASP.NET Applications(__Total__)\Errors Total] |
| 只取值,无触发器,无报警 |
|
| 应用程序吞吐量监测 | perf_counter[\ASP.NET Applications(__Total__)\Requests/Sec] |
| 只取值,无触发器,无报警 |
|
| 当前执行请求数监测 | perf_counter[\ASP.NET\Requests Current] |
| 只取值,无触发器,无报警 |
|
| 进程重启监测 | perf_counter[\ASP.NET\Worker Process Restarts] |
| 只取值,无触发器,无报警 |
|
| 匿名连接用户数监测 | perf_counter[\Web Service(_Total)\Current Anonymous Users] |
| 只取值,无触发器,无报警 |
|
| 非匿名连接用户数监测 | perf_counter[\Web Service(_Total)\Current NonAnonymous Users] |
| 只取值,无触发器,无报警 |
|
| 使用 GET 方法的 HTTP 请求数监测 | perf_counter[\Web Service(_Total)\Total Get Requests] |
| 只取值,无触发器,无报警 |
|
| 使用 HEAD 方法的 HTTP 请求数监测 | perf_counter[\Web Service(_Total)\Total Head Requests] |
| 只取值,无触发器,无报警 |
|
| 运行的应用程序 | perf_counter[\ASP.NET\Applications Running] |
| 只取值,无触发器,无报警 |
|
| 使用 Post 方法的 HTTP 请求数监测 | perf_counter[\Web Service(_Total)\Total Post Requests] |
| 只取值,无触发器,无报警 |
|
| SSL运行状态监测 | service_state[HTTPFilter] | {HOSTNAME}HTTP SSL Service Not Running 为ssl未启用 | 不发送报警 |
|
| IIS管理服务运行状态监测 | service_state[IISADMIN] | {HOSTNAME}IIS Admin Service Not Running 为iis管理服务没有启用 | 不发送报警 |
|
| PING | ping值监测 | icmpping[{IPADDRESS},3,30,,100] | 服务器无法ping通 | 灾难报警 |
|
| ping值时间 | icmppingsec[{IPADDRESS},3,,30,100] |
| 只取值,无触发器,无报警 |
|
|
|
|
|
|
|
|