|
一. 准备阶段:1.实验环境包含3台主机,详细信息如下主机名操作系统IP作用nagios-serverredhat 9192.168.0.111监控机dbpiredhat 9192.168.0.100被监控机yahoonxp192.168.0.28被监控机注:监控机:安装了nagios软件的机器,对监控的数据做处理,并且提供web界面查看和管理.当然也可以对本机自身的信息进行监控.被监控机:安装了NRPE等客户端,根据监控机的请求执行监控,然后将结果回传给监控机. 2.nagios原理这里引用某位仁兄的话nagios的功能是监控服务和主机,但是他自身并不包括这部分功能的代码,所有的监控、检测功能都是有插件来完成的。再说报警功能,如果监控系统发现问题不能报警那就没有意义了,所以报警也是nagios很重要的功能之一。但是,同样的,nagios自身也没有报警部分的代码,甚至没有插件,而是交给用户或者其他相关开源项目组去完成。nagios安装,是指基本平台,也就是nagios软件包的安装。它是监控体系的框架,也是所有监控的基础。 打开nagios官方的文档,会发现nagios基本上没有什么依赖包,只要求系统是linux或者其他nagios支持的系统。不过如果你没有安装apache(http服务),那么你就没有那么直观的界面来查看监控信息了,所以apache姑且算是一个前提条件。关于apache的安装,网上有很多,照着安装就是了。安装之后要检查一下是否可以正常工作。原文链接http://blog.iyunv.com/u/28387/showart_356060.html 3.Nagios定义的监控状态nagios定义了4中监控状态,代表不同的严重级别,除了OK代表正常不用关心外,其余3种都要引起重视.如下表状态代码颜色正常OK绿色,警告WARNING黄色,严重CRITICAL红色,未知错误UNKOWN深黄色 4.所用软件nagios-2.9.tar.gznagios-plugins-1.4.9.tar.gznrpe-2.8.1.tar.gzNSClient++-0.2.7.zip注:前三个的下载地址:http://www.nagios.org,后一个的http://sourceforge.net/projects/nscplus 5.总体目标学习嘛,总要有个目标,很简单,就是看到下面这张图
具体信息如下表主机名要监控的服务nagios-server是否活动是否开启ftp磁盘使用情况dbpi是否活动是否开启ssh磁盘使用情况cpu负载swap分区使用情况主进程数当前登陆用户僵尸进程数yahoon是否活动是否开启80端口是否启动W3SVC服务cpu负载内存使用情况运行时间NSClient客户端版本(NSClient是一个windows下的nagios客户端)C盘使用情况D盘使用情况explorer进程运行情况 其中蓝色字体的服务是外部服务,也就是说不需要登陆被监控机,直接在外部就可以进行检查.例如我们需要检查被监控机是否打开80端口,就可以在别的一台机器上telnet被监控机的80端口即可.绿色字体表示是内部服务,意思是必须登陆到被监控机上才能查看.因为它们属于”本地信息”(nagios将之称为LOCAL).很容易理解,你不登陆到被监控机上,如何知道当前磁盘的使用情况呢? nagios是不是很强大,基本上对监控对象的任何信息都可以一手掌握了.而且不用登陆到目的机就可以看到那台机器私密的”本地信息”,比木马还厉害啊.但是别误会,这可不是什么木马.nagios有着十分安全的措施. 这确实是一个庞大的工程,你想想这还只是三台机器而已都已经监控这么多服务了,那要是多个几十台怎么办,不用紧张,从现在开始,跟我动手吧.家庭作业,将所用的软件下载好,配置好监控机192.168.0.111上的apache. |
|
|