还有其他的一些配置项,通常情况下不需要修改,其含义如下:
Collection_group section:
collect_once – Specifies that the group of static metrics
collect_every – Collection interval (only valid for non-static)
time_threshold – Max data send interval
Metric section:
Name – Metric name (see “gmond –m”)
Value_threshold – Metric variance threshold (send if exceeded)
cd /home/admin
tar -xvf apr-1.4.*.gz
cd apr*
./configure --prefix=/usr/local/apr
make
make install
cd ..
tar -xvf apr-util-1.3.9.*
cd apr-util*
./configure --with-apr=/usr/local/apr
make
make install
cd ..
rpm -ivh libconfuse-2.5-4.el5.x86_64.rpm
rpm -ivh libconfuse-devel-2.5-4.el5.x86_64.rpm
tar -xvf ganglia-3.1.*.gz
cd ganglia*
cp /usr/local/apr/bin/apr-1* /usr/local/bin/
./configure --with-apr=/usr/local/apr
find / -name "libpython2.5*"
cp /usr/local/lib/libpython2.5.so /usr/lib/libpython2.5.so
make
make install
cd ..
rpm -ivh ganglia-devel-3.1.1-1.x86_64.rpm --nodeps
cd /etc
mkdir ganglia
cp /home/admin/*.conf /etc/ganglia/
cd /etc/ganglia
vi gmond.conf ;edit udp send and recv host.
vi /usr/local/etc/gmond.conf
gmond --debug=10
ps -e|grep gmond
kill -9 id
gmond
如果必要需要重新修改gmond.conf
scp test 10.250.13.42:~/
scp test 10.250.13.43:~/
scp test 10.250.13.44:~/
scp test 10.250.13.45:~/
vi /etc/profile
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:"/usr/local/lib64/"
source /etc/profile
问题及解决
1.安装问题
◎缺少库文件,通常在make过程中出现该错误,ld找不到对应的库比如libpython2.5.so
解决方法:find命令查找这两个文件,并ln –s 创建指向这两个文件的软链接引用。find / -name libpython*
◎如果安装过程中出现依赖错误,通常在configure时出现
解决方法:首先利用find查找,如果找到可以阅读readme,查看是否有参数支持指明该路径。不行考虑拷贝到默认目录,还是不行则可以加入参数—nodeps,然后download该lib,通常包含在其devel包里,需要去网上查找包含该lib的文件,然后安装。
2.配置及运行问题
◎测试gmond和gmetad是否运行成功
Telent localhost 8649
Telent localhost 8651
如果没有反应
解决方法:很可能是因为服务没有启动,或者使用的不是默认端口,ps –e|grep gmond,查找服务是否启动。查看gmond.conf看所使用的tcp recv端口。
还找不到原因,就可以用调试模式启动查看原因
gmond –debug=10
如果出现udp之类的端口绑定错误,比如是已被bind,则查看是否有端口已被利用 lsof –i:port。
还可能是配置文件配置不正确,比如我曾经将udp_recv_channel的host修改成与udp_send_channel相同的值,就发生了端口错误,udp_recv_channel的host必须是本机的ip(一个机子可能有多个ip)。如果是权限禁止,则考虑当前用户身份,或者换成root试下。
测试php前端支持是否成功
http://localhost/ganglia
◎php页面显示为文件或者提示下载文件
解决方法:说明apache的php模块没有安装配置好。使用yum install 或者重新下载安装php模块,并在apache的conf文件里配置好。
◎显示页面无图象展示
首先检查selinux是否关闭
然后查看conf.php文件里的rrdtool路径是否正确,该文件是否存在,注意该路径是rrdtool可执行文件的路径不是其安装目录。
然后查看/var/lib/ganglia/rrds是否存在,能否被写。chown nobody:nobody /var/lib/ganglia/rrds # make sure RRDTool can write here.
查看php.conf里的gmetad的路径地址端口是否正确。
tar xzf nagios-3.0.6.tar.gz
cd nagios-3.0.6.tar.gz
运行Nagios配置脚本并使用先前开设的用户及用户组:
./configure --with-command-group=nagcmd
编译Nagios程序包源码
make all -j8
make install
make install-init
make install-config
make install-commandmode
make install-webconf #安装Nagios的WEB配置文件到Apache的conf.d目录下
4。 安装Nagios plugin
./configure --with-nagios-user=nagios --with-nagios-group=nagios -prefix=/usr/local/nagios
make -j8
make install
5。 基本配置
配置文件默认位置/usr/local/nagios/etc,只需要做简单修改就可以体验到Nagios啦。
修改/usr/local/nagios/etc/objects/contacts.cfg,更改email地址nagiosadmin 的联系人定义信息中的EMail信息为你的EMail信息以接收报警内容.(确认你的系统可以发送邮件到相应的接收者)
6。 配置Web接口
创建一个nagiosadmin 的用户用于Nagios的WEB接口登录。记下你所设置的登录口令,一会儿你会用到它。
htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
重启Apache服务以使设置生效。
service httpd restart
7。 启动Nagios
chkconfig --add nagios
chkconfig nagios on
service nagios start
这是你可以访问http://localhost/nagios,就可以看到Nagios啦哈哈。