cgroup+supervistor隔离守护php
又开始讲故事了,前言部分,喝着茶水看着报纸,然后手机嗡嗡作响,不用想肯定不是美女求助,尼玛坑爹的报警。看了下原因,由于多个小业务混跑,一个业务由于数据库读写问题导致整个php池被打满。然后所有的小业务都半死。。。 数据库读写的问题暂且不论,毕竟不是专业dba,就环境隔离搞了cgroup+supervistor。期间遇到了些问题,值得有些同学借鉴。
######################################################
cgroup 与 supervistor详细介绍省略。
为啥是这个组合:cgroup做资源隔离。supervistor做服务守护。为啥在一起,因为缘分。。。 因为一个参数的原因,下面会揭晓。
首先安装:
yum install libcgroup bcgroup-tools
yum install supervisor
如果yum源里没有,就配置个epel源 或者 阿里源参照这个
然后说配置:
cgroup:
/etc/cgconfig.conf
group SIXTY { #组名
cpu { #子系统有哪些子系统可做隔离 参照命令 # lssubsys
cpu.shares = 6000; #cpu配额,单独配置无效,需要与其他组配额一起生效。例如本次配置share有 6000,3000,1000三个档位,分别用于不用的服务池资源。这里6000占用系统cpu的60%,或者理解为60%的cpu计算资源,当其他组占用少时可以更多的占用,竞争出现才有限制效果。
#cpu.cfs_quota_us =200000; #cpu基于cfs算法的配额时间片,例如周期起100000,时间片为200000那么可以同时占用2个cpu周期。这两个配合使用,可以限制cpu计算资源的绝对值,而share是相对值
#cpu.cfs_period_us = 100000; #单核cpu的时间周期
}
memory {
memory.soft_limit_in_bytes=10G; #内存软限制
memory.limit_in_bytes=20G; #内存硬限制
memory.swappiness=0; #是否交换
memory.oom_control=0; #到达内存硬限制是否oom kill,0表示kill,1表示等待内存释放,期间其他进程阻塞。在组内的表现为夯住。 这就是上面说的缘分参数,设置了oom kill,又要保证服务只能引入守护。
}
}
group THIRTY {
cpu {
cpu.shares = 3000;
}
memory {
memory.soft_limit_in_bytes=5G;
memory.limit_in_bytes=10G;
memory.swappiness=0;
memory.oom_control=0;
}
}
group TEN {
cpu {
cpu.shares = 1000;
}
memory {
memory.soft_limit_in_bytes=1G;
memory.limit_in_bytes=2G;
memory.swappiness=0;
memory.oom_control=0;
}
} supervistor配置:
/etc/supervisord.d/php-fpm.ini
directory=/var/supervisord/
stdout_logfile=/var/supervisord/php-fpm.log
command=/etc/init.d/php-fpm start #脚本启动
#command= /usr/local/sbin/php-fpm--fpm-config /etc/php-fpm9000.conf --pid /var/run/php-fpm9000.pid #命令启动 跟脚本启动有区别
autostart=true #随supervistor自动启动
autorestart=true #服务挂了释放重启服务
startsecs=5 #启动成功判断周期
priority=1 #启动优先级低者优先
user=root
#stopasgroup=true
killasgroup=true #重启的时是否kill被守护进程的子进程,如果不,这些进程会变成孤儿进程被init接管。例如守护php-fpm,其实只是守护master进程。如果退出不kill 子进程,会出现重启失败的问题。
stdout_logfile_maxbytes=20MB
stdout_logfile_backups=20 php-fpm启动命令 或者脚本修改,不能后台deam运行:
php-fpm.conf 中 daemonize = no必须是no
如果命令启动不能用 --daemonizesupervistor的cmd可以配置为:/usr/local/sbin/php-fpm--fpm-config /etc/php-fpm9000.conf --pid /var/run/php-fpm9000.pid
脚本启动需要修改启动命令为:
cgexec -g memory:GROUP1 -g cpu:GROUP1 exec $php_fpm_BIN $php_opts
#exec $php_fpm_BIN $php_opts
#$php_fpm_BIN --daemonize $php_opts 注意exec 这个是必须的,最下面的详解中不用exec启动的现象,欢迎尝试,至于为什么请大家看下exec运行命令的特点,欢迎留言区讨论哈。
不能用守护进程启动的原因:
deamonize参数,表示master进程以守护进程启动。根据supervistor的文档:被守护的进程(php-fpm),不能以守护进程(deamon)的形式运行。这是由于守护进程通常在fork子进程后会终结父进程,也就是supervistor创建的父进程退出,此时,supervistor无法再健康已经退出的进程fork的子进程。关于deamon,可以参考Linux Daemon Writing HOWTO。
配置说完,就是启动了:
service cgconfig restart
service cgred restart
service supervisord start
当然 还会涉及php分池的问题,也就是启动多个php-fpm master监听多个端口,然后就是修改nginx配置, 这应该都不是事。所以我也懒得写啦 理解下哈。
######################################################
然后说下其中遇到的一些问题:
查看status,退出太快了。。:
php-fpm FATAL Exited too quickly (process log may have details)
supervistor重启php-fpm报错 异常终止:
php-fpm:ERROR (abnormal termination)
http://s1.运维网.com/images/20180705/1530804198514135.png
原因:
exit quickly是由于脚本启动,使用--deamon参数。启动后直接退出导致pid存在。在supervistor的包活周期内检测到退出然后报错。
restart 发现php-fpm未正常退出,也就是上面说的deamon的问题。注意这里master进程的PPID是1 父进程也就是脚本已经退出。
解决办法:
最上面已经说了不使用--deamon 然后脚本启动要使用exec
supervistor 的killasgroup 参数可以kill被守护进程的子进程,但是子进程的子进程是无能为力的
######################################################
然后是cgroup的一些实验 以及一些其他截图
一个申请内存的简单的程序:
#vimoom.c
#include
#include
#include
int main(int argc, char **argv)
{
int max = -1;
int mb = 0;
char *buffer;
int i;
#define SIZE 100
unsigned int *p = malloc(1024 * 1024 * SIZE);
printf("malloc buffer: %p\n", p);
for (i = 0; i < 1024 * 1024 * (SIZE/sizeof(int)); i++) {
p = 123;
if ((i & 0xFFFFF) == 0) {
printf("%dMB written\n", i >> 18);
usleep(100000);
}
}
pause();
return 0;
} 注意编译下:
gcc oom.c
然后运行就是这样的了:
申请占用100M内存
http://s1.运维网.com/images/20180705/1530803692108740.png
修改了下程序中size然后编译 能够申请500M
http://s1.运维网.com/images/20180705/1530804792369149.png
简单的cgroup隔离了下内存 这里申请内存失败 然后夯住了 也就是上面说到的oom kill是否开启的问题。如果不开启这里不能进行操作。完全夯死。
http://s1.运维网.com/images/20180705/1530804834719685.png
这是share2000:1000的对比图
http://s1.运维网.com/images/20180705/1530805007628251.png
这是php启动脚本中修改后命令:
http://s1.运维网.com/images/20180705/1530805100965384.png
最后是已经搞定的图,重启是好用的:
http://s1.运维网.com/images/20180705/1530805138163319.png
####################################################
感谢看到最后,打铁到24:00 我要去补觉 !!!!!!!!!!!
页:
[1]