|
转载自:http://littlexiang.me/architecture/7.html
扩展性/性能/高可用
gearman大概每秒可以接收4k个任务, 单台的能力都是足够了,配置成LVS backup-backup模式切换. 任务通过gearman的扩展写入mysql持久化, 后端的mysql也是Master-Master+LVS切换, 杜绝单点.
pull的性能可以通过单组多slave和多组分布+2次mapreduce扩展
push的性能可以通过增加worker机和inbox的redis实例提高.
个人feed的redis需要持久化, 每个节点都有3台: 主->备->持久, 通过LVS切换, 主和备都是纯内存, 持久机不参与工作,只负责写aof.
inbox缓存的redis全部都是纯内存, 可以有多台互相作为备机.
worker管理/健康检查
一开始是用pcntl接管了kill信号, 保证不会在任务进行中被kill掉, 不过strace发现有很多system call比较浪费, 于是改成从数据库读信号.worker做完一个任务后去数据库更新状态, 然后检查kill信号并记log.
start/stop/restart都统一由Manager脚本控制, 除非挂了, 正常情况下不许直接kill. Manager还带有watch功能, 每分钟检查一次所有进程的状态.
Monitor脚本循环跑一个空任务, 做一个sleep一会新增一个, 检查gearman server的状态.
吐槽
尼马gearman 1.1.4是坑爹的啊!mysql断了不会重连, 编译drizzle怎么也搞不上, 换0.41啥事都没有啊!
尼马php的gearman client是坑爹的啊! addServers两台有一台挂了直接就连不上啊!说好的自动failover呢!
尼马php的redis扩展是坑爹的啊!没有连接池吃CPU又高, 这是闹那样啊!
虽然php5.3换5.4性能有很大提高, 不过还是准备改写成python的, 毕竟后台worker嘛... |
|
|