江湖浪人 发表于 2017-4-19 09:12:27

zookeeper 集群不可用小结

今天遇到一个问题,zookeeper集群有5台机器,其中有一台由于硬件故障挂掉了,结果整个集群都不可用。

后来查了一下原因原来是syncLimit配置为5,这个配置表示sync的timeout有5个tick,tickTime我们配置的2000ms,那么就是10S,看了一下zk的data数据有200MB,在10S内其实不一定能同步完成,每次zk选举都会同步data,由于syncLimit设置的太短,失败之后再次重新选举,然后再次超时,导致集群不可用

解决方案很简单,调大syncLimit.
页: [1]
查看完整版本: zookeeper 集群不可用小结