设为首页 收藏本站
查看: 1677|回复: 0

[经验分享] redis3.2.5 分布式集群安装+错误解决过程

[复制链接]

尚未签到

发表于 2018-11-4 11:58:42 | 显示全部楼层 |阅读模式
redis3.2.5 分布式集群安装详细步骤
  --(centos5.X-6.X _X64系统)
  版本历史
  时间
  版本
  说明
  编写者
  2015-06-5
  1.0
  redis3.0.2 分布式集群安装详细步骤
  崔四超
  2016-11-25
  1.1
  redis3.2.5 分布式集群安装详细步骤
  崔四超
一: redis cluster介绍篇
1:redis cluster的现状
  目前redis支持的cluster特性(已亲测):
  1):节点自动发现
  2):slave->master 选举,集群容错
  3):Hot resharding:在线分片
  4):集群管理:cluster xxx
  5):基于配置(nodes-port.conf)的集群管理
  6):ASK 转向/MOVED 转向机制.
2:redis cluster 架构
  架构细节:
  (1)所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽.
  (2)节点的fail是通过集群中超过半数的节点检测失效时才生效.
  (3)客户端与redis节点直连,不需要中间proxy层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可
  (4)redis-cluster把所有的物理节点映射到[0-16383]slot上,cluster 负责维护nodeslotvalue
  2) redis-cluster选举:容错
  (1)领着选举过程是集群中所有master参与,如果半数以上master节点与master节点通信超过(cluster-node-timeout),认为当前master节点挂掉.
  (2):什么时候整个集群不可用(cluster_state:fail),当集群不可用时,所有对集群的操作做都不可用,收到((error)CLUSTERDOWN The cluster is down)错误
  a:如果集群任意master挂掉,且当前master没有slave.集群进入fail状态,也可以理解成集群的slot映射[0-16383]不完成时进入fail状态.
  b:如果集群超过半数以上master挂掉,无论是否有slave集群进入fail状态.
二.Redis集群安装篇(centosX64系统)
  (要让集群正常工作至少需要3个主节点,在这里我们要创建6个redis节点,其中三个为主节点,三个为从节点,对应的redis节点的ip和端口对应关系如下)
  127.0.0.1:7001
  127.0.0.1:7002
  127.0.0.1:7003
  127.0.0.1:7004
  127.0.0.1:7005
  127.0.0.1:7006
1:下载redis。
  官网下载3.2.5版本,之前2.几的版本不支持集群模式
  下载地址:http://download.redis.io/releases/redis-3.2.5.tar.gz
  目前最新版本为:redis-3.2.5.tar.gz
2:上传服务器,解压,编译
  tar -xvzf redis-3.2.5.tar.gz
  cd redis-3.2.5
  make
  make install
3:创建集群需要的目录
  mkdir -p /usr/local/cluster
  cd /usr/local/cluster
  mkdir 7001
  mkdir 7002
  mkdir 7003
  mkdir 7004
  mkdir 7005
  mkdir 7006
4:修改配置文件redis.conf
  cp /usr/local/redis3.2.5/redis.conf  /usr.local/cluster
  vi redis.conf
  ##修改配置文件中的下面选项
  port 7001
  daemonize yes
  cluster-enabled yes
  cluster-config-file nodes.conf
  cluster-node-timeout 5000
  appendonly yes
  ##修改完redis.conf配置文件中的这些配置项之后把这个配置文件分别拷贝到7001/7002/7003/7004/7005/7006目录下面
  cp/usr/local/cluster/redis.conf /usr/local/cluster/7001
  cp/usr/local/cluster/redis.conf /usr/local/cluster/7002
  cp /usr/local/cluster/redis.conf/usr/local/cluster/7003
  cp/usr/local/cluster/redis.conf /usr/local/cluster/7004
  cp/usr/local/cluster/redis.conf /usr/local/cluster/7005
  cp/usr/local/cluster/redis.conf /usr/local/cluster/7006
  ##注意:拷贝完成之后要修改7002/7003/7004/7005/7006目录下面redis.conf文件中的port参数,分别改为对应的文件夹的名称
5:分别启动这6个redis实例
  cd /usr/local/cluster/7001
  redis-server redis.conf
  cd /usr/local/cluster/7002
  redis-server redis.conf
  cd /usr/local/cluster/7003
  redis-server redis.conf
  cd /usr/local/cluster/7004
  redis-server redis.conf
  cd /usr/local/cluster/7005
  redis-server redis.conf
  cd /usr/local/cluster/7006
  redis-server redis.conf
  ##启动之后使用命令查看redis的启动情况ps -ef|grep redis
  如下显示则说明启动成功
  # ps -ef|grep redis
  root     13703    1  0 10:03 ?        00:00:00 redis-server *:7001 [cluster]
  root     14015    1  0 10:04 ?        00:00:00 redis-server *:7003 [cluster]
  root     14133    1  0 10:04 ?        00:00:00 redis-server *:7004 [cluster]
  root     14172    1  0 10:04 ?        00:00:00 redis-server *:7005 [cluster]
  root     14187    1  0 10:04 ?        00:00:00 redis-server *:7006 [cluster]
  root     14323    1  0 10:04 ?        00:00:00 redis-server *:7002 [cluster]
6.升级ruby 安装gem
  安装gem 需要ruby的版本在 1.8.7 以上,默认的centos5 上都是1.8.5 版本,所以首先你的升级你的ruby ,
  rpm -ivh http://yum.puppetlabs.com/el/5/products/x86_64/puppetlabs-release-5-6.noarch.rpm
  yum install  -y   ruby ruby-devel rubygems rpm-build
  检查 ruby 版本:
  #ruby  -v
  ruby 1.8.7 (2013-06-27patchlevel 374) [x86_64-linux]
  是否安装rubygems:
  # rpm -qa|grep ruby
  ruby-rdoc-1.8.7.374-2.el5
  ruby-1.8.7.374-2.el5
  ruby-devel-1.8.7.374-2.el5
  ruby-devel-1.8.7.374-2.el5
  ruby-mode-1.8.5-24.el5
  ruby-irb-1.8.7.374-2.el5
  ruby-libs-1.8.7.374-2.el5
  ruby-libs-1.8.7.374-2.el5
  rubygems-1.3.7-1.el5
7.gem 安装redis ruby 接口
  geminstall redis (安装的redis 驱动版本为3.3.2 ,执行redis-trib.rb  create --replicas XXX  后期会报错,后面会提到解决方法)
8:执行redis的创建集群命令创建集群
  #redis-trib.rb的create子命令构建
  #--replicas 则指定了为Redis Cluster中的每个Master节点配备几个Slave节点
  #节点角色由顺序决定,先master之后是slave
创建方式:
  cd /usr/local/redis3.0/src
  ./redis-trib.rb  create --replicas 1 127.0.0.1:7001 127.0.0.1:7002127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006
##错误笔记备注:
  8.1执行上面的命令的时候会报错,因为是执行的ruby的脚本,需要ruby的环境
  错误内容:/usr/bin/env: ruby: No such file or directory
  所以需要安装ruby的环境,这里推荐使用yum install ruby安装
  yum install ruby
  8.2然后再执行第6步的创建集群命令,还会报错,提示缺少rubygems组件,使用yum安装
  错误内容:
  ./redis-trib.rb:24:in`require': no such file to load -- rubygems (LoadError)
  from ./redis-trib.rb:24
  yum install rubygems
  8.3再次执行第8步的命令,还会报错,提示不能加载redis,是因为缺少redis和ruby的接口,使用gem 安装
  错误内容:
  /usr/lib/ruby/site_ruby/1.8/rubygems/custom_require.rb:31:in`gem_original_require': no such file to load -- redis (LoadError)
  from/usr/lib/ruby/site_ruby/1.8/rubygems/custom_require.rb:31:in `require'
  from ./redis-trib.rb:25
  gem install redis
  8.4 再次执行第8步的命令,正常执行
  输入yes,然后配置完成。

  注意观察主从的配置:
  默认是前三个节点 7001  7002  7003 是主,
  后3个节点 7004  7005   7006 是从
  如果是部署在不同的服务器,请根据主从分部规则,分开在不同的服务器
##推倒重来
  8.5 执行./redis-trib.rb create --replicas 1 报错如下:
  Can I set the aboveconfiguration? (type 'yes' to accept): yes
  /usr/lib/ruby/gems/1.8/gems/redis-3.2.1/lib/redis/client.rb:113:in`call': ERR Slot 10846 is already busy (Redis::CommandError)
  出现以上报错,需要重新推倒重来,除redis.conf 文件外
  请删除/usr/local/cluster文件下面的所有node.conf 和dump
  并重启redis 集群服务
###报错解决
  8.6 执行./redis-trib.rb create --replicas 1 报错如下:
  /usr/lib/ruby/gems/1.8/gems/redis-3.3.2/lib/redis/connection/ruby.rb:111:in`_write_to_socket': Connection timed out (Redis::TimeoutError)

  (报错原因为:gem install redis 版本为3.3.2太高,需要降低版本)
  备注:
  如果是单机伪集群部署,gem install redis后,
  执行redis-trib.rb create --replicas XXX 命令是不会报错的。
  如果是多台服务器安装集群,必须降低版本安装redis驱动
  否则执行redis-trib.rb create --replicas XXX报错!
  手工下载并安装ruby redis 插件:
  wgethttps://rubygems.global.ssl.fastly.net/gems/redis-3.2.1.gem
  gem uninstall redis   #卸载老版本
  gem install -l ./redis-3.2.1.gem
  ./redis-trib.rb  create --replicas 1 192.168.40.31:7001192.168.40.32:7002 192.168.40.33:7003 192.168.40.32:7004 192.168.40.33:7005192.168.40.31:7006
  至此redis集群即搭建成功!
9:使用redis-cli命令进入集群环境
  redis-cli -c -p 7001
三.测试篇
1).检查集群状态,
  #redis-trib.rb的check子命令构建
  #ip:port可以是集群的任意节点
  ./redis-trib.rb check  127.0.0.1:7001
  最后输出如下信息,没有任何警告或错误,表示集群启动成功并处于ok状态
2):添加新master节点
  (1)添加一个master节点:创建一个空节点(empty node),然后将某些slot移动到这个空节点上,这个过程目前需要人工干预
  a):根据端口生成配置文件(ps:establish_config.sh是我自己写的输出配置脚本)
  sh establish_config.sh 6386> conf/redis-6386.conf
  b):启动节点
  nohup redis-server/opt/redis/conf/redis-6386.conf > /opt/redis/logs/redis-6386.log 2>&1&
  c):加入空节点到集群
  add-node  将一个节点添加到集群里面,第一个是新节点ip:port, 第二个是任意一个已存在节点ip:port
  redis-trib.rb add-node10.10.34.14:6386 10.10.34.14:6381
  node:新节点没有包含任何数据,因为它没有包含任何slot。新加入的加点是一个主节点,当集群需要将某个从节点升级为新的主节点时,这个新节点不会被选中
  d):为新节点分配slot
  redis-trib.rb reshard10.10.34.14:6386
  #根据提示选择要迁移的slot数量(ps:这里选择500)
  How many slots do you wantto move (from 1 to 16384)? 500
  #选择要接受这些slot的node-id
  What is the receiving nodeID? f51e26b5d5ff74f85341f06f28f125b7254e61bf
  #选择slot来源:
  #all表示从所有的master重新分配,
  #或者数据要提取slot的master节点id,最后用done结束

  Please enter all the sourcenode>  Type 'all' to use all the nodes as sourcenodes for the hash slots.

  Type 'done' once you entered all the sourcenodes>  Source node #1:all
  #打印被移动的slot后,输入yes开始移动slot以及对应的数据.
  #Do you want to proceedwith the proposed reshard plan (yes/no)? yes
  #结束
3):添加新的slave节点
  a):前三步操作同添加master一样
  b)第四步:redis-cli连接上新节点shell,输入命令:cluster replicate 对应master的node-id
  cluster replicate2b9ebcbd627ff0fd7a7bbcc5332fb09e72788835
  note:在线添加slave 时,需要dump整个master进程,并传递到slave,再由 slave加载rdb文件到内存,rdb传输过程中Master可能无法提供服务,整个过程消耗大量io,小心操作.
  例如本次添加slave操作产生的rdb文件
  -rw-r--r-- 1 root root  34946 Apr 17 18:23 dump-6386.rdb
  -rw-r--r-- 1 root root  34946 Apr 17 18:23 dump-7386.rdb
4):在线reshard 数据:
  对于负载/数据均匀的情况,可以在线reshard slot来解决,方法与添加新master的reshard一样,只是需要reshard的master节点是老节点.
5):删除一个slave节点
  #redis-trib del-nodeip:port ''
  redis-trib.rb del-node10.10.34.14:7386 'c7ee2fca17cb79fe3c9822ced1d4f6c5e169e378'
  6):删除一个master节点
  a):删除master节点之前首先要使用reshard移除master的全部slot,然后再删除当前节点(目前只能把被删除
  master的slot迁移到一个节点上)
  #把10.10.34.14:6386当前master迁移到10.10.34.14:6380上
  redis-trib.rb reshard10.10.34.14:6380
  #根据提示选择要迁移的slot数量(ps:这里选择500)
  How many slots do you wantto move (from 1 to 16384)? 500(被删除master的所有slot数量)
  #选择要接受这些slot的node-id(10.10.34.14:6380)
  What is the receiving nodeID? c4a31c852f81686f6ed8bcd6d1b13accdc947fd2 (ps:10.10.34.14:6380的node-id)

  Please enter all the sourcenode>  Type 'all' to use all the nodes as sourcenodes for the hash slots.

  Type 'done' once you entered all the sourcenodes>  Source node#1:f51e26b5d5ff74f85341f06f28f125b7254e61bf(被删除master的node-id)
  Source node #2:done
  #打印被移动的slot后,输入yes开始移动slot以及对应的数据.
  #Do you want to proceedwith the proposed reshard plan (yes/no)? yes
  b):删除空master节点
  redis-trib.rb del-node10.10.34.14:6386 'f51e26b5d5ff74f85341f06f28f125b7254e61bf'
四:redis cluster 客户端(Jedis)
1:客户端基本操作使用
   private staticBinaryJedisCluster jc;
  static {
  //只给集群里一个实例就可以
  SetjedisClusterNodes = new HashSet();
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 6380));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 6381));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 6382));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 6383));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 6384));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 7380));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 7381));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 7382));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 7383));
  jedisClusterNodes.add(newHostAndPort("10.10.34.14", 7384));
  jc = newBinaryJedisCluster(jedisClusterNodes);
  }
  @Test
  public void testBenchRedisSet() throwsException {
  final Stopwatch stopwatch = newStopwatch();
  List list = buildBlogVideos();
  for (int i = 0; i < 1000; i++){
  String key = "key:" +i;
  stopwatch.start();
  byte[] bytes1 =protostuffSerializer.serialize(list);
  jc.setex(key, 60 * 60,bytes1);
  stopwatch.stop();
  }
  System.out.println("time=" +stopwatch.toString());
  }
2:jedis客户端的坑.
  1)cluster环境下redis的slave不接受任何读写操作,
  2)client端不支持keys批量操作,不支持select dbNum操作,只有一个db:select 0
  3)JedisCluster 的info()等单机函数无法调用,返回(No way to dispatch thiscommand to Redis Cluster)错误,.
  4)JedisCluster 没有针对byte[]的API,需要自己扩展(附件是我加的基于byte[]的BinaryJedisCluster  api)


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-630632-1-1.html 上篇帖子: redis 性能指标监控命令 下篇帖子: Memcached,redis监控详解
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表