设为首页 收藏本站
查看: 1459|回复: 0

[经验分享] Mongodb3分片部署及故障模拟验证

[复制链接]

尚未签到

发表于 2018-10-25 11:12:50 | 显示全部楼层 |阅读模式
  本文分两部分介绍mongodb3.2.1分片部署配置及故障模拟验证。
  第一部分  安装配置
  一、实验环境
  两组副本集做分片
  版本3.2.1
  副本集1:192.168.115.11:27017,192.168.115.12:27017,192.168.115.11:47017(arbiter)
  副本集2:192.168.115.11:37017,192.168.115.12:37017,192.168.115.12:47017(arbiter)
  configserver:192.168.115.11:10000,192.168.115.11:10001,192.168.115.12:10000
  mongos:192.168.115.11:20000
二、分片介绍
  1.逻辑图
DSC0000.png

  片(shard):每一个分片一个副本集
  配置服务器(config server):存储集群的配置信息,3.2以上版本支持副本集模式部署
  路由进程(mongos):路由所有请求,然后将结果聚合。它不保存存储数据或配置信息,配置信息从配置服务器上加载到内存中。
  副本集方式部署confiserver
  一、部署条件
  1.集群中不能有仲裁节点
  2.集群中不能有延迟节点
  3.每个成员必须可以创建索引
  二、configserver安装配置
  1.修改配置文件(其他两个节点配置文件类似,主要修改监听端口,及数据路径,如果一台机器上运行多个实例,注意配置文件名称要不一样)
cat config.conf  
fork = true
  
quiet = true
  
port = 10000
  
dbpath = /data/config
  
logpath = /usr/local/mongodb/logs/config.log
  
logappend = true
  
directoryperdb = true
  
configsvr = true
  
replSet = hnrconfig/192.168.115.11:10000,192.168.115.11:10001,192.168.115.12:10000
  2.服务启动和停止
  /usr/local/mongodb/bin/mongod
-f /usr/local/mongodb/etc/config.conf
  /usr/local/mongodb/bin/mongod --shutdown
--port 10000 --dbpath=/data/config
  3.配置副本集
  连接任意一个节点进行配置
  > show dbs
  2016-11-17T09:06:08.088+0800
E QUERY    [thread1] Error: listDatabases
failed:{ "ok" : 0, "errmsg" : "not master and
slaveOk=false", "code" : 13435 } :
  _getErrorWithCode@src/mongo/shell/utils.js:23:13
  Mongo.prototype.getDBs@src/mongo/shell/mongo.js:53:1
  shellHelper.show@src/mongo/shell/utils.js:700:19
  shellHelper@src/mongo/shell/utils.js:594:15
  @(shellhelp2):1:1
  出现以上错误,需要执行
  > rs.slaveOk()
  > use admin
  >
db.runCommand({"replSetInitiate" : { "_id" :
"hnrconfig" ,"members" : [ { "_id" : 1,
"host" : "192.168.115.11:10000"},{ "_id" : 2,
"host" : "192.168.115.12:10000"},{"_id" : 3,
"host" : "192.168.115.11:10001"}]}})
  { "ok" : 1
}
  三、mongos配置
  1.配置文件
cat mongos.conf  
fork = true
  
quiet = true
  
port = 20000
  
logpath = /usr/local/mongodb/logs/mongos.log
  
logappend = true
  
configdb = 192.168.115.11:10000,192.168.115.11:10001,192.168.115.12:10000
  2.启动mongos服务
  /usr/local/mongodb/bin/mongos
-f /usr/local/mongodb/etc/mongos.conf
  四、往集群中添加分片
  连接mongos
  mongos>
sh.addShard("hnrtest1/192.168.115.11:27017")
  {
"shardAdded" : "hnrtest1", "ok" : 1 }
  mongos>
  mongos>
sh.addShard("hnrtest2/192.168.115.12:37017")
  {
"shardAdded" : "hnrtest2", "ok" : 1 }
  mongos>
DSC0001.png

  五、开启分片
  1.先对数据库启用分片功能
  mongos>
sh.enableSharding("shardtest")
  { "ok" : 1
}
  mongos>
  2.对集合开启分片(自动分片建)
  mongos>
sh.shardCollection("shardtest.student",{"cre_id":1})
  {
"collectionsharded" : "shardtest.student", "ok" :
1 }
  mongos>
DSC0002.png

  3.修改默认chunk大小(默认为64M),自动分片测试效果不好,需要插入大量数据,将其修改为1M
  mongos> use config
  mongos>
db.settings.save({ "_id" : "chunksize", "value" :
NumberLong(1) })
  修改后对student2集合进行分片
  mongos>
sh.shardCollection("shardtest.student2",{"cre_id":1})
  插入5万条数据
DSC0003.png

  直接在后端分片副本集上查询
  hnrtest2:PRIMARY>
db.student2.find().count()
  27081
  hnrtest2:PRIMARY>
  hnrtest1:PRIMARY>
db.student2.find().count()
  22918
  hnrtest1:PRIMARY>
  4.采用哈希分片
  修改chunk为默认值64M
  mongos>
db.settings.save({ "_id" : "chunksize", "value" :
NumberLong(64) })
  student3集合在cre_id字段使用哈希分片
  mongos>
sh.shardCollection("shardtest.student3",{"cre_id":"hashed"})
  {
"collectionsharded" : "shardtest.student3", "ok"
: 1 }
  mongos>
sh.status()
  shardtest.student3
  shard key: {
"cre_id" : "hashed" }
  unique: false
  balancing: true
  chunks:
  hnrtest1        2
  hnrtest2        2
  { "cre_id" :
{ "$minKey" : 1 } } -->> { "cre_id" :
NumberLong("-4611686018427387902") } on : hnrtest1 Timestamp(2, 2)
  { "cre_id" :
NumberLong("-4611686018427387902") } -->> { "cre_id"
: NumberLong(0) } on : hnrtest1 Timestamp(2, 3)
  { "cre_id" :
NumberLong(0) } -->> { "cre_id" :
NumberLong("4611686018427387902") } on : hnrtest2 Timestamp(2, 4)
  { "cre_id" :
NumberLong("4611686018427387902") } -->> { "cre_id" :
{ "$maxKey" : 1 } } on : hnrtest2 Timestamp(2, 5)
  往student3插入1万条数据,在每个分片上查询
  hnrtest1:PRIMARY>
db.student3.find().count()
  4952
  hnrtest1:PRIMARY>
  hnrtest2:PRIMARY>
db.student3.find().count()
  5047
  hnrtest2:PRIMARY>
  第二部分  故障模拟验证
  一、模拟config服务副本集primary节点宕机
  1.关闭服务
  /usr/local/mongodb/bin/mongod
--shutdown --port 10000 --dbpath=/data/config
  2.副本集重新选举一个primary节点
DSC0004.png

  3.读取数据,所有数据均正常返回
  mongos> use
shardtest
  switched to db
shardtest
  mongos>
  mongos>
db.student.find().count()
  99999
  mongos>
db.student2.find().count()
  49999
  mongos>
db.student3.find().count()
  9999
  mongos>
  4.对新的集合进行分片,插入5千条数据
  mongos>
sh.shardCollection("shardtest.student4",{"cre_id":"hashed"})
  {
"collectionsharded" : "shardtest.student4", "ok"
: 1 }
  mongos>
  在每个分片上查询数据
  hnrtest2:PRIMARY>
db.student4.find().count()
  2525
  hnrtest2:PRIMARY>
  hnrtest1:PRIMARY>
db.student4.find().count()
  2474
  hnrtest1:PRIMARY>
  二、config服务数据备份恢复
  1.数据备份
  /usr/local/mongodb/bin/mongodump
-h 192.168.115.11:10001 -o configdata
  2.关闭所有config服务节点
  /usr/local/mongodb/bin/mongod
--shutdown --port 10000 --dbpath=/data/config
  /usr/local/mongodb/bin/mongod
--shutdown --port 10001 --dbpath=/data/config1
  3.数据读取操作
  由于mongos是将config的配置信息全部加载到内存中运行,因此此时通过mongos查询数据一切正常,但是不能对新的集合进行分片操作
  mongos>
db.student.find().count()
  99999
  mongos>
db.student2.find().count()
  49999
  mongos>
db.student3.find().count()
  9999
  mongos>
db.student4.find().count()
  4999
  mongos>
  4.对集合进行分片操作,无法完成
  mongos>
sh.shardCollection("shardtest.student5",{"cre_id":"hashed"})
  {
  "ok" : 0,
  "errmsg" : "None of the
hosts for replica set hnrconfig could be contacted.",
  "code" : 71
  }
  mongos>
  5.关闭mongos服务,删除config节点所有数据
  6.重新启动三个config服务
  7.重新初始化副本集
  > rs.slaveOk()
  > use admin
  >
db.runCommand({"replSetInitiate" : { "_id" :
"hnrconfig" ,"members" : [ { "_id" : 1,
"host" : "192.168.115.11:10000"},{ "_id" : 2,
"host" : "192.168.115.12:10000"},{"_id" : 3,
"host" : "192.168.115.11:10001"}]}})
  8.启动mongos服务,此时没有任何数据
DSC0005.png

  9.导入备份的config数据
  /usr/local/mongodb/bin/mongorestore
-h 192.168.115.11:10000 -d config configdata/config/
  在mongos查询,但是查询数据会出现超时,数据无法查询
DSC0006.png

  10.在mongos执行如下命令
  mongos>
sh.enableSharding("shardtest")
  { "ok" :
0, "errmsg" : "Operation timed out", "code" : 50
}
  mongos日志
  2016-11-17T14:46:21.197+0800
I SHARDING [Balancer] about to log metadata event into actionlog: { _id:
"node1.hnr.com-2016-11-17T14:46:21.197+0800-582d523ded1c4b679a84877b",
server: "node1.hnr.com", clientAddr: "", time: new Date(1479365181197),
what: "balancer.round", ns: "", details: {
executionTimeMillis: 30007, errorOccured: true, errmsg: "could not get
updated shard list from config server due to ExceededTimeLimit Operation timed
out" } }
  官网上说是bug,恢复失败
  https://jira.mongodb.org/browse/SERVER-22392



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-626281-1-1.html 上篇帖子: mongodb服务器的三种启动方法 下篇帖子: 利用python测试mongodb副本集数据同步延迟
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表