设为首页 收藏本站
查看: 1384|回复: 0

[经验分享] 实时同步MongoDB Oplog开发指南

[复制链接]

尚未签到

发表于 2017-12-16 06:10:12 | 显示全部楼层 |阅读模式
  转载请注明joymufeng,欢迎访问PlayScala社区(http://www.playscala.cn/)


Capped Collections
  MongoDB有一种特殊的Collection叫Capped collections,它的插入速度非常快,基本和磁盘的写入速度差不多,并且支持按照插入顺序高效的查询操作。Capped collections的大小是固定的,它的工作方式很像环形缓冲器(circular buffers), 当剩余空间不足时,会覆盖最先插入的数据。
  Capped collections的特点是高效插入和检索,所以最好不要在Capped collections上添加额外的索引,否则会影响插入速度。Capped collections可以用于以下场景:


  • 存储日志: Capped collections的first-in-first-out特性刚好满足日志事件的存储顺序;
  • 缓存小量数据:因为缓存的特点是读多写少,所以可以适当使用索引提高读取速度。
  Capped collections的使用限制:


  • 如果更新数据,你需要为之创建索引以防止collection scan;
  • 更新数据时,文档的大小不能改变。比如说name属性为'abc',则只能修改成3个字符的字符串,否则操作将会失败;
  • 数据不允许删除,如果非删除不可,只能drop collection
  • 不支持sharding
  • 默认只支持按自然顺序(即插入顺序)返回结果
  Capped collections可以使用$natural操作符按插入顺序的正序或反序返回结果:
  

db['oplog.rs'].find({}).sort({$natural: -1})  

  

Oplog
  Oplog是一种特殊的Capped collections,特殊之处在于它是系统级Collection,记录了数据库的所有操作,集群之间依靠Oplog进行数据同步。Oplog的全名是local.oplog.rs,位于local数据下。由于local数据不允许创建用户,如果要访问Oplog需要借助其它数据库的用户,并且赋予该用户访问local数据库的权限,例如:
  

db.createUser({  
   user: "play-community",
  
   pwd: "******",
  
   "roles" : [
  
    {
  
      "role" : "readWrite",
  
      "db" : "play-community"
  
    },
  
    {
  
      "role" : "read",
  
      "db" : "local"
  
    }
  
  ]
  
})
  

  

  Oplog记录的操作记录是幂等的(idempotent),这意味着你可以多次执行这些操作而不会导致数据丢失或不一致。例如对于$inc操作,Oplog会自动将其转换为$set操作,例如原始数据如下:
  

{  
  "_id" : "0",
  
  "count" : 1.0
  
}
  

  

  执行如下$inc操作:
  

db.test.update({_id: "0"}, {$inc: {count: 1}})  

  

  Oplog记录的日志为:
  

{  
  "ts" : Timestamp(1503110518, 1),
  
  "t" : NumberLong(8),
  
  "h" : NumberLong(-3967772133090765679),
  
  "v" : NumberInt(2),
  
  "op" : "u",
  
  "ns" : "play-community.test",
  
  "o2" : {
  
    "_id" : "0"
  
  },
  
  "o" : {
  
    "$set" : {
  
      "count" : 2.0
  
    }
  
  }
  
}
  

  

  这种转换可以保证Oplog的幂等性。另外Oplog为了保证插入性能,不允许额外创建索引。

Timestamps格式
  MongoDB有一种特殊的时间格式Timestamps,仅用于内部使用,例如上面Oplog记录:
  

Timestamp(1503110518, 1)  

  

  Timestamps长度为64位:


  • 前32位是time_t值,表示从epoch时间至今的秒数
  • 后32位是ordinal值,该值是一个顺序增长的序数,表示某一秒内的第几次操作
开始同步Oplog
  在开始同步Oplog之前,我们需要注意以下几点:


  • 由于Oplog不使用索引,所以初始查询代价可能很大
  • 当Oplog数据量很大时,可以保存ts,系统重启时利用该ts可以减少首次查询开销
  • oplogReplay标志可以显著加快包含ts条件过滤的查询,但是只对oplog查询有效
  

val tailingCursor =  
oplogCol
  
  .find(Json.obj("ns" -> Json.obj("$in" -> Set(s"${db}.common-doc", s"${db}.common-article")), "ts" -> Json.obj("$gte" -> lastTS)))
  
  .options(QueryOpts().tailable.oplogReplay.awaitData.noCursorTimeout)
  
  .cursor[BSONDocument]()
  

  
tailingCursor.fold(()){ (_, doc) =>
  
try {
  
  val jsObj = doc.as[JsObject]
  
  jsObj("op").as[String] match {
  
   case "i" => // 插入
  
   case "u" => // 更新
  
   case "d" => // 删除
  
  }
  

  
  // 保存ts值,以备后用
  
  if (tailCount.get() % 10 == 0) { }
  
} catch {
  
  case t: Throwable =>
  
   Logger.error("Tail oplog Error: " + t.getMessage, t)
  
}
  
}
  

  

  另外提醒大家注意,ReactiveMongo-Streaming的Akka Stream实现有bug,如果首次查询没有数据返回,则会持续发送查询请求,大约每秒中发送几十次至几百次请求,因为Oplog的查询开销很大,最终会导致MongoDB内存溢出。详情参考Keep sending queries while the initial query result of a tailable cursor is empty.

参考


  • MongoDB Doc - Replica Set Oplog
  • MongoDB Doc - Capped Collections
  • MongoDB Doc - Tailable Cursors


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-424555-1-1.html 上篇帖子: Mongodb的锁 原子性 隔离性 一致性 下篇帖子: Ubuntu16.04上安装mongoDB
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表