akyou56 发表于 2015-7-6 01:20:48

MongoDB源码概述——日志

    本篇文章主要介绍MongoDB的日志模块以及数据持久化存储模块的代码实现方式。大家也许会惊讶,为什么日志模块和持久化存储模块会放到一篇文章来总结。嘿嘿,在别的系统,可能这两个模块联系不是特别大,可是这MongoDB ,这两个模块还真不能分开来讲。这是怎么回事呢?请听我娓娓道来…
  通常说来,MongoDB具有三个日志模块,

[*]Log
[*]Journal
[*]Oplog
    Log: 位于 log.h,它主要负责用户日志文件,这和我们普通系统的日志系统没有什么区别,作用也就是记录系统的一些重要流程,然后持久化到log文件。这个log文件可以通过系统启动参数"--logpath".
    Journal: 位于dur.h,通过启动参数"--dur"启动该模块功能。主要用于解决因系统宕机时,内存中的数据未写入磁盘而造成的数据丢失(为什么数据会被放到内存做存储而不是直接对外存上的文件进行操作呢?这一点与MongoDB的存储机制有关,稍后会讲到)。其机制主要是通过log方式定时将操作日志(对数据库有更改的操作,查询不在记录范围之类)记录到dbpath的命名为journal文件夹下,这样当系统再次重启时从该文件夹下恢复丢失的数据。
    Oplog :当部署应用于生产的健壮的服务器时,需要对服务器进行同步备份,MongoDB为解决这一问题提出了复制集(Replica sets)模式,而Oplog 的作用则主要是负责记录写服务器(一个复制集内只有一台服务器可写,多台备份服务器可读)上所有对数据的更改(查询等对数据库不产生更改的操作不会被记录),这样,复制集内的其他读扩展(即用于备份的机器和分散读压力的服务器)的服务器通过获取Oplog 就可以进行差异同步了。
  
    本文主要是介绍日志和持久化存储,以及他们之间的关系。所以本文就不对Oplog做过多的说明,后续文章讲到复制集模块时,我一定会写上。本文的主要重点还是分析Journal以及持久化的实现,所以,对于Log模块,我也就只是简单的概括一下了。
  
  Log模块:
  当我们启动MongoDB,对Log模块的调用流程如下:
     


  Main(...)->addWindowsOptions(...)->initLogging(...)->loggingManager.start(...);
  之后会调用这样的代码来设置stdout的输出目标
  FILE* tmp = freopen(_path.c_str(), (_append ? "a" : "w"), stdout);
  又因为static的logfile指针指向stdout
  FILE* Logstream::logfile = stdout;
  所以在Logstream内最后数据会被flush到stdout,即系统所指定的目的地.  
  在log.h下有如下定义:
     


1    enum LogLevel {LL_DEBUG , LL_INFO , LL_NOTICE , LL_WARNING , LL_ERROR , LL_SEVERE };
2    inline Nullstream& log( int level ) {
3         if ( level > logLevel )
4             return nullstream;
5         return Logstream::get().prolog();
6   }
7
8   inline Nullstream& log() {
9         return Logstream::get().prolog();
10   }  
  又因为Logstream重载了一些基本的流符号:


Logstream& operator
页: [1]
查看完整版本: MongoDB源码概述——日志