设为首页 收藏本站
查看: 1244|回复: 0

[经验分享] PostgreSQL启动过程中的那些事七:初始化共享内存和信号三:shmem中初始化clog

[复制链接]

尚未签到

发表于 2016-11-21 07:47:51 | 显示全部楼层 |阅读模式
       pg初始化完shmem,给其加上索引"ShmemIndex"后,接着就在shmem里初始化xlog。然后依次初始化clog、subtrans、twophase、multixact。安排按clog、subtrans、multixact、twophase的顺序写,把twophase放到multixact之后是因为前面三个用了相同的算法和数据结构,连起来写可以加深印象和归类记忆,本来想把初始化clog、subtrans、multixact放到一篇文章里写,因为篇幅太长还是分开了,看的时候这几篇文章可以结合起来看。
pg事务提交日志(CLOG)是相对于事务日志(XLOG)小的独立的内存段。

事务提交日志(CLOG)和事务日志(XLOG)是什么关系呢?无论什么时候,当一个新的事务提交日志(CLOG)页被初始化为0时,会产生一个事务日志(XLOG)记录。在事务中提交或退出事务时的写事务提交日志(CLOG),为事务产生了自己的事务日志(XLOG)记录,且在redo日志上更新相关重放/重做动作;因此pg需要在事务提交日志(CLOG)里做一个没有任何额外附加的和事务日志(XLOG)里相关记录对应的记录。而且,在pg被要求记录提交事务日志(CLOG)前,事务日志(XLOG)保证通过对应的事务提交日志(CLOG)记录已经刷新,因此“在写数据前写事务日志xlog”的WAL原则对于提交已经满足,而且我们不用关心事务退出。所以pg不需要用LSN信息标记事务提交日志(CLOG)页面;pg已经有了足够的同步。

pg用简单最近最少使用算法(SLRU)管理clog、subtrans、multixact的页面缓冲池。
在一般情况下,我们希望写流量发生在最近使用的页面。读流量可能会有较大的页面跨度,但任何情况下相当少的页面数量已经足够了。因此,pg仅使用纯线性查询搜索缓冲区,而没有必要使用哈希表或别的东西。除了永远不会交换出最近页面(因为我们知道最终它会再次命中)外管理算法是LRU。
pg使用一个控制轻量锁(control LWLock)保护共享数据结构,再加上每缓冲页轻量锁(per-buffer LWLocks)为每个缓冲区/页同步IO。检查或修改任何共享状态必须持有控制锁。进程在读入或写出一个缓冲页时只需要持有工作在该该缓冲页上的每缓冲页锁就可以了 ,不需要持有控制锁。 (关于锁到并发控制时再讨论)
除了SimpleLruReadPage_ReadOnly()外“持有控制锁”在所有情况下指的是排他锁。
    当在一个缓冲页上初始化I/O时,只要在释放控制锁之前获得每缓冲页锁。在完成I/O后,释放每缓冲页锁,重新获得控制锁,且更新共享状态。(在这儿死锁是不可能的,因为其它进程在同一个缓冲页上做I/O的时候,从不尝试在该缓冲页启动I/O操作。)等待I/O完成,释放控制锁,在共享模式中获得每缓冲页锁,立即释放每缓冲页锁,重新获得控制锁,且再次检查状态(因为没有持有锁的时候可能会发生意外的事情)。
       使用缓冲区管理器时,有可能发生其它进程写当前正在被写出的缓冲页。这个通过重置缓冲页的page_dirty标签来处理。

上面综合性讨论了事务提交日志、其和XLOG的关系、相关的缓冲及同步时用的锁等,下来我们看方法调用流程

 
1先上个图,看一下函数调用过程梗概,中间略过部分细节

DSC0000.bmp
 
初始化clog方法调用流程图

  
 

  
2初始化xlog相关结构
  
话说main()->…->PostmasterMain()->…->reset_shared()-> CreateSharedMemoryAndSemaphores()->…-> CLOGShmemInit(),初始化提交事务日志(CLOG)相关数据结构ClogCtlData等,用作内存里管理和缓存提交事务日志文件(存放在"data/pg_clog"文件夹里的文件)。
  
在CLOGShmemInit ()函数里,首先在shmem的哈希表索引"ShmemIndex"上给事务提交日志(CLOG)增加一个HashElementShmemIndexEntentry),在shmem里根据ClogCtlData等相关结构     大小调用ShmemAlloc()分配内存空间,使ShmemIndexEnt的成员location指向该空间,size成员记录该空间大小。
  
CLOGShmemInit()调用ShmemInitStruct(),在其中调用hash_search()在哈希表索引"ShmemIndex"中查找"CLOG Ctl",如果没有,就在shmemIndex中给"CLOG Ctl"分一个HashElement和ShmemIndexEntentry),在其中的Entry中写上"CLOGCtl"。返回ShmemInitStruct(),再调用ShmemAlloc()在共享内存上给"CLOGCtl"相关结构(见下面“XLog相关结构图”)分配空间,设置entry(在这儿及ShmemIndexEnt类型变量)的成员location指向该空间,size成员记录该空间大小,最后返回CLOGShmemInit(),让SlruCtlData *类型全局变量ClogCtl指向SlruCtlData *类型静态全局变量ClogCtlData,ClogCtlData的起始地址就是在shmem里给"CLOGCtl"相关结构分配的内存起始地址,设置其中ClogCtlData结构类型的成员值。相关变量、结构定义和初始化完成后数据结构图在下面。
  
 

  
#define ClogCtl (&ClogCtlData)

  
static SlruCtlData ClogCtlData;

  
 

  
typedef structSlruCtlData

  
{

  
    SlruShared  shared;

  
 

  
    /*

  
     * This flag tells whether to fsync writes(true for pg_clog, false for

  
     * pg_subtrans).

  
     */

  
    bool        do_fsync;

  
 

  
    /*

  
     * Decide which of two page numbers is"older" for truncation purposes. We

  
     * need to use comparison of TransactionIdshere in order to do the right

  
     * thing with wraparound XID arithmetic.

  
     */

  
    bool        (*PagePrecedes)(int, int);

  
 

  
    /*

  
     * Dir is set during SimpleLruInit and does notchange thereafter. Since

  
     * it's always the same, it doesn't need to bein shared memory.

  
     */

  
    char        Dir[64];

  
} SlruCtlData;

  
 

  
typedef SlruCtlData *SlruCtl;

  
 

  
/*

  
 * Shared-memorystate

  
 */

  
typedef structSlruSharedData

  
{

  
    LWLockId    ControlLock;

  
 

  
    /* Number of buffers managed by this SLRU structure */

  
    int         num_slots;

  
 

  
    /*

  
     * Arrays holding info for each bufferslot.  Page number is undefined

  
     * when status is EMPTY, as is page_lru_count.

  
     */

  
    char      **page_buffer;

  
    SlruPageStatus*page_status;

  
    bool       *page_dirty;

  
    int        *page_number;

  
    int        *page_lru_count;

  
    LWLockId   *buffer_locks;

  
 

  
    /*----------

  
     * We mark a page "most recentlyused" by setting

  
     *      page_lru_count[slotno]= ++cur_lru_count;

  
     * The oldest page is therefore the one withthe highest value of

  
     *      cur_lru_count- page_lru_count[slotno]

  
     * The counts will eventually wrap around, butthis calculation still

  
     * works as long as no page's age exceedsINT_MAX counts.

  
     *----------

  
     */

  
    int         cur_lru_count;

  
 

  
    /*

  
     * latest_page_number is the page number of thecurrent end of the log;

  
     * this is not critical data, since we use itonly to avoid swapping out

  
     * the latest page.

  
     */

  
    int         latest_page_number;

  
} SlruSharedData;

  
 

  
typedef SlruSharedData *SlruShared;

  
 

  下面看看初始化完"CLOG Ctl"相关结构后在内存中的结构图
  
DSC0001.bmp
初始化完clog的内存结构图

 

  
       为了精简上图,把创建shmem的哈希表索引"ShmemIndex"时创建的HCTL结构删掉了,这个结构的作用是记录创建可扩展哈希表的相关信息。增加了左边灰色底的部分,描述共享内存/shmem里各变量物理布局概览,由下往上,由低地址到高地址。其中的"CLOG Ctl"即clog的相关结构图下面分别给出,要不上面的图太大太复杂了。

  
 

DSC0002.bmp

 

CLOG相关结构图

  
 

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-303128-1-1.html 上篇帖子: PostgreSQL启动过程中的那些事七:初始化共享内存和信号二:shmem中初始化xlog 下篇帖子: PostgreSQL启动过程中的那些事七:初始化共享内存和信号:四 shmem中初始化subtrans
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表