Redis实现原理(2)--字典

lgyx · 发表于 2015-7-20 10:31:58

　　1、 Dict
　　2.1 数据结构定义dict.h

// 哈希表结构

typedef struct dictht {
dictEntry **table; //哈希表数组指针

unsigned long size;  //哈希表大小

unsigned long sizemask; //掩码，hash时用到

unsigned long used; //已有节点的数量

} dictht;
//  哈希表节点结构

typedef struct dictEntry {
void *key;
union {
void *val;
uint64_t u64;
int64_t s64;
} v;  // 值，可以是指针类型、uint64和int64
struct dictEntry *next;  //指向下一节点形成一个单链表

} dictEntry;
//字典定义

typedef struct dict {
dictType *type;
void *privdata;
dictht ht[2];
int rehashidx; // 重分布标示-1标示正在重分布中
int iterators; // 重分布进度

} dict;
// 字典类型
// 每个dictType保存了一系列用于操作特定字典的函数，不同用途的字典type不同

typedef struct dictType {
// hash函数

unsigned int (*hashFunction)(const void *key);
// key的复制
void *(*keyDup)(void *privdata, const void *key);
// value的复制
void *(*valDup)(void *privdata, const void *obj);
// key的比较
int (*keyCompare)(void *privdata, const void *key1, const void *key2);
// key的销毁
void (*keyDestructor)(void *privdata, void *key);
// value的销毁
void (*valDestructor)(void *privdata, void *obj);
} dictType;
　　

2.2 hash

调用type中得hashFunction方法计算key的hash值，redis内部使用的hash算法为Austin Appleby开发的MurmurHash2算法

h = d->type->hashFunction(key)

计算key的索引值，先在ht[0]中查找，如果没有找到并且在rehash的过程中，则继续在ht[1]中找

idx = h & d->ht[table].sizemask

对于哈希冲突的解决，redis采取的拉链法，相同索引值的key会存储在一个单链表中，所以确定了索引值以后还需要在对应的单链表中进行搜索

while(he) {
if (dictCompareKeys(d, key, he->key))
return -1;
he = he->next;
}
　　

2.3 rehash

为了保证字典的使用效率，redis对字典结构采取了定期rehash的机制，因为rehash是重CPU的操作，为了避免过程中出现对外无响应的情况，这里做了一种增量rehash的优化

rehash的流程如下：

　　1) 新建一个空得hash表，size为第一个大于等于2n的整数

unsigned long i = DICT_HT_INITIAL_SIZE;
if (size >= LONG_MAX) return LONG_MAX;
while(1) {
if (i >= size)
return i;
i *= 2;
}
　　
　　2) 将ht[0]中的key重新计算hash和index，索引到ht[1]中，并将ht[0]中相应的索引值置为空
　　3) 待ht[0]中的数据全部rehash到ht[1]中之后将ht[1]设置为ht[0]，并创建一个新的ht[1]
　　增量rehash是对步骤2进行优化，每次只rehash一个index的key，并且在rehash过程中对读写操作做限制：
　　1) 读：先查ht[0]，如果没有再在ht[1]上查找
　　2) 写：rehash过程中，新的key只向ht[1]中写，并且会将索引所对应的所有key重新hash到ht[1]中。
　　最终会在某个时间点ht[0]中所有的key重新hash到ht[1]中。
　　
　　http://www.yancey.info/?p=180

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

Red Hat RHCE 8 (EX294) Cert Guide

c++ size_t 和 int 的区别

HERE 使用 AWS EF 和 JFrog Artifactory 打

C++ 指针大全：从基础到进阶，一篇快速上手

wirelessnetview好用的无线分析工具

亿图图示专家(EDraw Max) V7.9 中文破解版

[经验分享] Redis实现原理(2)--字典

浏览过的版块

扫码加入运维网微信交流群