mysql>select*from login;+---------+----------------+-------------+---------------------+| user_id | name | login_times | last_login_time |+---------+----------------+-------------+---------------------+|1| ken thompson |5|2011-01-0100:00:00||2| dennis ritchie |1|2011-02-0100:00:00||3|JoeArmstrong|2|2011-03-0100:00:00|+---------+----------------+-------------+---------------------+
user_id表的主键,name表示用户名,login_times表示该用户的登录次数,每次用户登录后,login_times会自增,而last_login_time更新为当前时间。
REDIS的设计
关系型数据转化为KV数据库,我的方法如下:
key 表名:主键值:列名
value 列值
一般使用冒号做分割符,这是不成文的规矩。比如在php-admin for redis系统里,就是默认以冒号分割,于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下:
#获得用户的id
uid = r.get("login:%s:id"% name)#自增用户的登录次数
ret = r.incr("login:%s:login_times"% uid)#更新该用户的最后登录时间
ret = r.set("login:%s:last_login_time"% uid, datetime.datetime.now())
如果需求仅仅是已知id,更新或者获取某个用户的最后登录时间,登录次数,关系型和kv数据库无啥区别。一个通过btree pk,一个通过hash,效果都很好。
假设有如下需求,查找最近登录的N个用户。开发人员看看,还是比较简单的,一个sql搞定。
select*from login order by last_login_time desc limit N
DBA了解需求后,考虑到以后表如果比较大,所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录,再回表N次,效果很好。
过了两天,又来一个需求,需要知道登录次数最多的人是谁。同样的关系型如何处理?DEV说简单
select*from login order by login_times desc limit N
DBA一看,又要在login_time上建立一个索引。有没有觉得有点问题呢,表上每个字段上都有素引。
关系型数据库的数据存储的的不灵活是问题的源头,数据仅有一种储存方法,那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的,而访问路径的增加又意味着你必须使用统计信息来辅助,于是一大堆的问题就出现了。
没有索引,没有统计计划,没有执行计划,这就是kv数据库。
redis里如何满足以上的需求呢? 对于求最新的N条数据的需求,链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码,维护一个登录的链表,控制他的长度,使得里面永远保存的是最近的N个登录用户。
#把当前登录人添加到链表里
ret = r.lpush("login:last_login_times", uid)#保持链表只有N位
ret = redis.ltrim("login:last_login_times",0, N-1)
这样需要获得最新登录人的id,如下的代码即可
mysql>select*from book;+------+-------------------------------+----------------+| id | name | author |+------+-------------------------------+----------------+|1|TheRubyProgrammingLanguage|MarkPilgrim||1|Ruby on rail |DavidFlanagan||1|ProgrammingErlang|JoeArmstrong|+------+-------------------------------+----------------+
mysql>select*from tag;+---------+---------+| tagname | book_id |+---------+---------+| ruby |1|| ruby |2|| web |2|| erlang |3|+---------+---------+
假如有如此需求,查找即是ruby又是web方面的书籍,如果以关系型数据库会怎么处理?
select b.name, b.author from tag t1, tag t2, book b
where t1.tagname ='web'and t2.tagname ='ruby'and t1.book_id = t2.book_id and b.id = t1.book_id
tag表自关联2次再与book关联,这个sql还是比较复杂的,如果要求即ruby,但不是web方面的书籍呢?
关系型数据其实并不太适合这些集合操作。
REDIS的设计
首先book的数据肯定要存储的,和上面一样。
set book:1:name "The Ruby Programming Language"Set book:2:name "Ruby on rail"Set book:3:name "Programming Erlang"set book:1:author "Mark Pilgrim"Set book:2:author "David Flanagan"Set book:3:author "Joe Armstrong"
tag表我们使用集合来存储数据,因为集合擅长求交集、并集