Redis存储

tanggang1740 发表于 2018-11-2 11:08:25

　　NoSQL:
　　

NoSQL DEFINITION: Next Generation Databases mostly addressing some of the points: being non-relational, distributed, open-source and horizontally scalable.　　

　　
ACID：
　　原子性、一致性、隔离性、持久性；
　　2phase commit, 3phase comit, ...
　　

　　
non SQL, Not Only SQL; Web 2.0
　　

　　www.nosql-databases.org
　　https://db-engines.com/en/ranking
　　

　　
特性：数据量大、数据变化非常快（数据增长快、流量分布变化大、数据间耦合结构变化快）、数据源很多；
　　

　　CAP、BASE
　　CAP：
　　2000年，PODC(Principle of Distributed Computing)会议, Brewer
　　Consistency、Availablity、Partition tolerence
　　C：多个数据节点上的数据一致；
　　A：用户发出请求后的有限时间范围内返回结果；
　　P：network partition，网络发生分区后，服务是否依然可用；
　　CAP理论：一个分布式系统不可能同时满足C、A、P三个特性，最多可同时满足其中两者；对于分布式系统满足分区容错性几乎是必须的。新时代P出现的可能性很小，故而3个条件可同时满足；
　　AP:
　　C：弱一致性；
　　CP:
　　

　　BASE：BA，S，E，基于CAP演化而来
　　BA：Basically Available，基本可用；
　　S：Soft state，软状态/柔性事务，即状态可以在一个时间窗口内是不同步的；
　　E：Eventually consistency，最终一致性；
　　

　　
NoSQL：Not Only SQLNOSQL流派
　　Key Value / Tuple Store：DynamoDB, redis
　　Wide Column Store / Column Families：列式数据库, hbase
　　Document Store：文档数据库，mongodb,Elastic
　　Graph Databases：图式数据库，Neo4j
　　

　　Time Series / Streaming Databases：时间序列存储
　　

　　Multimodel Databases：
　　Object Databases:
　　

　　Redis：
　　

Redis is an open source (BSD licensed), in-memory data structure store, used as a database, cache and message broker.　　开源、内存存储、数据结构存储；
　　可用作：数据库、缓存、消息队列；
　　

　　
It supports data structures such as strings, hashes, lists, sets, sorted sets with range queries, bitmaps, hyperloglogs and geospatial indexes with radius queries.
　　数据结构：字符串、列表（数组）、hashes（关联数组）、集合、有序集合、bitmaps、hyperloglogs、空间索引；
　　

　　
Redis has built-in replication, Lua scripting, LRU eviction, transactions and different levels of on-disk persistence, and provides high availability via Redis Sentinel and automatic partitioning with Redis Cluster.
　　内建的复制、Lua scripting、LRU、事务、持久存储、高可用（Sentinel，Redis Cluster）
　　

　　
REmote DIctionary Server：数据结构服务器，k/v，数据结构；
　　

　　
单进程：
　　CPU并非瓶颈；
　　单进程即只能跑到一个内核核心上
　　
持久化：
　　snapshotting
　　AOF
　　

　　
程序环境：
　　配置文件：/etc/redis.conf
　　主程序：/usr/bin/redis-server
　　6379/tcp
　　客户端：/usr/bin/redis-cli
　　Unit File:/usr/lib/systemd/system/redis.service
　　数据目录：/var/lib/redis
　　

　　
redis：k/v
　　key：直接ASCII字符串；
　　value：strings, lists, hashes, sets, sorted sets, bitmaps, hyperloglogs
　　

　　To get help about Redis commands type:
　　"help @" to get a list of commands in
　　"help " for help on
　　"help " to get a list of possible help topics
　　"quit" to exit
　　

　　group：
　　@generic, @string, @list, @...可以用tab键进行不全。
　　

　　@string
　　SET
　　GET
　　EXISTS
　　INCR 递增值
　　DECR 递减值
　　SETNX 不存在时设定
　　SETEX 存在时修改
　　INCRBYFLOAT 以浮点数类型向上递增
　　MGET 一次获取多个建的值
　　MSET 一次设定多个键的值
　　

　　@list 注意栈是先进后出的
　　LPUSH 左侧入栈
　　RPUSH 右侧入栈
　　LPOP 左边出栈
　　RPOP 右边出栈
　　LPUSHX栈存在就左入栈
　　RPUSHX栈存在就右入栈
　　LRANGE标定范围内的元素列表
　　LINDEX以指定索引找元素
　　LSET 设定特定索引上的元素的值
　　LLEN 显示指定键的元素长度
　　

　　LREM 删除元素
　　@set
　　SADD 在集合中添加元素，如果集合不存在就创建
　　SPOP 随机弹出一个数据
　　SREM 删除指定的数据
　　SRANDMEMBER 从成员中得到一个或者多个随机成员
　　SINTER交集
　　SUNION并集
　　

@sorted_set　　ZADD
　　ZCARD
　　ZCOUNT
　　ZRANK
　　...
　　

　　@hash
　　HSET 设定一个hash
　　HMSET 一次设定hash的多个字段
　　HGET 获取一个hash
　　HMGET 获取多个hash
　　HKEYS 获取指定hash的所有字段，不列出值
　　HVALS 列出一个hash中的所有值，不列出字段
　　HDEL 删除一个hash的指定的键值
　　HGETALL 获取一个hash的所有的字段和值
　　...
　　

　　members -> {name:jerry, age:17,gender:Female}
　　HKEYS
　　HVALS
　　

　　@pubsub 消息队列
　　PUBLISH
　　SUBSCRIBE
　　UNSUBSCRIBE
　　PSUBSCRIBE
　　PUNSUBSCRIBE
　　...
　　

　　@geo
　　

　　@hyperloglog
　　

　　回顾：
　　

分布式系统两个基础理论：CAP/BASE　　CAP：AP
　　C、A、P：三者其中之二；
　　AP：可用性、分区容错性、弱一致性；
　　BASE：BA，S，E
　　BA：基本可用、S：软状态、E：最终一致性；
　　

　　
分布式系统：
　　分布式存储：
　　NoSQL：
　　kv、document、column families、GraphDB
　　分布式文件系统：文件系统接口
　　分布式存储：API，不能挂载；
　　NewSQL：
　　PingCAP：TiDB(MySQL protocol)... 重构的既能够支持事务，又能够支持分布式系统
　　分布式运算：mapreduce, ...
　　

　　
redis：REmote DIctionary Server
　　数据结构：String, List, Set, sorted_set, Hash, pubsub ...
　　

　　Redis(2)
　　

redis-cli命令：　　Usage: redis-cli ]]
　　

　　-h HOST, 127.0.0.1
　　-p PORT, 6379/tcp
　　-a PASSWORD
　　-n DBID
　　0-15
　　

　　与Connection相关命令：
　　help @connection
　　AUTH
　　ECHO
　　PING
　　QUIT
　　SELECT dbid
　　

　　清空数据库：
　　FLUSHDB：Remove all keys from the current database
　　清空当前数据库；
　　FLUSHALL：Remove all keys from all databases
　　清空所有数据库；
　　

　　
配置和使用Redis：
　　基本配置项
　　网络配置项
　　持久化相关配置
　　复制相关的配置
　　安全相关配置
　　Limit相关的配置
　　SlowLog相关的配置
　　INCLUDES
　　Advanced配置
　　

　　通用配置项：
　　daemonize, supervised, loglevel, pidfile, logfile,
　　databases：设定数据库数量，默认为16个，每个数据库的名字均为整数，从0开始编号，默认操作的数据库为0；
　　切换数据库的方法：
　　SELECT
　　解释：
　　

　　daemonize：是否以守护进程方式运行
　　supervised：是否接受某个进程的管控
　　网络配置项：
　　bind IP
　　port PORT
　　protected-mode
　　tcp-backlog
　　unixsocket
　　timeout：连接的空闲超时时长；
　　

安全配置：　　requirepass
　　rename-command
　　在AOF或Replication环境中，不推荐使用；防止到另一环境中命令不识别；
　　

　　Limits相关的配置：
　　maxclients
　　maxmemory
　　maxmemory-policy noeviction
　　淘汰策略：volatile-lru, allkeys-lru, volatile-random, allkeys-random, volatile-ttl, noeviction
　　maxmemory-samples 5
　　淘汰算法运行时的采样样本数；采样是看哪个快过期或随机取等
　　

　　SlowLog相关的配置:
　　slowlog-log-slower-than 10000 超出10毫秒就记录为慢日志，以方便优化
　　单位是微秒；
　　slowlog-max-len 128
　　SlowLog记录的日志最大条目；
　　

　　ADVANCED配置：
　　hash-max-ziplist-entries 512 存储的最大的键值对数
　　hash-max-ziplist-value 64 每一个value不能太长，为64字节
　　

　　设置ziplist的键数量最大值，每个值的最大空间；
　　

　　client-output-buffer-limit normal 0 0 0 正常连接redis服务器复制数据，服务器缓冲
　　

　　区有多大；
　　client-output-buffer-limit slave 256mb 64mb 60redis从服务器复制数据客户端
　　client-output-buffer-limit pubsub 32mb 8mb 60 客户端订阅了服务器的发行服务
　　最大不能超过此值
　　可以超过此值
　　超过上值最多使用多长时间
　　

redis-cli命令：　　Server相关的命令：
　　CLIENT GETNAME 给本次连接设置名字
　　*CLIENT KILL
　　CLIENT KILL
　　*CLIENT LIST 列出所有的连接
　　CLIENT PAUSE
　　CLIENT PAUSE timeout
　　CLIENT REPLY
　　CLIENT SETNAME：Set the current connection name
　　

　　SHUTDOWN 设置强制或同步磁盘关闭客户端
　　

　　配置参数可运行时修改：
　　

　　CONFIG GET获取指定参数的值
　　CONFIG RESETSTAT 重置统计计数器
　　CONFIG REWRITE将内存修改写到磁盘文件
　　CONFIG SET设置内存生效的参数
　　

　　INFO：服务器状态信息查看；分为多个secion；
　　INFO
　　

　　
Redis的持久化:
　　RDB：snapshotting, 二进制格式；按事先定制的策略，周期性地将数据从内存同步至磁盘；数据文件默认为dump.rdb；
　　客户端显式使用SAVE或BGSAVE命令来手动启动快照保存机制；
　　SAVE：同步，即在主线程中保存快照，此时会阻塞所有客户端请求；
　　BGSAVE：异步；backgroud
　　记录每次写操作至指定的文件尾部实现的持久化；当redis重启时，可通过重新执行文件中的命令在内存中重建出数据库；
　　BGREWRITEAOF：AOF文件重写；重写是直接从内存快照之后进行重构命
　　

　　令，使得原来的多个重复操作一步到一个值。更加简化高效
　　不会读取正在使用AOF文件，而是通过将内存中的数据以命令的方式保存至临时文件中，完成之后替换原来的AOF文件；在重启服务时将记录的命令操作执行一遍。优点是不会丢失数据或丢失数据很少，而缺点是如计数器的操作记录要进行很多次，不如直接设置计数器的值。
　　

RDB相关的配置：　　*save
　　

　　save 900 1
　　save 300 10
　　save 60 10000
　　save 5200000
　　

　　表示：三个策略满足其中任意一个均会触发SNAPSHOTTING操作；900s内至少有一个key有变化，300s内至少有10个key有变化，60s内至少有1W个key发生变化；
　　

　　stop-writes-on-bgsave-error yes
　　dump操作出现错误时，是否禁止新的写入操作请求；快照有错，禁止用户写入操
　　
作；
　　

　　rdbcompression yes
　　rdbchecksum yes
　　

　　dbfilename dump.rdb：指定rdb文件名
　　*dir /var/lib/redis：rdb文件的存储路径
　　

　　AOF相关的配置
　　*appendonly no
　　appendfilename "appendonly.aof"
　　

　　*appendfsync
　　Redis supports three different modes:
　　no：redis不执行主动同步操作，而是OS进行；
　　everysec：每秒一次；
　　always：每语句一次；
　　

　　no-appendfsync-on-rewrite no
　　是否在后台执行aof重写期间不调用fsync，默认为no，表示调用；
　　

　　auto-aof-rewrite-percentage 100
　　auto-aof-rewrite-min-size 64mb
　　上述两个条件同时满足时，方会触发重写AOF；与上次aof文件大小相比，其增长量超过100%，且大小不少于64MB;
　　

　　aof-load-truncated yes
　　

　　注意：持久机制本身不能取代备份；应该制订备份策略，对redis库定期备份；
　　

　　RDB与AOF同时启用：
　　(1) BGSAVE（快照）和BGREWRITEAOF不会同时进行；
　　(2) Redis服务器启动时用持久化的数据文件恢复数据，会优先使用AOF；
　　

　　
复制：
　　特点：
　　一个Master可以有多个slave主机，支持链式复制；
　　Master以非阻塞方式同步数据至slave主机；
　　

　　配置slave节点：
　　redis-cli> SLAVEOF
　　redis-cli> CONFIG SET masterauth
　　

　　配置参数：
　　*slaveof
　　*masterauth
　　

　　slave-serve-stale-data yes是否使用旧的数据响应用户
　　slave-read-only yes 从节点只用于用户的读，用户不能直接在从节点上写
　　*repl-diskless-sync no网络不好时基于磁盘慢慢复制
　　no, Disk-backed, Diskless
　　

　　新的从节点或某较长时间未能与主节点进行同步的从节点重新与主节点通信，需要做“full synchronization"，此时其同步方式有两种style：
　　Disk-backend：主节点新创建快照文件于磁盘中，而后将其发送给从节点；网络慢时使用
　　Diskless：主节占新创建快照后直接通过网络套接字文件发送给从节点；为了实现并行复制，通常需要在复制启动前延迟一个时间段；
　　

　　repl-diskless-sync-delay 5延迟一会会，准备好并行传输
　　repl-ping-slave-period 10
　　

　　*repl-timeout 60
　　

　　repl-disable-tcp-nodelay no 如果复制字节数太少，不延迟等待字节多了发送
　　repl-backlog-size 1mb 请求后援队列
　　

　　*slave-priority 100
　　复制集群中，主节点故障时，sentinel应用场景中的主节点选举时使用的优先级；数字越小优先级越高，但0表示不参与选举；
　　

　　min-slaves-to-write 3：主节点仅允许其能够通信的从节点数量大于等于此处的值时接受写操作；
　　min-slaves-max-lag 10：从节点延迟时长超出此处指定的时长时，主节点会拒绝写入操作；数据量相差大
　　

　　
sentinel：
　　主要完成三个功能：监控、通知、自动故障转移主故障，从变主，依靠sentinel判断，最
　　

　　好将sentinel和redis不要放到一台主机
　　

选举：流言协议、投票协议　　

　　配置项：
　　

　　bind 0.0.0.0必须写，不然不能进行故障转移
　　port 26379
　　sentinel monitor
　　sentinel auth-pass
　　

表示sentinel集群的quorum机制，即至少有quorum个sentinel节点同时判定主节点故障时，才认为其真的故障；奇数个　　s_down: subjectively down
　　o_down: objectively down
　　

　　sentinel down-after-milliseconds
　　监控到指定的集群的主节点异常状态持续多久方才将标记为“故障”；
　　

　　sentinel parallel-syncs
　　指在failover过程中，能够被sentinel并行配置的从节点的数量；
　　

　　sentinel failover-timeout
　　sentinel必须在此指定的时长内完成故障转移操作，否则，将视为故障转移操作失败；单位为毫秒；
　　

　　sentinel notification-script
　　通知脚本，此脚本被自动传递多个参数；
　　

　　redis-cli -h SENTINEL_HOST -p SENTINEL_PORT
　　redis-cli>
　　SENTINEL masters
　　SENTINEL slaves
　　SENTINEL failover
　　SENTINEL get-master-addr-by-name
　　注意：如果从变成主，主要想成为从，需要加上从的配置；
　　
CLuster：
　　集群相关的配置：
　　

　　先关闭服务，停止主从
　　cluster-enabled 是否开启集群配置
　　cluster-config-file 集群节点集群信息配置文件,每个节点都有一个,由redis生成和更新,配置时避免名称冲突
　　cluster-node-timeout 集群节点互连超时的阈值，单位毫秒
　　cluster-slave-validity-factor 进行故障转移时,salve会申请成为master。有时slave会和master失联很久导致数据较旧，这样的slave不应该成为master。这个配置用来判断slave是否和master失联时间过长。
　　

配置过程：　　(2) 启动redis后为每个节点分配slots；
　　CLUSTER ADDSLOTS
　　注意：每个slot要独立创建；可用范围是0-16383，共16384个；
　　在执行以下分配狭槽的命令执行前必须确保每个节点都没有数据，也没有分配过插槽
　　

　　rm -rf /var/lib/redis/redis-cluster.conf 删除集群配置文件
　　rm -rf /var/lib/redis/dump.rdb删除节点数据
　　redis-cli -c -h 192.168.1.100 -p 7000 cluster addslots {0..5000}
　　(3) 设定集群成员关系；
　　CLUSTE MEET
　　注意：只是单纯的集群，并没有对主从复制进行配置；测试时由于不是智能客户端，所以需
　　要在访问到本地时才能测试成功
　　set nikey hi
　　之后再对每个节点单独做主从就可以了
　　

redis的集群技术：　　客户端分片
　　代理分片：
　　豌豆荚：codis
　　twitter：twemproxy
　　redis cluster
　　官方实现
　　

　　需要redis3.0或者更高版本
　　优点：
　　无中心的P2P Gossip分散式模式
　　更少的来回次数并降低延迟
　　自动于多个redis节点进行分片
　　不需要第三方软件支持协调机制
　　缺点
　　依赖于redis3.0或更高版本
　　没有后台界面
　　需要智能客户端
　　redis客户端必须支持redis cluster架构
　　较codis有更多的维护升级成本
　　

博客作业：　　(1) replication, sentinel，cluster
　　(2) rdb, aof
　　

　　课外实践：
　　(1) codis
　　(2) cerberus
　　

　　听课总结：
　　1、从下到上的工作流程：运维工程师-->DBA-->业务流程-->应用管理；现在的大型站点如京东等，都是一个电商网站上调用了很多的其他服务，这些服务有如支付宝系统、短信发送服务等这些服务通过设计的业务流程进行相互调用，返回结果；
　　2、结构化数据：关系型数据库SQL；如mysql等，要数据的改变需要先进行检查约束条件是否满
　　足；这极大的消耗了时间；效率低下；由此引出了半结构化数据；NOSQL数据库，键值数据库，此数据结构可以进行分布式数据的按片冗余，每个机器放一部分数据，有副本。文档存储；非结构化数据使用文件系统存储数据，挂载或客户端访问，分布式文件系统需要借助于FUSE协议模块进行挂载；网络分布式文件系统。对象式系统，是将数据和元数据存放到一起的。
　　3、阿里倡导的去IOE计划：I指的是IBM小型机（精简指令集），O指的是Oracle，E是指EMC公
　　司（已经被戴尔收购了）；
　　4、malloc：串行的内存分配器；jemalloc：并行的内存分配器，效率高，用于redis；

页: [1]

运维网's Archiver

Redis存储