①.、首先我们谈一下为什么Redis快:
? 第一段:?Redis是纯内存数据库,一般都是简单的存取操作,线程占用的时间很多,时间的花费主要集中在IO上,所以读取速度快.
?第二段:?再说一下IO,Redis使用的是非阻塞IO,IO多路复用,使用了单线程来轮询描述符,将数据库的开、关、读、写都转换成了事件,减少了线程切换时上下文的切? 换和竞争.
? ? ? ? 多路 I/O 复用模型是利用select、poll、epoll可以同时监察多个流的 I/O 事件的能力,在空闲的时候,会把当前线程阻塞掉,当有一个或多个流有I/O事件时,就从阻塞态中唤醒,于是程序就会轮询一遍所有的流(epoll是只轮询那些真正发出了事件的流),并且只依次顺序的处理就绪的流,这种做法就避免了大量的无用操作.这里"多路"指的是多个网络连接,"复用"指的是复用同一个线程.采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求(尽量减少网络IO的时间消耗),且Redis在内存中操作数据的速度非常快(内存内的操作不会成为这里的性能瓶颈),主要以上两点造就了Redis具有很高的吞吐量.
?
?第三段: Redis采用了单线程的模型,保证了每个操作的原子性,也减少了线程的上下文切换和竞争.
?第四段:另外,数据结构也帮了不少忙,Redis全程使用hash结构,读取速度快,还有一些特殊的数据结构,对数据存储进行了优化,如压缩表,对短数据进行压缩存储? ? ? ,再如,跳表,使用有序的数据结构加快读取的速度.
?第五段:还有一点,Redis采用自己实现的事件分离器,效率比较高,内部采用非阻塞的执行方式,吞吐能力比较大.
上述讲到Redis是基于内存操作的,那服务器宕机了,那不是全完了,所以Redis有自己的持久化操作,下面我们来讲讲Redis的持久化.
①.、RDB机制:
? ? ? 原理:RDB是默认开启的,会按照配置的指定时间将内存中的数据快照到磁盘中,创建一个dump.rdb文件,redis启动时再恢复到内存中.redis会单独创建fork()一个子进程,将父进程的数据复制到子进程的内存中,然后由子进程写入到临时文件,再用这个临时文件替换上次的快照文件,然后子进程退出,释放内存.
? ? 注意:每次快照持久化都会讲主进程的数据复制一遍,会导致内存开销加倍,若此时内存不足,则会阻塞服务器运行,直到复制结束释放内存;如果数据量过大,而且写操作频繁,必然会引起大量的磁盘操作,严重影响性能,并且最后一次持久化会消失.(顺便一提,影响Redis的性能主要是磁盘操作)
? ? ?原理:以日志的形式记录每个写操作(读操作不记录),只需追加文件但不可改写文件,redis启动时会根据日志从头到尾全部加载到内存中.
RDB又存在哪些劣势呢?
①.). 如果你想保证数据的高可用性,即最大限度的避免数据丢失,那么RDB将不是一个很好的选择.因为系统一旦在定时持久化之前出现宕机现象,此前没有来得及写入磁盘的数据都将丢失.
AOF的劣势有哪些呢?
①.). 对于相同数量的数据集而言,AOF文件通常要大于RDB文件.RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快.
二者选择的标准,就是看系统是愿意牺牲一些性能,换取更高的缓存一致性(aof),还是愿意写操作频繁的时候,不启用备份来换取更高的性能,待手动运行save的时候,再做备份(rdb).rdb这个就更有些 eventually consistent的意思了.
在Redis的配置文件中存在三种同步方式,它们分别是:
appendfsync always? #每次有数据修改发生时都会写入AOF文件.
appendfsync everysec? #每秒钟同步一次,该策略为AOF的缺省策略.
appendfsync no?? #从不同步.高效但是数据不会被持久化.