Skip to content

Latest commit

 

History

History
123 lines (62 loc) · 10.4 KB

《吊打面试官系列》-Redis基础知识.md

File metadata and controls

123 lines (62 loc) · 10.4 KB

前言

Redis 在互联网技术存储方面使用如此广泛,几乎所有的后端技术面试官都要在Redis的使用和原理方面对小伙伴们进行 360° 的刁难和询问。

这里给大家总结梳理了最基础的 Redis 面试题。

面试开始

一个满脸油光,穿着格子衬衣的中年男子,拿着一个满是划痕的 mac 向你走来,看着稀疏的发量,心想着肯定是尼玛是顶级架构师吧!但是我们腹有诗书气自华,虚都不虚。

Q1:小伙子您好,看你简历上写了你项目里面用到了 Redis,你们为啥用Redis?

心里忍不住暗骂,这叫啥问题,大家不都是用的这个嘛,但是你不能说出来。

认真回答道:帅气迷人的面试官您好,因为传统的关系型数据库如 MySQL 已经不能适用所有的场景了,比如秒杀的库存扣减,APP 首页的访问流量高峰等等,都很容易把数据库打崩,所以引入了缓存中间件,目前市面上比较常用的缓存中间件有 RedisMemcached 不过中和考虑了他们的优缺点,最后选择了 Redis。

Q2:那小伙子,我再问你,Redis 有哪些数据结构呀?

StringHashListSetSortedSet

这里我相信聪明的你都能回答上来Redis的5个基本数据类型。如果回答不出来的小伙伴我们就要加油补课哟,大家知道五种类型最适合的场景更好。

但是,如果你是 Redis 中高级用户,而且你要在这次面试中突出你和其他候选人的不同,还需要加上下面几种数据结构 HyperLogLog、Geo、Pub/Sub

如果你还想加分,那你说还玩过Redis Module,像BloomFilter,RedisSearch,Redis-ML,这个时候面试官得眼睛就开始发亮了,心想这个小伙子有点东西啊

Q3:如果有大量的 key 需要设置同一时间过期,一般需要注意什么?

如果大量的 key 过期时间设置的过于集中,到过期的那个时间点,Redis 可能会出现短暂的卡顿现象。严重的话会出现缓存雪崩,我们一般需要在时间上加一个随机值,使得过期时间分散一些。

电商首页经常会使用定时任务刷新缓存,可能大量的数据失效时间都十分集中,如果失效时间一样,又刚好在失效的时间点大量用户涌入,就有可能造成缓存雪崩

Q4:那你使用过Redis分布式锁么,它是什么回事?

先用 setnx 来争抢锁,抢到之后,在用 expire 给锁加一个过期时间防止忘记了锁释放。

Q5:接着问如果在setnx之后执行expire之前进程意外crash或者要重启维护了,那会怎么样?

这个时候先给予一个惊讶的反馈:哎,是哦,这样的话锁就永远得不到释放了,紧接着你需要抓一抓自己的脑袋,故作思考片刻,好像接下来的结果是你主动思考出来的,然后回答:我记得set指令有非常复杂的参数,可以把 setnx 和 expire 合成一条指令来用。

Q6:对方这时会显露笑容,心里开始默念:嗯,这小子还不错,开始有点意思了。假如 Redis 里面有 1 亿个 key,其中有 10w 个 key 是以某个固定的已知的前缀开头的,如何将它们全部找出来?

使用 keys 指令可以扫描出指定模式的 key 列表。

Q7:对方接着追问:如果这个 redis 正在给线上的业务提供服务,那使用keys 指令会有什么问题?

这个时候你要回答 Redis 关键的一个特性:Redis 的单线程的。keys 指令会导致线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候可以使用 scan 指令,scan 指令可以无阻塞的提取出指定模式的 key 列表,但是会有一定的重复概率,在客户端做一次去重就可以了,但是整体所花费的时间会比直接用keys 指令长。

不过,增量式迭代命令也不是没有缺点的:举个例子, 使用 SMEMBERS 命令可以返回集合键当前包含的所有元素, 但是对于 SCAN 这类增量式迭代命令来说, 因为在对键进行增量式迭代的过程中, 键可能会被修改, 所以增量式迭代命令只能对被返回的元素提供有限的保证 。

Q8:使用过Redis做异步队列么,你是怎么用的?

一般使用 list 结构作为队列,rpush 生产消息,lpop 消费消息。当 lpop 没有消息的时候,要适当 sleep 一会再重试。这样的话不但客户端的 CPU 能降下来,Redis 的 QPS 也降下来了。

Q9:如果对方追问可不可以不用 sleep 呢?

list 还有个指令叫 blpop,在没有消息的时候,它会阻塞住直到消息到来。

Q10:如果对方接着追问能不能生产一次消费多次呢?

使用 pub/sub 主题订阅者模式,可以实现 1:N 的消息队列。

Q11:如果对方继续追问 pub/sub 有什么缺点?

在消费者下线的情况下,生产的消息会丢失,得使用专业的消息队列 MQ 等。

如果面试官继续追问,为什么会丢失?这个时候你暗暗一笑,还好之前做了准备,不紧不慢的回答:

在 Redis5 之前版本存在如下两个关键问题:

(1)Redis 的 PubSub 消息不会持久化,Redis 宕机后消息就会被抛弃。

(2)Redis 的消息队列没有太多高级特性,没有 ack 保证,可靠性不高。

这样如果消费者没有 ack 就挂掉,重启后无法再处理这个消息,导致消息丢失。

Q12:如果对方穷极追问 Redis 如何实现延时队列?

这一套连招下来,我估计现在你很想把面试官一棒KO(面试官自己都想打死自己了怎么问了这么多自己都不知道的),如果你手上有一根棒球棍的话,但是你很克制。平复一下激动的内心,然后神态自若的回答道:使用sortedset,拿时间戳作为 score,消息内容作为 key 调用 zadd 来生产消息,消费者用 zrangebyscore 指令获取N 秒之前的数据轮询进行处理。

Q13:Redis 是怎么持久化的?服务主从数据怎么交互的?

RDB 做镜像全量持久化,AOF 做增量持久化。因为 RDB 会耗费较长时间,不够实时,在停机的时候会导致大量丢失数据,所以需要 AOF 来配合使用。在 redis 实例重启时,会使用 RDB 持久化文件重新构建内存,再使用 AOF 重放近期的操作指令来实现完整恢复重启之前的状态。

这里很好理解,把 RDB 理解为一整个表全量的数据,AOF 理解为每次操作的日志就好了,服务器重启的时候先把表的数据全部搞进去,但是他可能不完整,你再回放一下日志,数据不就完整了嘛。不过 Redis 本身的机制是 AOF 持久化开启且存在 AOF 文件时,优先加载 AOF 文件;AOF 关闭或者 AOF 文件不存在时,加载 RDB 文件;加载 AOF/RDB 文件城后,Redis 启动成功;AOF/RDB 文件存在错误时,Redis 启动失败并打印错误信息

Q14:对方追问那如果突然机器掉电会怎样?

取决于 AOF 日志 sync 属性的配置,如果不要求性能,在每条写指令时都 sync一下磁盘,就不会丢失数据。但是在高性能的要求下每次都 sync 是不现实的,一般都使用定时 sync,比如 1s1 次,这个时候最多就会丢失 1s 的数据。

Q15:对方追问RDB的原理是什么?

你给出两个词汇就可以了,fork和cow。fork是指redis通过创建子进程来进行RDB操作,cow指的是copy on write,子进程创建后,父子进程共享数据段,父进程继续提供读写服务,写脏的页面数据会逐渐和子进程分离开来。

注:回答这个问题的时候,如果你还能说出AOF和RDB的优缺点,我觉得我是面试官在这个问题上我会给你点赞,两者其实区别还是很大的,而且涉及到Redis集群的数据同步问题等等。

Q16:Pipeline 有什么好处,为什么要用 pipeline?

可以将多次 IO 往返的时间缩减为一次,前提是 pipeline 执行的指令之间没有因果相关性。使用redis-benchmark 进行压测的时候可以发现影响 redis 的 QPS 峰值的一个重要因素是 pipeline 批次指令的数目。

Q17:Redis的同步机制了解么?

Redis 可以使用主从同步,从从同步。

第一次同步时,主节点做一次 bgsave,并同时将后续修改操作记录到内存 buffer,待完成后将 RDB 文件全量同步到复制节点,复制节点接受完成后将 RDB 镜像加载到内存。加载完成后,再通知主节点将期间修改的操作记录同步到复制节点进行重放就完成了同步过程。后续的增量数据通过 AOF 日志同步即可,有点类似数据库的 binlog。

Q18:是否使用过Redis集群,集群的高可用怎么保证,集群的原理是什么?

Redis Sentinal(哨兵) 着眼于高可用,在master宕机时会自动将slave提升为master,继续提供服务。

Redis Cluster(集群) 着眼于扩展性,在单个redis内存不足时,使用Cluster进行分片存储。

总结

在技术面试的时候,不管是Redis还是什么问题,如果你能举出实际的例子,或者是直接说自己开发过程的问题和收获会给面试官的印象分会加很多,回答逻辑性也要强一点,不要东一点西一点,容易把自己都绕晕的。

还有一点就是我问你为啥用Redis你不要一上来就直接回答问题了,你可以这样回答:

帅气的面试官您好,首先我们的项目DB遇到了瓶颈,特别是秒杀和热点数据这样的场景DB基本上就扛不住了,那就需要缓存中间件的加入了,目前市面上有的缓存中间件有 RedisMemcached ,他们的优缺点……,综合这些然后再结合我们项目特点,最后我们在技术选型的时候选了谁。

如果你这样有条不紊,有理有据的回答了我的问题而且还说出这么多我问题外的知识点,我会觉得你不只是一个会写代码的人,你逻辑清晰,你对技术选型,对中间件对项目都有自己的理解和思考,说白了就是你的offer有戏了。

文章参考:吊打面试官系列-Redis基础