今天我们来写redis最后一篇:redis作为缓存时如何与数据库实现数据一致的问题。
最近看redis看得有点麻了,这篇就简单描述吧
目录
只要使用redis做缓存,就必然存在缓存和DB数据一致性问题。若数据不一致,则业务应用从缓存读取的数据就不是最新数据,可能导致严重错误。比如将商品的库存缓存在Redis,若库存数量不对,则下单时就可能出错,这是不能接受的。
缓存和DB的数据一致性,
包含如下情况:
不符合这两种情况的,都属于缓存和DB数据不一致。
目前常见的方式是先删缓存,再更新数据库,等请求获取缓存时,发现没有,从db获取 ,再重新赋值到缓存,这是最典型的缓存操作;
在正常请求下是不会有问题的,一但并发量起来了,就会产生如下问题
可能发生的问题1:
先删除缓存,数据库还没有更新成功,此时如果读取缓存,缓存不存在,去数据库中读取到的是旧值,缓存不一致发生。
可能发生的问题2:
没有按照规范操作,对于缓存未删除,直接更新数据库,数据库更新成功了,但是缓存更新失败了,导致缓存取到的值是旧值。
对于这个问题,我们公司采取的措施简单粗暴:
这个很明显是有漏洞的,如果在查询的过程中被修改了,就会出现不一致的情况。不过我司并发度没那么高。
我们看到比较多的一种方案是这样的:延时双删
线程1删除缓存,然后去更新数据库
线程2来读缓存,发现缓存已经被删除,所以直接从数据库中读取,这时候由于线程1还没有更新完成,所以读到的是旧值,然后把旧值写入缓存
线程1,根据估算的时间,sleep,由于sleep的时间大于线程2读数据+写缓存的时间,所以缓存被再次删除
如果还有其他线程来读取缓存的话,就会再次从数据库中读取到最新值(不用线程sleep,这个耗线程池)
再一个思路是利用mq
这里可以利用类似于 阿里的canal 中间件模仿slave订阅mqsql的binlog日志,一当日志新增(add,update),就调用mq。不过这种方式需要加中间件,需要耗费mq资源,改动量大,结构也比较复杂。
还有一种简易的方式,就是设置缓存的过期时间,
每次放入缓存的时候,设置一个过期时间,比如5分钟,以后的操作只修改数据库,不操作缓存,等待缓存超时后从数据库重新读取。
如果对于一致性要求不是很高的情况,可以采用这种方案。
这个方案还会有另外一个问题,就是如果数据更新的特别频繁,不一致性的问题就很大了。
在实际生产中,我们有一些活动的缓存数据是使用这种方式处理的。
因为活动并不频繁发生改变,而且对于活动来说,短暂的不一致性并不会有什么大的问题。
这个问题在腾讯云社区有一个比较复杂的讨论: