CAP原理告诉我们,一致性,可用性和分区容忍性三者最多只能偏重其中两个。在NoSQL系统中,分区容忍性(P)几乎已经成为必选项。于是很多NoSQL选择了牺牲一定一致性的做法。比如Amazon的Dynamo,比如本文的主角Riak。
下面一介绍的是Riak官方的一篇文章,通过几个典型的故障案例,对Riak的最终一致性原理进行了讲解。
请求过程
首先介绍一下Riak的请求处理过程,以数据冗余N份存储,每次读取其中的R份,写操作需要写W份。
- 通过计算得出请求的key所在的N个节点
- 向这N个节点依次发起请求
- 等待这N个节点中的W个(如果是写操作的)或R个(如果是读操作)返回成功
- 返回相应的数据给客户端
失败场景
下面讨论几种失败场景:
1.读取数据前其中一个节点故障
数据以W=3成功写入三份
其中一个节点故障
数据再以R=3读取三份,发起三个请求
此次读操作会返回了not_found
而这次系统在检测到了数据只有两份,会启动修复器将数据备份一份到secondary节点上,以保证有三份备份
后续的读操作将会从primary上读到两份,从secondary上读到一份数据,以实现成功读到三份数据。
2.读取数据前其中两个节点故障
数据以W=3成功写入三份
其中两个节点故障
数据再以R=3读取三份,发起三个请求
此次读操作会返回了not_found
后续的读操作将会从primary上读到一份,从secondary上读到两份数据,以实现成功读到三份数据。
3.读取数据前三个节点全部故障
数据以W=3成功写入三份
其中三个节点故障
数据读取操作将会永远返回not_found,直到某个节点恢复
4.写操作前一个节点故障
一个节点故障
数据以W=3发起三个写请求
一个secondary节点承担了其中的一个写请求
后面的读请求会正常的读到三份数据
5.写操作前一个节点故障,后来又恢复了
一个节点故障
数据以W=3发起三个写请求
一个secondary节点承担了其中的一个写请求
故障节点又恢复了
在60秒内,一个叫hinted handoff的过程会启动,将secondary中的数据迁移到刚刚恢复的primary中
在hinted handoff过程完成后,数据就恢复正常了
6.在hinted handoff 过程中进行读写操作
在hinted handoff过程中,由于原来的primary节点是启动的,所以数据读写操作都会到这个节点上来执行,这时候可能由于一些值还没有备份回来,所以会导致这个节点暂时的not_found返回。
7.在两个primary节点故障后一个又恢复期间进行读写操作
这时候刚刚恢复的节点会进行hinted handoff过程,而读写操作依然会由于not_found的发生而启动修复器进行数据备份到secordary中。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
OpenWorld18大会:Ellison宣布数据库的搜寻和破坏任务
在旧金山举行的甲骨文OpenWorld 2018大会中,甲骨文首席技术官(CTO)兼创始人Larry Elli […]
-
ObjectRocket着力发展Azure MongoDB服务
MongoDB吸引了微软公司的注意力,微软公司计划针对运行于该公司2017年发布的Azure Cosmos D […]
-
创建NoSQL数据建模符号 企业架构师亲自上阵
新兴的NoSQL数据风格促使创新的应用程序快速发展,但NoSQL同时也带来了挑战。NoSQL系统能够快速投入生产,有时甚至根本不用创建任何的前期模式。
-
深入理解Amazon DynamoDB NoSQL云数据库服务
Amazon DynamoDB NoSQL云数据库即服务主要为跨移动设备、网页web端、游戏、数字营销和物联网领域的应用提供支持。