Riak的最终一致性实现原理

日期: 2011-06-26 作者:nosqlfan 来源:TechTarget中国 英文

  CAP原理告诉我们,一致性,可用性和分区容忍性三者最多只能偏重其中两个。在NoSQL系统中,分区容忍性(P)几乎已经成为必选项。于是很多NoSQL选择了牺牲一定一致性的做法。比如Amazon的Dynamo,比如本文的主角Riak。

  下面一介绍的是Riak官方的一篇文章,通过几个典型的故障案例,对Riak的最终一致性原理进行了讲解。

  请求过程

  首先介绍一下Riak的请求处理过程,以数据冗余N份存储,每次读取其中的R份,写操作需要写W份。

  •   通过计算得出请求的key所在的N个节点
  •   向这N个节点依次发起请求
  •   等待这N个节点中的W个(如果是写操作的)或R个(如果是读操作)返回成功
  •   返回相应的数据给客户端

  失败场景

  下面讨论几种失败场景:

  1.读取数据前其中一个节点故障

  数据以W=3成功写入三份

  其中一个节点故障

  数据再以R=3读取三份,发起三个请求

  此次读操作会返回了not_found

  而这次系统在检测到了数据只有两份,会启动修复器将数据备份一份到secondary节点上,以保证有三份备份

  后续的读操作将会从primary上读到两份,从secondary上读到一份数据,以实现成功读到三份数据。

  2.读取数据前其中两个节点故障

  数据以W=3成功写入三份

  其中两个节点故障

  数据再以R=3读取三份,发起三个请求

  此次读操作会返回了not_found

  后续的读操作将会从primary上读到一份,从secondary上读到两份数据,以实现成功读到三份数据。

  3.读取数据前三个节点全部故障

  数据以W=3成功写入三份

  其中三个节点故障

  数据读取操作将会永远返回not_found,直到某个节点恢复

  4.写操作前一个节点故障

  一个节点故障

  数据以W=3发起三个写请求

  一个secondary节点承担了其中的一个写请求

  后面的读请求会正常的读到三份数据

  5.写操作前一个节点故障,后来又恢复了

  一个节点故障

  数据以W=3发起三个写请求

  一个secondary节点承担了其中的一个写请求

  故障节点又恢复了

  在60秒内,一个叫hinted handoff的过程会启动,将secondary中的数据迁移到刚刚恢复的primary中

  在hinted handoff过程完成后,数据就恢复正常了

  6.在hinted handoff 过程中进行读写操作

  在hinted handoff过程中,由于原来的primary节点是启动的,所以数据读写操作都会到这个节点上来执行,这时候可能由于一些值还没有备份回来,所以会导致这个节点暂时的not_found返回。

  7.在两个primary节点故障后一个又恢复期间进行读写操作

  这时候刚刚恢复的节点会进行hinted handoff过程,而读写操作依然会由于not_found的发生而启动修复器进行数据备份到secordary中。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

nosqlfan
nosqlfan

相关推荐