因为网络波动产生了集群隔离,被隔离的群龙无首的子集群选举产生了新的 leader 。 过了一会儿网络恢复了,这时候整个集群就有两个 leader 。 这种情况出现之后,zk 是发起新的一轮选举重新选出新 leader 吗?
![]() | 1 hangszhang 2020-08-14 13:35:10 +08:00 节点数量为单数,集群隔离之后应该只有一个 leader 吧 |
![]() | 2 linxiaoziruo OP @hangszhang 网络恢复之后两个集群合并了,原来的 leader 和新选举产生的 leader,就是两个 leader 啊 |
![]() | 3 Znemo 2020-08-14 16:32:51 +08:00 @linxiaoziruo 单数节点集群,产生两个集群之后,选取 leader 应该是无法超过法定节点数吧,理论上不应该选不出 leader 嘛。 |
![]() | 4 mosesyou 2020-08-14 17:27:44 +08:00 zk 集群默认选举 leader 要过半节点选票 |
![]() | 5 hangszhang 2020-08-14 17:29:32 +08:00 ![]() @linxiaoziruo zookeeper 会有一个 term 的概念,新的 Leader 的 term 大于老的 Leader,老的 Leader 由于无法达到法定人数,所有不会有新数据产生。当集群合并时,原来的那个 leader 会作为普通节点加入到新的集群中,并且从新的 leader 中同步新的数据。 |
![]() | 6 hangszhang 2020-08-14 17:30:10 +08:00 ren qi 居然还是敏感词汇。。。 |
7 fengjianxinghun 2020-08-14 18:39:27 +08:00 @hangszhang 我在微博打出这 2 个字 ren qi,还被封号了。。 | /tr>
![]() | 8 zhangtao 2020-08-14 19:31:34 +08:00 必定会有一个子集群节点数不够半数以上,所以不会选出来 leader |
9 chihiro2014 2020-08-14 20:12:51 +08:00 看 6.824 去,这个有一集就是讲 ZK 脑裂的 https://www.bilibili.com/video/BV1x7411M7Sf?p=27 |
![]() | 10 des 2020-08-14 20:17:59 +08:00 @hangszhang 人气? |
![]() | 12 hangszhang 2020-08-14 23:41:12 +08:00 @zhangtao 假如有 zk 集群有五个节点,分成了 2 和 3, leader 在 2 里面,那个由 3 个节点组成的集群是能够选出新的 leader 的 |
14 Croxx 2020-08-14 23:48:09 +08:00 via iPhone 这玩意老实看论文吧,细节还是挺多的。 |
16 solider245 2020-08-15 07:17:34 +08:00 纯外行,光看你这个问题描述还以为你要内涵呢。 楼主这个问题感觉有点像当年唐山大地震那样,因为大地震的突然来临,原先的组织基本失效。 目前能够联系到的组员为了保持组织的正常活动,就自发选举一个临时 leader,形成一个新的临时组织来暂行组织任务。老的 leader 如果带着组员找到了临时组织,一般会带着组员和临时组建的组织合并再次形成一个新的临时组织,然后再次选举一个临时 leader 。至于是哪个 leader 当头会根据具体的情况来安排,因为这个都是临时组织,没有合法性。需要上报最后任命下来才会产生最终的有合法性的组织。 大概是这么一个原理吧,楼主可以参考一下,错误的地方还请自行纠正。 |
18 laoyur 2020-08-15 10:44:21 +08:00 中文环境要讨论点技术问题都这么难 |