“Kafka 集群中的 controller、rebalance、HW”的版本间的差异
跳到导航
跳到搜索
Jihongchang(讨论 | 贡献) (建立内容为“https://www.bilibili.com/video/BV1Xy4y1G7zA?p=25”的新页面) |
Jihongchang(讨论 | 贡献) |
||
(未显示同一用户的3个中间版本) | |||
第1行: | 第1行: | ||
https://www.bilibili.com/video/BV1Xy4y1G7zA?p=25 | https://www.bilibili.com/video/BV1Xy4y1G7zA?p=25 | ||
+ | |||
+ | === 1.controller === | ||
+ | |||
+ | * 集群中谁来充当 controller | ||
+ | |||
+ | 每个 broker 启动时会向 ZK 创建一个临时序号节点,获得的序号最小的那个 broker 将会作为集群中的 controller,负责这么几件事: | ||
+ | |||
+ | * 当集群中有一个副本的 leader 挂掉,需要在集群中选举出一个新的 leader,选举的规则是从 isr 集合中最左边获得。 | ||
+ | |||
+ | * 当集群中有 broker 新增或减少,controller 会同步信息给其他 broker | ||
+ | * 当集群中有分区新增或减少,controller 会同步信息给其他 broker | ||
+ | |||
+ | |||
+ | === 2. rebalance 机制=== | ||
+ | https://www.bilibili.com/video/BV1Xy4y1G7zA?p=26 | ||
+ | |||
+ | *前提:消费组中的消费者没有指明分区来消费 | ||
+ | |||
+ | *触发的条件:当消费组中的消费者和分区的关系发生变化的时候 | ||
+ | |||
+ | *分区分配的策略:在 rebalance 之前,分区怎么分配会有这么三种策略 | ||
+ | **range:根据公式计算得到每个消费者消费哪几个分区:前面的消费者是分区总数/消费者数量+1,之后的消费者是分区总数/消费者数量 | ||
+ | **轮询:大家轮着来 | ||
+ | **sticky:粘合策略,如果需要 rebalance,会在之前已分配的基础上调整,不会改变之前的分配情况,如果这个策略没有开,那么就要进行全部的重新分配。建议开启。 | ||
+ | |||
+ | |||
+ | === 3. HW 和 LEO === | ||
+ | https://www.bilibili.com/video/BV1Xy4y1G7zA?p=27 | ||
+ | |||
+ | LEO 是某个副本最后消息的消息位置(log-end-offset) | ||
+ | |||
+ | HW 是已完成同步的位置。消息在写入 broker 时,且每个 broker 完成这条消息的同步后,hw 才会变化。在这之前,消费者是消费不到这条消息的。在同步完成之后,HW 更新之后,消费者才能消费到这条消息,这样的目的是防止消息的丢失。 | ||
+ | [[文件:HW 和 LEO.png|无|缩略图|1200x1200像素]] |
2022年8月29日 (一) 13:53的最新版本
https://www.bilibili.com/video/BV1Xy4y1G7zA?p=25
1.controller
- 集群中谁来充当 controller
每个 broker 启动时会向 ZK 创建一个临时序号节点,获得的序号最小的那个 broker 将会作为集群中的 controller,负责这么几件事:
- 当集群中有一个副本的 leader 挂掉,需要在集群中选举出一个新的 leader,选举的规则是从 isr 集合中最左边获得。
- 当集群中有 broker 新增或减少,controller 会同步信息给其他 broker
- 当集群中有分区新增或减少,controller 会同步信息给其他 broker
2. rebalance 机制
https://www.bilibili.com/video/BV1Xy4y1G7zA?p=26
- 前提:消费组中的消费者没有指明分区来消费
- 触发的条件:当消费组中的消费者和分区的关系发生变化的时候
- 分区分配的策略:在 rebalance 之前,分区怎么分配会有这么三种策略
- range:根据公式计算得到每个消费者消费哪几个分区:前面的消费者是分区总数/消费者数量+1,之后的消费者是分区总数/消费者数量
- 轮询:大家轮着来
- sticky:粘合策略,如果需要 rebalance,会在之前已分配的基础上调整,不会改变之前的分配情况,如果这个策略没有开,那么就要进行全部的重新分配。建议开启。
3. HW 和 LEO
https://www.bilibili.com/video/BV1Xy4y1G7zA?p=27
LEO 是某个副本最后消息的消息位置(log-end-offset)
HW 是已完成同步的位置。消息在写入 broker 时,且每个 broker 完成这条消息的同步后,hw 才会变化。在这之前,消费者是消费不到这条消息的。在同步完成之后,HW 更新之后,消费者才能消费到这条消息,这样的目的是防止消息的丢失。