kafka高性能原因

    • 零拷贝
    • 利用操作系统页缓存,磁盘顺序写
    • 分区、分段、建立索引
    • 生产者、消费者批处理

    Kafka中的ISR、AR又代表什么?ISR的伸缩又指什么
    ISR:In-Sync Replicas 副本同步队列
    AR:Assigned Replicas 所有副本
    ISR是由leader维护,follower从leader同步数据有一些延迟(包括延迟时间replica.lag.time.max.ms和延迟条数replica.lag.max.messages两个维度, 当前最新的版本0.10.x中只支持replica.lag.time.max.ms这个维度),任意一个超过阈值都会把follower剔除出ISR, 存入OSR(Outof-Sync Replicas)列表,新加入的follower也会先存放在OSR中。AR=ISR+OSR。
    Kafka中的HW、LEO、LSO、LW等分别代表什么?

    HW:High Watermark 高水位,取一个partition对应的ISR中最小的LEO作为HW,consumer最多只能消费到HW所在的位置上一条信息
    LEO:LogEndOffset 当前日志文件中下一条待写信息的offset
    HW/LEO这两个都是指最后一条的下一条的位置而不是指最后一条的位置
    LSO:Last Stable Offset 对未完成的事务而言,LSO 的值等于事务中第一条消息的位置(firstUnstableOffset),对已完成的事务而言,它的值同 HW 相同
    LW:Low Watermark 低水位, 代表 AR 集合中最小的 logStartOffset 值