设想一下,给你几百台机器让你采集日志数据,你应该如何快速高效的实现?

和Flume类似的日志数据采集工具还有Logstash、Filebeat,他们有什么典型区别?如何进行技术选型?

如何开发一个通用的监控程序来监控Flume进程的运行情况,实现监控+预警+自动重启一条龙服务?

如何使用Flume中的自定义拦截器实现数据分目录存储?

如果Flume中内置的sink组件不够用,如何开发自定义的Sink组件实现数据存储?

Flume中哪些地方用到了事务机制?

介绍下Flume

Flume架构

Flume有哪些Source

说下Flume事务机制

介绍下Flume采集数据的原理?底层实现?

Flume如何保证数据的可靠性

Flume传输数据时如何保证数据一致性(可靠性)

Flume拦截器

如何监控消费型Flume的消费情况

Kafka和Flume是如何对接的?

为什么要使用Flume进行数据采集