采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
像一般的系统,用户的各种操作请求都有对应的日志记录。可不可以直接让flume采集这些业务日志数据?如果可以那如何采集呢?采集这些文件的内容应该不会有什么性能方面的影响
同学你好
用户的各种操作请求日志都可以使用Flume进行采集,例如nginx,flume就是通过监听nginx的accessLog日志,来进行日志的采集,其他的组件的日志也是通过类似的方法来采集,监听日志文件或监听一个文件夹。
其次是flume有事务机制,所以保证了数据不会丢失,其次通过flume的多级代理,通常我们会使用2级代理,也就将多个的flume采集到的日志,统一流转到下一级的flume , 由这一级的flume统一处理存储等的操作,这是提高flume性能的其中一种做法。
提高flume性能的另一种做法是使用flume自己本身负载均衡机制
以上是我的回答,希望能解决到你的疑问,祝学习愉快!
非常感谢老师的细致回复!明白!
登录后可查看更多问答,登录/注册
一门既讲算法原理又有完整的推荐系统架构的全能课
887 8
518 7
907 6
1.3k 6
743 6