请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

日志文件多的问题

就说一个文件,如果今天早上读取了这个日志文件,读取完了,也统计完了,然后第二天,往这个日志文件中新写入的数据,如果说第二天还要重新统计一下日志数据,第二天之前的数据,还需要重新统计吗?就不能复用之前的统计结果,加第二天的统计,就得出当前的统计结果了,这样可以吗?还是说要重新统计?如果有多个日志文件怎么办,日志文件是按天生成的。这么多日志文件怎么办?每次统计,所有的日志文件,都需要重新统计一次吗?

正在回答

2回答

第二天的日志不可能写到昨天的日志中去,每天的日志都在各自的目录下的

0 回复 有任何疑惑可以回复我~
  • 提问者 慕仙4974986 #1
    非常感谢!
    回复 有任何疑惑可以回复我~ 2018-11-02 13:42:39
提问者 慕仙4974986 2018-11-02 13:45:30

多个文件的日志怎么统计,因为日志是不断产生的,因为日志的处理都是离线处理,新的日志文件产生后,要和老的日志文件,再次从新开始统计吗?原来的问题问了好几个,能认真回家一下吗?

0 回复 有任何疑惑可以回复我~
  • 1)请描述下何谓不认真的回答??
    2)离线处理就是处理完一批就完了,和下一批有关系吗?比如说账单每天出的,难道第二天的账单还和第一天的有关系?你描述的那些话,不外乎新老数据如何累加,正常需求就不需要累加,如果你的需要是要累加那就累加不就行了。 
    3)一个日志文件和多个日志文件有区别吗?直接spark可以读取一个多个文件进行处理
    回复 有任何疑惑可以回复我~ 2018-11-02 14:33:04
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信