请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

数据清洗问题

2016-11-10 00:01:02 - 813 183.162.52.7

2016-11-10 00:01:02 - 0 10.100.0.1

2016-11-10 00:01:02 http://www.imooc.com/code/1852 2345 117.35.88.11

如何在存储数据的时候把前2个不存储,就是把url等于-和traffic=0的过滤掉

正在回答 回答被采纳积分+3

插入代码

2回答

慕粉0909169327 2018-09-02 21:42:18

我写了一个,不是特别优雅,但是经测试能用,供你参考 val rdd1 = access.map... rdd1.filter(line=>{ val words = line.split("\t") !(words(1) == "-" || words(2) == "0") }).coalesce(1,false).saveAsTextFile("file:///D:/scalatest/formatoutput")

2 回复 有任何疑惑可以回复我~
提问者 少帅521 2018-07-26 21:00:18

我想知道如何在代码编写使用filter(),如何操作,老师

0 回复 有任何疑惑可以回复我~
  • 函数式编程使用链式编程风格就行了,map后就跟着filter,你想过滤啥就过滤啥,建议补习下scala的高阶函数
    回复 有任何疑惑可以回复我~ 2018-07-26 21:41:41
  • 我写了一个,不是特别优雅,但是经测试能用,供你参考
    val rdd1 = access.map...
    rdd1.filter(line=>{
          val words = line.split("\t")
          !(words(1) == "-" || words(2) == "0")
        }).coalesce(1,false).saveAsTextFile("file:///D:/scalatest/formatoutput")
    回复 有任何疑惑可以回复我~ 2018-08-30 13:05:43
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号