采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
2016-11-10 00:01:02 - 813 183.162.52.7
2016-11-10 00:01:02 - 0 10.100.0.1
2016-11-10 00:01:02 http://www.imooc.com/code/1852 2345 117.35.88.11
如何在存储数据的时候把前2个不存储,就是把url等于-和traffic=0的过滤掉
我写了一个,不是特别优雅,但是经测试能用,供你参考 val rdd1 = access.map... rdd1.filter(line=>{ val words = line.split("\t") !(words(1) == "-" || words(2) == "0") }).coalesce(1,false).saveAsTextFile("file:///D:/scalatest/formatoutput")
我想知道如何在代码编写使用filter(),如何操作,老师
函数式编程使用链式编程风格就行了,map后就跟着filter,你想过滤啥就过滤啥,建议补习下scala的高阶函数
登录后可查看更多问答,登录/注册
快速转型大数据:Hadoop,Hive,SparkSQL步步为赢
1.7k 6
1.8k 6
2.0k 1
1.3k 21
1.6k 18
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号