采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
请教老师,假如我有1万关键词要统计,用scala写,需要用到多线程并发运行吗?还是一个个循环,spark本身能解决分布式并行?
spark本身就是分布式计算框架,如果yarn那就是跑在hadoop集群上。
那统计1个关键词不用搞多线程是搞,可以用for 循环就可以了?
那统计1万多个关键词不用搞多线程是搞,可以用for 循环就可以了?
回字有八种写法,只要能满足你的需求,选择自己认为可以的实现就可以了。没有对错只有是否合适
登录后可查看更多问答,登录/注册
大数据生态圈实用框架(Spark/Hbase/Redis/Hadoop)整合应用及调优
1.7k 21
1.3k 11
2.2k 11
1.6k 11
1.8k 11
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号