采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
请教老师,假如我有1万关键词要统计,用scala写,需要用到多线程并发运行吗?还是一个个循环,spark本身能解决分布式并行?
spark本身就是分布式计算框架,如果yarn那就是跑在hadoop集群上。
那统计1个关键词不用搞多线程是搞,可以用for 循环就可以了?
那统计1万多个关键词不用搞多线程是搞,可以用for 循环就可以了?
回字有八种写法,只要能满足你的需求,选择自己认为可以的实现就可以了。没有对错只有是否合适
登录后可查看更多问答,登录/注册
大数据生态圈实用框架(Spark/Hbase/Redis/Hadoop)整合应用及调优
1.3k 21
883 11
1.7k 11
1.1k 11
1.4k 11