请稍等 ...

请教老师，假如我有1万关键词要统计，用scala写，需要用到多线程吗？

请教老师，假如我有1万关键词要统计，用scala写，需要用到多线程并发运行吗？还是一个个循环，spark本身能解决分布式并行？

慕函数0552834 2019-10-25 19:52:00

源自：4-17 功能开发之完成第一个指标的统计分析

724

收起

提交取消

1回答

Michael_PK 2019-10-25 20:07:24

spark本身就是分布式计算框架，如果yarn那就是跑在hadoop集群上。

0 回复有任何疑惑可以回复我~

收起回答

提问者慕函数0552834 #1

那统计1个关键词不用搞多线程是搞，可以用for 循环就可以了？

回复有任何疑惑可以回复我~ 2019-10-25 20:12:28

提问者慕函数0552834 #2

那统计1万多个关键词不用搞多线程是搞，可以用for 循环就可以了？

回复有任何疑惑可以回复我~ 2019-10-25 20:12:55

Michael_PK 回复提问者慕函数0552834 #3

回字有八种写法，只要能满足你的需求，选择自己认为可以的实现就可以了。没有对错只有是否合适

回复有任何疑惑可以回复我~ 2019-10-25 20:30:14

点开查看后面6条评论

相似问题

要写一个tcping探测工具，asyncio底层实现是不是直接包含了epoll，不需要单独去调用吧？

多路复用select和多线程性能比较，差距也很大吗？

请问老师切入到机器学习领域需要具备哪些基础知识？

Netty可以代替多线程吗？哪些并发代码可以转而使用Netty来简化？

关于进程和线程

登录后可查看更多问答，登录/注册

Spark大数据离线与实时项目实战

参与学习 706 人
解答问题 190 个

大数据生态圈实用框架(Spark/Hbase/Redis/Hadoop)整合应用及调优

了解课程

本课精华内容

问答作业

java.lang.NoSuchMethodError错误

1.8k 21

java.lang.OutOfMemoryError: Java heap space错误

1.4k 11

IDEA 无法访问远程虚拟机的datanode拿到数据

2.3k 11

关于虚拟机设置机器名

1.8k 11

编译支持hadoop2.6.0-cdh5.15.1的spark3.0.0失败

2.0k 11

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

请教老师，假如我有1万关键词要统计，用scala写，需要用到多线程吗？

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

java.lang.NoSuchMethodError错误

java.lang.OutOfMemoryError: Java heap space错误

IDEA 无法访问远程虚拟机的datanode拿到数据

关于虚拟机设置机器名

编译支持hadoop2.6.0-cdh5.15.1的spark3.0.0失败

【讨论题】简历项目问题

【讨论题】数据倾斜的思考

【讨论题】SparkStreaming对接Kafka数据在项

【讨论题】Spark OOM问题

【讨论题】关于Spark RDD核心算子的思考

热搜

最近搜索清空

请教老师，假如我有1万关键词要统计，用scala写，需要用到多线程吗？

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

java.lang.NoSuchMethodError错误

java.lang.OutOfMemoryError: Java heap space错误

IDEA 无法访问远程虚拟机的datanode拿到数据

关于虚拟机设置机器名

编译支持hadoop2.6.0-cdh5.15.1的spark3.0.0失败

【讨论题】简历项目问题

【讨论题】数据倾斜的思考

【讨论题】SparkStreaming对接Kafka数据在项

【讨论题】Spark OOM问题

【讨论题】关于Spark RDD核心算子的思考

正在回答回答被采纳积分+3