实战课程_慕课网

【讨论题】关于小文件的思考

1.2k

等4人参与

在大数据处理过程中，HDFS上的小问题过多会对整个集群上作业的运行、集群的吞吐量等有很大的影响，请使用Spark SQL的知识去解决小文件问题

提示：

什么是小文件
HDFS为什么不适合存小问题
使用Spark SQL解决小文件的思路以及实现方式

查看完整作业内容

我的作业

去发布

登录后即可发布作业，立即登录

全部作业

数据加载中...

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号