采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
现在presto,impala等查询引擎可直接访问hdfs,而不用经过rdd,原因是impala这种查询引擎,自带了类似于spark core的计算引擎吗?就是impala与spark sql➕spark core这两个东西合起来是并列关系吗?
Presto、Impala、SparkSQL都是属于SQL on Hadoop的解决方案。
这些框架都是有对应的元数据管理部分,也就是说都具备schema信息的,只要schema与文件系统上的数据对应上,那都有各自的引擎来进行分析的。
懂了,谢谢pk哥,还想冒昧的问下,pk哥接下来会出什么课啊,有点期待。
哈哈哈 感谢支持,一个月内就有新课,先不暴露,哈哈哈
呜呜呜,pk哥的新课呢?😂😂
登录后可查看更多问答,登录/注册
大数据工程师干货课程 带你从入门到实战掌握SparkSQL
1.0k 15
1.0k 14
1.3k 12
1.7k 12
1.3k 11