采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
这个地方我也没搞明白。如果是按照PPT里讲的,意思应该是虽然不知道列名和类型,但是可以推导出来。
推导是有前提的:json或者parquet之类的,不是所有的都能推导出来,你试想下,给你一个普通文本,能推导出来什么呢
第二种字段个数无所谓了,在开发中你想咋定义就咋定义
我看了下文档和讲义,第一种把case类定死了就是这几个字段和类型。第二种是在编程中可以任意增加,比如解析日志的字段,如果只取5个可以加5个,如果需要增加一个那么代码里直接加就行。但是如果这样好像case类方法也是可以做到增加的。最后得出结论应该是case类这种情况如果只是这个方法使用一次跟编程差别不大。如果要在好多地方复用,那么两者差别就是后者可以灵活定义,而前者即便有变动也是所有使用的地方都变。不知理解对不对。
case class有些版本最多只支持22个字段,这时候就体现出来另外一种的价值了
老师,那就是说两种方法的最大区别就在于,个数。第二个没有个数限制。 这些和知不知道列名,都没有关系,因为列名都是自己定义的,想显示什么就显示什么。
登录后可查看更多问答,登录/注册
快速转型大数据:Hadoop,Hive,SparkSQL步步为赢
1.6k 6
1.7k 6
1.9k 1
1.2k 21
1.5k 18