请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

sparksql或者DataFrame大批量修改数据?

scala操作dataframe可以批量修改字段数据吗?比如把DF_1的字段数据替换成DF_2种某个字段的数据。

sparkSQL可以完成这样的操作吗?可是尝试SQL的update根本不行啊。难道sparkSQL不支持update?那岂不是很尴尬。。。。。。

正在回答 回答被采纳积分+3

2回答

Michael_PK 2017-10-13 17:41:44

用个udf函数,也是可以搞定的,但是只是计算的时候操作,并不会把纸写回去

0 回复 有任何疑惑可以回复我~
  • 提问者 asdhjhg #1
    老师我想问,可以直接用Python语言加载HDFS上的parquet文件,再用pandas做可视化操作嘛?我试了试好像pandas操作会有错,这个是不支持还是操作有误?
    回复 有任何疑惑可以回复我~ 2017-10-13 19:53:04
  • 提问者 asdhjhg #2
    老师如果数据出现高度的正偏态分布,那么这个数据需要做什么处理吗?
    回复 有任何疑惑可以回复我~ 2017-10-14 17:25:53
Michael_PK 2017-10-13 17:13:52

spark分布式计算框架,计算,不适合那种修改的

0 回复 有任何疑惑可以回复我~
  • 提问者 asdhjhg #1
    那这种操作如果想要实现,有没有较好的解决方法呢?把大数据存入到数据库再用SQL???
    回复 有任何疑惑可以回复我~ 2017-10-13 17:19:03
  • Michael_PK 回复 提问者 asdhjhg #2
    你可以用spark完成,相当于a数据经过df操作变成b,b就是你要的结果
    回复 有任何疑惑可以回复我~ 2017-10-13 20:13:39
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信