请问老师
a = sc.parallelize([1, 2, 3])
b = sc.parallelize([3, 4, 5])
a.union(b).collect()返回[1,2,3,3,4,5],而a.union(b).distinct().collect()返回一个[4, 1, 5, 2, 3]
b.union(a).collect()返回[3,4,5,1,2,3],而b.union(a).distinct().collect()返回一个[4, 5, 1, 2, 3]
返回值是python的list不是set,所以请问老师去重的顺序是什么?特别是第一个,[1,2,3,3,4,5]去重后返回了[4,1,5,2,3]这个东西,看了一眼distinct的代码,没什么头绪,请老师 解惑。