老师,这门课程看的很吃力,可以说是每一节都是脑洞大开,实际上,数据挖掘分析这样的技术我一直在关注,不得其法,从购买书籍到看博客,耗费大量精力,基本上就是多了点谈资,毫无实际意义,这门课程将整个数据分析讲的很透彻,良心产品,几乎涵盖所有内容,我现在有几个比较大的疑问,
在讲的过程中,大部分的数学公式讲的时间很长,大部分都很懵懂,但是最后代码演示,仅一行代码就将前面的数学公式问题解决了,这是不是有点像用手机的不需要知道手机怎样制造,只需要知道用法就可以了,人工智能领域入门门槛越来越低
第二,就是最后一节将的问题,关于海量数据的处理问题,其实spark已经学过了,但是现在学的spark用的是scala语言
pyspark没有接触过,现在的数据大部分都是T级别的,这些数据如果没有spark支持,单机运行是无法工作的,因此不知道是否能够给一些关于pyspark的学习资料推荐,
第三个问题,以前以为学习大数据是大海里找鲸鱼,很有感觉,现在感觉是在太空中开着光速机,速度是很快,但是无法整体理解数据, 直接无从下手,尤其对于新手来说,从那个维度看数据都像是一团乱麻,常常分析出一些毫无用处的信息,数据归一化后,只能交给算法,获取结果了,老师能够给说一下,作为一个新手,面对浩瀚数据,应该以怎样的思维方式,在这样的海量数据,方向错了,就要耗费大量的时间,
真的感谢老师的课程