请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

交叉分析等几个问题

老师好,有几个问题想请教一下。

第一,在第四章交叉分析时,你用的是独立T检验,为什么要用这种检验方法呢?还有没有其他方法可以用呢?

第二,在第六章讲算法模型时,聚类和关联用的不是之前的HR的数据,是不是因为这两种是非监督学习?我想问一下,能不能用聚类算法研究HR表的数据?

另外,我有一个问题想请教老师,我现在有些数据,是一些大型互联网公司所涉及的热门技术领域,index是一些公司名称,column是一些热门技术的名称(例如大数据),我感觉没法标标签,所以应该用非监督学习。我想用聚类,不知道可不可行?希望老师指点一下技术(是不是要降维等等)!

打扰老师了,提前祝老师中秋节快乐!!

正在回答 回答被采纳积分+3

1回答

途索 2018-09-22 22:58:41

同学你好,回答你的几个问题:

1、常用的几种检验方法:独立T检验用于两个相互独立的变量间的分布相关性检验,课程里所讲到的例子也正是如此,我们想看的销售部与技术部的离职分布,这两个部门变量即是独立的;对应的还有一个配对样本T检验,用在同一个变量,在不同条件下的检验分析,如药物对于症状的对比实验;另外就是卡方检验,卡方检验一般也可以用在分布相关性的比较上,不过检验的对象一般是构成比,比如,课程里介绍的四格表,我们检验的是两组对象所占总体的比例分布,是不是相关。

2、用聚类研究HR表可以一试,这以把是否离职这一项去掉,试试能不能聚成两拨。这个同学要是有什么实验成果,欢迎反馈。

同学你好,非监督学习是个不错的切入点,既然都是技术名称,那不妨试试关联算法(就是啤酒-尿布那个算法),找找频繁项多的几个组合,这些组合或许就可以分出门类了。

希望能帮到你。

海上升明白,天涯共此时。

咱们中秋都快乐!

1 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信