采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,你好,连续变量和离散变量之间的相关性是分别计算。那么在实际工作中,我们去分析变量之间的流程是怎么样的呢?是分别计算连续变量和离散变量的相关性?然后再分析连续变量和离散变量的相关性?具体流程是怎样的呢?同时连续变量和离散变量之间的相关性是用什么指标呢?
同学你好,在实际的使用场景中,计算哪些因子的相关性,是根据具体的业务需求来的。比如,在本例中,我们想了解公司离职与其它各个因子的相关关系,就需要把离职属性与各个属性都拿出来,分别根据离散或者连续的特性,进行计算。如果你对工资和入司时长间的关系有兴趣,也可以拿这两个出来进行计算。在公司,在一个分析型业务中,计算哪些变量之间的关系,一般由产品经理或者其它需求方提出。当然,你也可以自己把所有属性两两之间根据离散或者连续进行相关对比,一并输出,也是Ok的。
连续变量和离散变量之间的相关性考量,可以有以下几种思路:一是把连续值离散化,或者把离散值连续化,再进行对比;二是根据离散值对数据集进行分群,然后对各个群进行卡方分析、方差分析等假设检验类的分析,得到它们的差异是否显著,如果差异较大,说明离散值与连续值有较大的相关联系。
非常感谢!
登录后可查看更多问答,登录/注册
快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!
1.6k 18
1.4k 13
1.3k 10
1.5k 9
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号