采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,我在做一个目标变量为二分类变量(违约与否)是字段分箱时想用卡方检验来将p值>0.9的两个箱合并,但发现即使期望数与观察数同样差别是1%时不改变分布的情况下仅仅放大10倍100倍,p值就变化巨大。本来p值是百分之90多,放大10被就大幅下降。
问题:统计检验在样本量很大时还适合使用吗?现在很多数据样本量都是以万为单位的。
如果其他条件固定,p值是会随着样本容量的增加而减小。这个就是我在8-10小节讲的内容。p值告诉我们的是统计显著性,但是统计显著了不等于有实际意义。想要评价实际显著性的话,可以使用效应量这个指标,它不会随着样本容量发生大幅度变化。大样本使得小效应也能被检测到(即达到统计显著)。而同样的小效应,在小样本的情况下很难被检测到(即达不到统计显著)。
登录后可查看更多问答,登录/注册
清晰的统计学知识网络+与编程结合的讲解方式+数据可视化展示
812 6
854 5
946 5
822 5
789 4