【讨论题】如何处理缺失值
773
等16人参与

在实际场景中,我们拿到的数据通常是不完美的,比如存在缺失值。在这一章的最后,我们介绍了几种简单的处理缺失值的方法。其中,我们谈到了可以使用均值、中位数、众数、最大值、最小值等来对缺失值进行替代。现在,请大家思考:在面对缺失值的时候,如何决定应该使用均值、中位数、众数、最大值、还是最小值来进行替代呢?你可以分别举一个例子来说明吗?使用这种简单的替代法有哪些优缺点呢?

此外,除了简单的替代法,请大家查阅资料来探索还有哪些更“高级”的对缺失值进行处理的方法呢?它们各自有哪些优缺点呢?

简单提示:

(1)使用其他变量做出对当前变量的预测模型,然后对缺失值做出预测。

(2)对变量进行转化:例如把“性别”这一变量转化成三个变量,分别代表“是否男”、“是否女”、“是否缺失值”。

我的作业
去发布

登录后即可发布作业,立即

全部作业

数据加载中...

意见反馈 帮助中心 APP下载
官方微信