请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

回归问题中y能否归一化/标准化处理

bobo老师,你好。现在我做一个任务,根据n个特征来预测pm2.5的数值。
这里记所有特征为x,pm2.5的值为y。我们可以对每个特征做标准化/归一化。我想问y可以做标准化/归一化吗?
个人觉得不可以。

正在回答 回答被采纳积分+3

1回答

liuyubobobo 2022-01-14 16:39:07

如果是线性回归,对 y 做 标准化/归一化 不会影响整体模型,只是模型的系数做了一个缩放。可以参考这里:https://coding.imooc.com/learn/questiondetail/vQW1lPEpb5k6yE9A.html


如果是其他回归模型(比如用随机森林做回归最),可能没有这种变换前后的映射关系,所以不建议对 y 做 标准化/归一化 处理。除非从业务层面(应用层面),你们有这个需求。(相当于要预测的是一个新的 y)


整体而言,对于机器学习应用来说(只关注预测结果的好坏),不需要对 y 做处理。


继续加油!:)

0 回复 有任何疑惑可以回复我~
  • 提问者 慕运维9331189 #1
    我现在用的是一个全连接的神经网络。
    pm2.5(y)的值大多集中在100左右。如果不对y做标准化/归一化,训练中mse loss会比较大,大约在50-100之间。但是如果对y做了标准化/归一化(我做的是减去均值,除以标准差),训练中mse loss就会很小,大约在10的-2次方左右。
    我完全无法理解这个现象。不知道为什么。
    回复 有任何疑惑可以回复我~ 2022-01-16 14:05:05
  • liuyubobobo 回复 提问者 慕运维9331189 #2
    r^2 呢?mse 是有单位的。
    回复 有任何疑惑可以回复我~ 2022-01-16 14:49:47
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信