采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
bobo老师,你好。现在我做一个任务,根据n个特征来预测pm2.5的数值。 这里记所有特征为x,pm2.5的值为y。我们可以对每个特征做标准化/归一化。我想问y可以做标准化/归一化吗? 个人觉得不可以。
如果是线性回归,对 y 做 标准化/归一化 不会影响整体模型,只是模型的系数做了一个缩放。可以参考这里:https://coding.imooc.com/learn/questiondetail/vQW1lPEpb5k6yE9A.html
如果是其他回归模型(比如用随机森林做回归最),可能没有这种变换前后的映射关系,所以不建议对 y 做 标准化/归一化 处理。除非从业务层面(应用层面),你们有这个需求。(相当于要预测的是一个新的 y)
整体而言,对于机器学习应用来说(只关注预测结果的好坏),不需要对 y 做处理。
继续加油!:)
我现在用的是一个全连接的神经网络。 pm2.5(y)的值大多集中在100左右。如果不对y做标准化/归一化,训练中mse loss会比较大,大约在50-100之间。但是如果对y做了标准化/归一化(我做的是减去均值,除以标准差),训练中mse loss就会很小,大约在10的-2次方左右。 我完全无法理解这个现象。不知道为什么。
r^2 呢?mse 是有单位的。
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
2.9k 15
1.6k 15
1.4k 14