采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师好,老师在讲LR损失函数,为什么不用平方损失,而是用log损失函数没太明白。是因为平方损失复合上sigmoid再求导,这个导数的数学含义会产生多个波谷,从而产生非凸优化的情况吗? 这个是要手动具体求导一下看吗?
是的 可以简单一看资料 如果平方损失 求导后 是会有sigmod 函数的导数 。sigmod在值较大或较少时候 会让梯度趋近0 让模型木法更新
登录后可查看更多问答,登录/注册
让你掌握一套完整的,能落地的个性化推荐算法体系。可用于毕设。
1.1k 7
998 6
1.0k 6
2.1k 5
899 5