采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
我的理解是,如果把机器学习看作 y = f(x) 在线学习可简单看作 变量y可以继续当作自变量x输入到function()中, 而强化学习是不断改变f()本身。
不知这种理解是否正确,谢谢。
大赞思考!
不过整体不完全正确。对于在线学习,不完全是 y 当做 x。因为每当我们看见新的数据(新的 x),就会产生新的 y,这些新的 x 和 新的 y,都是新的信息,都是会再次扔进 f 中。其实,在线学习的过程,f 就会改变。因为机器学习的本质,就是通过数据,求出 f。数据变了,f 就会变,但其实本质是 f 的参数在变。
强化学习可以理解成是一种在线学习,但同时,比在线根据新的数据更新 f 的参数要复杂很多。具体因为这个课程不涉及强化学习,所以我不深入介绍了。这篇文章是一个很好的参考:https://zhuanlan.zhihu.com/p/52727881
继续加油!:)
非常感谢!
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.4k 19
3.4k 17
2.9k 15
1.6k 15
1.4k 14