采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
请问增强学习和在线学习是否有相同之处?不都是通过环境的反馈来不断改进算法吗?
在线学习和增强学习这二者不在一个维度上。
增强学习和监督学习,非监督学习在一个维度上。这个划分是以机器学习处理的问题划分的。监督学习通常就觉得是分类任务或者回归任务;增强学习则解决的是和环境交互产生适当决策的任务(比如无人车,比如AlphaGo下棋任务)
在线学习则和离线学习在一个维度上。这个划分是以算法适应新数据的方式是否需要停止整个机器学习来划分的。离线学习面对新数据,只能停掉整个算法,把新数据纳入训练数据集,重新进行模型的训练,之后才能使用训练出的模型继续进行算法的任务。但是在线学习的过程中,数据是不断地进入算法当中的,算法不需要“离线”就可以适应新的数据。但是,这个在线学习算法做的事情,可能就是监督学习处理的分类问题或者回归问题。
如果说他们的联系,通常,增强学习的算法都是在线的;但在线学习算法不一定是增强学习:)
这个课程以监督学习为主:)
加油!:)
非常感谢!
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.4k 19
3.4k 17
2.9k 15
1.6k 15
1.4k 14