强化学习(增强学习)是监督式学习还是无监督式学习?还是所谓的什么半监督学习?
1个回答
强化学习既不是有监督学习也不是无监督学习。
强化学习是自我强化的,在最开始强化学习没有任何有标签的数据。
但是模型在给出判断或者决策之后,会接受到外界反馈的数据,根据反馈,模型进行学习,然后做出下一次决策/判断,再得到新的反馈,然后这么一直进行下去。
所以强化学习和传统观念里的有监督学习和无监督学习都不一样。
相关主题
怎么理解Self-supervised learning?
2回答
LPA算法问题
1回答
kNN用来做异常点检测?
3回答
聚类问题可以用stacking model的方法吗?
2回答
软聚类,硬聚类?
1回答
谱聚类中的相似矩阵是怎么定义的?
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!