Bellman equation里没有梯度下降为什么会有学习率?

  统计/机器学习 强化学习    浏览次数: 60
0

Q learning的迭代过程需要用到Bellman equation。Bellman equation其中一个变量是学习率,但是这个式子本身并没有涉及到梯度或者梯度下降的概念,为什么会有学习率呢?

 

wxjjnss   2018-12-02 13:32



   1个回答 
1

学习率和梯度下降算法并没有直接关系。学习率是指模型根据新样本更新模型参数的“速率”。

比如Q-learning里就是根据一个新的数据点(新的行为和奖励),来更新Q-table里的数值;如果学习率太大,新样本的权重就太大,忽略了历史数据的作用。

SofaSofa数据科学社区 DS面经 问答 实战

Marvin_THU   2018-12-07 12:34

谢谢 - wxjjnss   2018-12-08 14:35


  相关主题

Q-learning里的Q是什么意思?   1回答

关于DQN训练速度慢的问题   0回答

关于张量运算,求问框框部分运算是怎么计算的?具体运算规则是怎样的?   1回答

RBF核的多参数体现在哪?   2回答

关于node.js的问题   1回答

获取DataFrame所占空间的大小   2回答

pymongo多线程报错Address already in use   1回答

请问python已知某个元素,怎么得到该元素在dataframe中的位置   1回答

Jupyter中InteractiveShell.ast_node_interactivity = "all"有什么用?   1回答

python里清除已经定义过的变量   1回答

python里求累计和   2回答

gc.collect()返回值是什么意思   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!