把矩阵$V$分解成$WH$两个矩阵的乘积,黄色那部分的迭代公式是怎么得到的?
1个回答
原始论文是algorithms-for-non-negative-matrix-factorization。
一般的gradient descent算法下,
其中$\eta_{a\mu}$是步长。
当每个变量步长不同时,
第6等式可变为第4等式
然后论文在数学上证明此方法收敛。
我没有仔细看证明,感觉上是变步长的gradient descent。还不知道(4)和(6)哪个收敛速度更快。
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
推荐系统里的ALS是什么意思?
3回答
pointwise和pairwise推荐排序算法的区别是什么?
0回答
余弦相似和内积的意义?
1回答
两个向量的余弦距离大于1?
1回答
部分主元
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!