余弦相似和内积的意义?

  统计/机器学习 推荐系统    浏览次数: 992
0

我们知道余弦相似实际上就是归一化的内积。那归一化的意义在这里是什么意思?如果不归一的话,这个内积的意义又是什么呢?

 

Steven0612   2017-05-15 09:53



   1个回答 
1

它们表达的意思不一样,不能简单的一概而论。


余弦距离只考虑了角度差,内积综合考虑了角度差和长度差。


比如有两个对象A和B,它们的向量表示为$A(1,1,0)$和$B(0,1,1)$,那么它们余弦相似就是$\frac{1}{\sqrt{2}\sqrt{2}}=\frac{1}{2}$。余弦相似不考虑向量的长度,所以$A(1,1,0)$和$C(0,3,3)$的相似程度和$A$与$B$的相同。


但是,如果如果向量的长度本身对相似有真实的影响(在理解含义的情况下),推荐使用内积。比如对商品的几个属性打分,1表示不确定,依次到,5表示很确定,那么$A(1,1,1)$,$B(4,4,4)$,$C(5,5,5)$三个商品,根据内积,$B$与$C$更相似。但是余弦相似在这里就无法区分$A,B,C$的相似性。



高代兄   2017-05-17 11:37



  相关主题

推荐系统中常用的表示相似或者距离的方法有哪些?   1回答

推荐系统算法里的cold start是什么意思?   2回答

推荐系统里的ALS是什么意思?   2回答

两个向量的余弦距离大于1?   1回答

Jaccard相似或者Jaccard距离是怎么计算的?   1回答

协同过滤的数据预处理问题   4回答

推荐系统中的召回(recall)是什么意思?   1回答

推荐系统有哪些常用的评价标准   3回答

怎么理解推荐系统中的NDCG?   1回答

关于pairwise ranking数据预处理的问题   0回答

余弦相似的定义是什么?怎么计算?   1回答

python里怎么计算jaccard相似   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!