怎么构造商品向量embedding来做推荐系统?

  统计/机器学习 推荐系统    浏览次数:134        分享
1

现在很多都流行做embedding嵌入向量的,比如word2vec的词向量。如果是商品,可以构造类似的商品向量吗?

 

桐桐酱   2019-04-11 10:19



   2个回答 
1

步骤1

    把用户的商品点击行为按时间串起来大序列,序列中的元素即商品。

步骤2

    指定一个时间窗口(比如天),把大序列切分为多个子序列,得到多个用户的多个子序列

步骤3

    选模型训练可得到商品的embedding向量。

这应该是生成的方式之一吧,其他的可以补充。

SofaSofa数据科学社区DS面试题库 DS面经

咸魚   2019-04-11 11:01

嗯嗯,感觉这个方法可行。谢谢! - 桐桐酱   2019-04-11 11:03
我想对商品进行分类,比如针对牛仔裤这个品类进行细分。按照这三个步骤做完后,得到的向量聚类,聚类的效果并不好,降维后从图上看不出明显的类别。 - xwemin   2019-04-11 14:17
这个就不好确定原因了,执行过程太多因素影响。我知道这个思路,不过效果我没有实验过,没有结论。 - 咸魚   2019-04-11 18:01
我实际做了一下羽绒服的数据,取的有购买行为的用户的点击数据,这样可以降低噪音;聚类成两类,明显一类男款一类女款;聚成更多类时看不出明显类特征 - xwemin   2019-04-11 20:02
1

可以借鉴一下airbnb的推荐系统算法,他们用的就是房源embedding。

链接在这里

SofaSofa数据科学社区DS面试题库 DS面经

xiaosu   2019-04-16 11:10



  相关主题

推荐系统中常用的表示相似或者距离的方法有哪些?   1回答

推荐系统里的ALS是什么意思?   2回答

推荐系统算法里的cold start是什么意思?   2回答

余弦相似和内积的意义?   1回答

两个向量的余弦距离大于1?   1回答

Jaccard相似或者Jaccard距离是怎么计算的?   1回答

协同过滤的数据预处理问题   4回答

怎么理解推荐系统中的NDCG?   1回答

推荐系统中的召回(recall)是什么意思?   1回答

推荐系统有哪些常用的评价标准   4回答

余弦相似的定义是什么?怎么计算?   1回答

python里怎么计算jaccard相似   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!