怎么构造商品向量embedding来做推荐系统?

  统计/机器学习 推荐系统 应用场景    浏览次数:5034        分享
1

现在很多都流行做embedding嵌入向量的,比如word2vec的词向量。如果是商品,可以构造类似的商品向量吗?

 

桐桐酱   2019-04-11 10:19



   2个回答 
1

步骤1

    把用户的商品点击行为按时间串起来大序列,序列中的元素即商品。

步骤2

    指定一个时间窗口(比如天),把大序列切分为多个子序列,得到多个用户的多个子序列

步骤3

    选模型训练可得到商品的embedding向量。

这应该是生成的方式之一吧,其他的可以补充。

SofaSofa数据科学社区DS面试题库 DS面经

咸魚   2019-04-11 11:01

嗯嗯,感觉这个方法可行。谢谢! - 桐桐酱   2019-04-11 11:03
我想对商品进行分类,比如针对牛仔裤这个品类进行细分。按照这三个步骤做完后,得到的向量聚类,聚类的效果并不好,降维后从图上看不出明显的类别。 - xwemin   2019-04-11 14:17
这个就不好确定原因了,执行过程太多因素影响。我知道这个思路,不过效果我没有实验过,没有结论。 - 咸魚   2019-04-11 18:01
我实际做了一下羽绒服的数据,取的有购买行为的用户的点击数据,这样可以降低噪音;聚类成两类,明显一类男款一类女款;聚成更多类时看不出明显类特征 - xwemin   2019-04-11 20:02
1

可以借鉴一下airbnb的推荐系统算法,他们用的就是房源embedding。

链接在这里

SofaSofa数据科学社区DS面试题库 DS面经

xiaosu   2019-04-16 11:10



  相关讨论

cvr和ctr的区别是什么?

想请教机器学习能不能解决一个问题

余弦相似和内积的意义?

推荐系统算法里的cold start是什么意思?

推荐系统中常用的表示相似或者距离的方法有哪些?

pointwise和pairwise推荐排序算法的区别是什么?

推荐系统里的ALS是什么意思?

怎么给推荐结果增加多样性和随机性?

评分卡模型是什么?

两个向量的余弦距离大于1?

  随便看看

分类特征的目标编码是什么意思?

'str' object has no attribute 'decode' 代码运行时有错误呢?请高手帮忙解决

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?

Random Forest可以用来做聚类?

推荐系统算法里的cold start是什么意思?