非序列数据(任务),针对种类型特征可以用embedding技术吗?

  统计/机器学习 深度学习 数据降维    浏览次数:2392        分享
0

我的理解embedding必须在序列任务中,例如文本序列、用户行为序列等等,

但是好像“万物皆可embedding”,针对非序列数据(任务),种类型特征可以用embedding技术吗?

 

dzzxjl   2019-11-26 19:17



   1个回答 
2

embedding的思想是从文本处理那里开始爆发到各个应用的。

文本上的embedding主要是两类,一类就是你说的序列的,比如word2vec那种,一类就是词袋模型,比如LSA那种。

比如你做商品embedding的时候,如果你没有用户的浏览顺序,你可以认为一个购物车里的所有商品都是一个词袋。

SofaSofa数据科学社区DS面试题库 DS面经

sasa   2019-11-27 01:23

谢谢你的回答~最后一句不是很理解,“一个购物车里的所有商品都是一个词袋”,如果把购物车里面的所有商品看做一个词袋,怎么得到每件商品的embedding呢?不是很理解,希望能得到您的解答 - dzzxjl   2019-11-27 16:20
LSA词袋模型就是把一句话当作词汇的集合,不在乎集合内词汇的顺序。购物车也是类似的,不考虑购物车内物品的顺序,就当作一个大的集合。 - 我小宋   2019-12-26 10:22


  相关讨论

为什么LDA降维最多降到类别数k-1?

python里怎么实现t-SNE降维?

分类变量,进行One hot编码,维度升高,如何处理?

低维嵌入(low dimension embedding)是什么意思?

hashing trick或者feature hashing是什么

什么时候应该用isomap降维方法?

三维以上聚类都要先降维?10维数据直接聚类然后silhouette判断效果可以吗?

t-SNE如何实现降维?

维数大于样本数的问题

怎么评价tSNE的降维效果?

  随便看看

为什么图的拉普拉斯矩阵的最小特征值一定是0?

seaborn.distplot直方图的y轴的数值是什么意思?

逻辑回归的损失函数是怎么来的

VGG16和VGG19的区别?

怎么在jupyter notebook里查看python的版本?