全部问题问题热门未解答所有标签标签收藏收藏我要提问

可以把多个文档、段落向量直接加和求平均来获得新的表示向量吗？

统计/机器学习无监督学习深度学习自然语言处理浏览次数：1955 分享

二维码

手机扫描二维码

案例分析面试常见题？

请教一下了解这方面内容的前辈：

比如说我现在有多个段落的表示向量，我现在想用某种方法把它们聚合起来，形成整篇文档的表示向量，有什么方法可以比较好地实现这个目的呢？我知道有把词向量求平均来获得句向量的方法，那么能否用相同的方法对一个文档向量进行更新呢？或者如果有相关的其他方法的文献请前辈告知一下~谢谢！

leeeein 2019-08-07 11:19

1个回答

可以直接用doc2vec得到整篇文章的vector representation么？

也可以按照你说的，直接求平均值。

SofaSofa数据科学社区 DS面试题库 DS面经

abuu 2019-08-07 15:47

相关讨论

请问汉字CNN识别，怎么做标签呢？

收集了一批网站的html源码，想对html进行特征提取，或者分类，请问有什么比较好的方法推荐？

潜语义分析中，向量空间的表示是从哪里变换到哪里？

不同mini-batch的LSTM_cell之间的隐藏状态(hidden state)和记忆单元(memory cell)的确定

如何确定LDA主题模型中的主题个数？

python随机打乱文本

text CNN的输入训练样本有什么要求？

自然语言处理中的Tf-idf是什么意思

为什么GAN是非监督的？

随便看看

keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同？

kNN算法有哪些缺点？

sklearn中的predict_proba方法的返回值的意义

python直方图y轴显示占比，而不是绝对数值

线性回归需要满足哪些基本前提假设