可以把多个文档、段落向量直接加和求平均来获得新的表示向量吗?

  统计/机器学习 无监督学习 深度学习 自然语言处理    浏览次数:865        分享
0

        请教一下了解这方面内容的前辈:

        比如说我现在有多个段落的表示向量,我现在想用某种方法把它们聚合起来,形成整篇文档的表示向量,有什么方法可以比较好地实现这个目的呢?我知道有把词向量求平均来获得句向量的方法,那么能否用相同的方法对一个文档向量进行更新呢?或者如果有相关的其他方法的文献请前辈告知一下~谢谢!

 

leeeein   2019-08-07 11:19



   1个回答 
0

可以直接用doc2vec得到整篇文章的vector representation么?

也可以按照你说的,直接求平均值。

SofaSofa数据科学社区DS面试题库 DS面经

abuu   2019-08-07 15:47



  相关主题

请问汉字CNN识别,怎么做标签呢?   3回答

不同mini-batch的LSTM_cell之间的隐藏状态(hidden state)和记忆单元(memory cell)的确定   1回答

潜语义分析中,向量空间的表示是从哪里变换到哪里?   1回答

python随机打乱文本   3回答

如何确定LDA主题模型中的主题个数?   1回答

text CNN的输入训练样本有什么要求?   1回答

学习auto-encoder, 自己写的demo, 关于拟合的问题,帮忙看下loss-acc图?   2回答

auto-encoder异常检测的问题,无标签情况下怎么进行预测?   2回答

为什么GAN是非监督的?   2回答

文本处理中的tf是什么意思?如何计算?   1回答

文本处理中stop word什么意思   2回答

自然语言处理中的Tf-idf是什么意思   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!