NLP里的OOV是什么意思?

  统计/机器学习 自然语言处理 开放问题    浏览次数:900        分享
0

NLP里的OOV是什么意思?经常看到这个OOV,但是也没有人写出全称。

 

特兰克斯   2019-05-09 06:34



   2个回答 
4

在自然语言处理或者文本处理的时候,我们通常会有一个字词库(vocabulary)。这个vocabulary要么是提前加载的,或者是自己定义的,或者是从当前数据集提取的。

假设之后你有了另一个的数据集,这个数据集中有一些词并不在你现有的vocabulary里,我们就说这些词汇是Out-of-vocabulary,简称OOV。

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2019-05-15 11:42

谢谢 - 特兰克斯   2019-05-16 10:36
1

OOV就是out-of-vocabulary,不在词库里的意思。

SofaSofa数据科学社区DS面试题库 DS面经

wxw_pku   2019-05-09 11:56

谢谢 - 特兰克斯   2019-05-16 10:36


  相关主题

自然语言处理中的分词是什么意思?   1回答

word2vec怎么处理一词多义的情况?   3回答

求推荐条件随机场(CRF)的python package   1回答

数据批量分析提取,求指点迷津   4回答

如果不去除stop words,word2vec的结果会受到影响吗?   0回答

文本处理中的tf是什么意思?如何计算?   1回答

nlp里的stemming是什么意思?   2回答

教程中的利用Word2Vec判断是否是白话   1回答

怎么判断一句中文话语是否通顺   1回答

自然语言处理中的Tf-idf是什么意思   2回答

文本处理中stop word什么意思   2回答

“阅读需要X分钟”这个功能是如何实现的?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!