文本处理中的tf是什么意思?如何计算?

  统计/机器学习 自然语言处理
0

如题


 

图不二   2017-11-11 12:41



   1个回答 
1

TF是词频的意思,英文是term frequency。就是某个词在某个文章里出现的频率。

通常表示为

TF(w, d) = 词汇w出现的次数 / 文章d总的单词数量。


以中文段落为例,d= “知之为知之 不知为不知”

那么,TF(知, d) = 4 / 10 = 0.4,  TF(为, d) = 2 / 10 = 0.2


桐桐酱   2017-11-11 16:24



相关问题

自然语言处理中的Tf-idf是什么意思   1回答

python里怎么把中文字符串转化为成list   1回答

用python统计字符串中空格的个数   3回答

自然语言处理中的分词是什么意思?   1回答

python去掉中文文本中所有的标点符号   3回答

请问NLP中这种编码方式有没有什么术语?   1回答

word2vec的网络里为什么没有bias偏置项   1回答

gensim训练出的Word2Vec模型每次都不一样   1回答

NLP中的hashing trick是什么?   1回答

laplace光滑什么意思   1回答

两个变量不相关但是也不独立   1回答

为什么所有问答题目看不到   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!