文本处理中的tf是什么意思?如何计算?

  统计/机器学习 自然语言处理    浏览次数: 421
0

如题


 

图不二   2017-11-11 12:41



   1个回答 
1

TF是词频的意思,英文是term frequency。就是某个词在某个文章里出现的频率。

通常表示为

TF(w, d) = 词汇w出现的次数 / 文章d总的单词数量。


以中文段落为例,d= “知之为知之 不知为不知”

那么,TF(知, d) = 4 / 10 = 0.4,  TF(为, d) = 2 / 10 = 0.2


SofaSofa数据科学社区 DS面经 问答 实战

桐桐酱   2017-11-11 16:24



  相关主题

nlp里的stemming是什么意思?   2回答

文本处理中stop word什么意思   2回答

自然语言处理中的Tf-idf是什么意思   2回答

如何用python统计一个txt文本的行数   3回答

wordcloud安装报错error: Microsoft Visual C++ 14.0 is required   1回答

怎么把英文字符串转为小写(python)?   2回答

用python统计字符串中空格的个数   3回答

python里实现词云的package   3回答

python里怎么把中文字符串转化为成list   1回答

word2vec怎么处理一词多义的情况?   0回答

自然语言处理中的分词是什么意思?   1回答

求推荐条件随机场(CRF)的python package   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!