文本处理中的tf是什么意思?如何计算?

  统计/机器学习 自然语言处理    浏览次数:1258        分享
0

如题


 

图不二   2017-11-11 12:41



   1个回答 
1

TF是词频的意思,英文是term frequency。就是某个词在某个文章里出现的频率。

通常表示为

TF(w, d) = 词汇w出现的次数 / 文章d总的单词数量。


以中文段落为例,d= “知之为知之 不知为不知”

那么,TF(知, d) = 4 / 10 = 0.4,  TF(为, d) = 2 / 10 = 0.2


SofaSofa数据科学社区DS面试题库 DS面经

桐桐酱   2017-11-11 16:24



  相关主题

自然语言处理中的Tf-idf是什么意思   2回答

nlp里的stemming是什么意思?   2回答

“阅读需要X分钟”这个功能是如何实现的?   2回答

怎么判断一句中文话语是否通顺   1回答

jieba分词中最大正向匹配法是什么?   1回答

文本处理中stop word什么意思   2回答

教程中的利用Word2Vec判断是否是白话   1回答

有个一万段文字 有一个关键词列表 找出文字中含有关键词的那些文字   1回答

python里实现词云的package   3回答

gensim的word2vec模型是skip-gram还是cbow?   1回答

wordcloud安装报错error: Microsoft Visual C++ 14.0 is required   1回答

bert里cls和sep分别是什么意思?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!