jieba.cut中use_paddle是什么模式?

  统计/机器学习 自然语言处理 Python    浏览次数:745        分享
0

jieba.cut分词时可以设置use_paddle,这种情形下的分词是什么模式的?与默认的方式有什么不同吗?

 

囫囵吞枣   2020-07-14 23:27



   1个回答 
1

精确模式:试图将句子最精确的切开,适合文本分析;

全模式: 把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;

搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。

paddle模式: 预先利用PaddlePaddle,训练的序列标注模型来实现分词,支持词性标注;paddle模式使用需安装paddlepaddle-tiny

SofaSofa数据科学社区DS面试题库 DS面经

seven   2020-07-24 15:43



  相关主题

gensim里word2vec的window指的是什么?包括的范围是多大?   1回答

怎么把英文字符串转为小写(python)?   2回答

gensim.models.word2vec模块的LineSentence有什么用?   1回答

wordcloud安装报错error: Microsoft Visual C++ 14.0 is required   1回答

有个一万段文字 有一个关键词列表 找出文字中含有关键词的那些文字   1回答

怎么把训练好的bin格式的word2vec模型导入到gensim中使用?   1回答

jieba分词怎么用?   1回答

用python统计字符串中空格的个数   3回答

如何用python统计一个txt文本的行数   3回答

python里实现词云的package   3回答

gensim的word2vec模型是skip-gram还是cbow?   1回答

怎么判断一句中文话语是否通顺   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!