gensim.models.word2vec模块的LineSentence有什么用?

  统计/机器学习 自然语言处理 Python    浏览次数:1441        分享
0

gensim.models.word2vec模块的LineSentence有什么用?

 

ziyu   2019-12-29 18:24



   1个回答 
2

LineSentence是按行读取文件中的每一行,

infilename = 'sample_text.txt'
lines = gensim.models.word2vec.LineSentence(infilename, max_sentence_length=10, limit=3)

max_sentence_length是返回的每句话中元素的最大个数,limit=3是说读取sample_text.txt中的前三行。

for line in lines:
    print(line)

你可以用上面的方法把lines里的每句话打印说来。

假如你的文件里一共有8行,第一行有16个词,第二行有8个词,第三行有22个词。那么你lines里最终得到的是六句话,第一句是10个词,第二句是6个词,第三句是8个词,第四句是10个,第五句是10个词,第六句是2个词。

你试试就知道了。

SofaSofa数据科学社区DS面试题库 DS面经

u_u   2020-04-19 22:24



  相关主题

如何用python统计一个txt文本的行数   3回答

怎么把训练好的bin格式的word2vec模型导入到gensim中使用?   1回答

用python统计字符串中空格的个数   3回答

python里实现词云的package   3回答

wordcloud安装报错error: Microsoft Visual C++ 14.0 is required   1回答

gensim里word2vec的window指的是什么?包括的范围是多大?   1回答

有个一万段文字 有一个关键词列表 找出文字中含有关键词的那些文字   1回答

怎么把英文字符串转为小写(python)?   2回答

gensim的word2vec模型是skip-gram还是cbow?   1回答

jieba分词中最大正向匹配法是什么?   1回答

自然语言处理中的Tf-idf是什么意思   2回答

“阅读需要X分钟”这个功能是如何实现的?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!