训练word2vec时移动窗口的大小怎么选择?

  统计/机器学习 自然语言处理 特征选择    浏览次数:3483        分享
0

训练word2vec时移动窗口的大小怎么选择?有时候是5,有时候是3,有时候是10,这个数字一般是怎么选的?

 

dirkdirk   2019-08-22 11:59



   1个回答 
1

一般就是5吧。

window越大,训练越慢。还有一种说法是window越小,得到的结果越关注语法,window越大,得到的结果越关注语意。

SofaSofa数据科学社区DS面试题库 DS面经

zl_pku   2019-08-23 13:52



  相关讨论

gensim里word2vec的window指的是什么?包括的范围是多大?

gensim.models.word2vec模块的LineSentence有什么用?

教程中的利用Word2Vec判断是否是白话

怎么把训练好的bin格式的word2vec模型导入到gensim中使用?

gensim的word2vec模型是skip-gram还是cbow?

word2vec的网络里为什么没有bias偏置项

为什么基于skip-gram的word2vec在低频词汇相比cbow更有效?

gensim训练出的Word2Vec模型每次都不一样

word2vec怎么处理一词多义的情况?

如果不去除stop words,word2vec的结果会受到影响吗?

  随便看看

plt.scatter plot怎么让不同的类别有不同的颜色

tsne被忽视?tsne有什么缺点?

关于方差膨胀因子(VIF)的问题

为什么机器学习中的优化问题很少用到牛顿法?

keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同?