keras加载imdb数据时num_words参数是干嘛的?

  统计/机器学习 自然语言处理 Python 人工神经网络 TensorFlow    浏览次数:286        分享
0

在网上看keras上的教程,其中一个是加载keras自带的imdb电影数据库

imdb.load_data里有个参数num_words,这个是什么意思?

from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
 

yeahyeah   2019-05-14 12:26



   1个回答 
3

num_words=10000的意思是训练集中我们指保留词频最高的前10000个单词。10000名之后的词汇都会被直接忽略,不出现在train_data和test_data中。

SofaSofa数据科学社区DS面试题库 DS面经

tbh   2019-05-14 13:59



  相关主题

为什么Keras和Pytorch都是把模型保存成h5的格式而不是pkl格式?   2回答

keras无法加载imdb文本:Object arrays cannot be loaded when allow_pickle=False   1回答

keras和tensorflow有什么关系?   2回答

训练完keras模型后怎么画出loss和val_loss的对比图?   1回答

keras load_model报错   1回答

keras怎么设置/改动rmsprop的学习率?   1回答

keras.models.Sequential()是一种什么模型   1回答

keras sequential model怎么增加一个dropout层?   1回答

keras里的predict,predict_classes,predict_proba有什么区别?   2回答

怎么在keras中加载MNSIT数据集?   2回答

keras hdf5 從某層輸入數值   1回答

keras模型合并请教   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!