keras加载imdb数据时num_words参数是干嘛的?

  统计/机器学习 自然语言处理 Python 人工神经网络 TensorFlow    浏览次数:56        分享
0

在网上看keras上的教程,其中一个是加载keras自带的imdb电影数据库

imdb.load_data里有个参数num_words,这个是什么意思?

from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)
 

yeahyeah   2019-05-14 12:26



   1个回答 
0

num_words=10000的意思是训练集中我们指保留词频最高的前10000个单词。10000名之后的词汇都会被直接忽略,不出现在train_data和test_data中。

SofaSofa数据科学社区DS面试题库 DS面经

tbh   2019-05-14 13:59



  相关主题

keras load_model报错   1回答

keras.models.Sequential()是一种什么模型   1回答

keras里的predict,predict_classes,predict_proba有什么区别?   2回答

怎么在keras中加载MNSIT数据集?   2回答

keras模型合并请教   2回答

keras里layer默认的激活函数是什么?   1回答

keras中怎么增加Leaky relu的激活层   1回答

tensorflow里出现的strides是什么意思   1回答

tf.placeholder(tf.float32, shape=(None, 1024))中的None是什么意思   1回答

tensorflow 训练的时候输出nan   1回答

一维数据怎么输入卷积网络。   2回答

tf.placeholder和tf.variable什么区别?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!