图像识别和深度学习中的“组合爆炸”是什么意思?

  统计/机器学习 深度学习 计算机视觉 人工神经网络    浏览次数:3824        分享
1

图像识别和深度学习中的“组合爆炸”是什么意思?

求指教!

 

烙神经   2019-03-05 14:01



   1个回答 
6

和grid search调参里的组合爆炸基本上是一个意思。比如有5个超参要调,每个超参有10个候选值,组合起来的话就有$10^5=100000$个可能性要尝试。

在图像识别里也差不多,比如要识别图像里的一类物品,它可能颜色不同,材质不同,不同拍照的角度看到的形状不同,不同光照效果下的样子也不同,另外还有出现遮挡的情况,考虑到种种情况,组合在一起,每类物品就需要指数级别的训练集。图像识别一般是多分类的。对数据量的要求就非常非常大了。

这个例子是当猴子被不同物体遮挡时,预测结果都不佳。左图是猴子被判断为人;中图是猴子被判断为人,单车被判断成鸟;右图也是类似的。

这是因为训练集中并没有出现猴子与这些物体同时出现的图像,造成模型准确度下降。但是我们也无法做到把这些所有可能的组合的图像都放入训练集,组合爆炸的结果就是数据集需求量暴增。

SofaSofa数据科学社区DS面试题库 DS面经

岛歌   2019-03-14 14:03

明白了,谢谢! - 烙神经   2019-03-16 14:44


  相关讨论

Resnet-18, Resnet-50, Resnet-101这些模型里的数字是什么意思?

CNN中reLU层和max pooling层的前后顺序

VGG16和VGG19的区别?

cnn没有pooling会怎么样?

如何安装pytorch

Pytorch卷积预测,小样本预测误差小,换一个大样本误差就下降不下去了。

pip install opencv报错

卷积层、池化层和droput层的前后顺序是什么?

卷积层的padding一般都是零吗?

CNN中的感受野是什么意思?

  随便看看

numpy.array从行向量转为列向量

matplotlib.pyplot画图的标题中插入变量

sklearn SGDClassifier的partial_fit是什么意思?

pip install opencv-python失败,难道非要编译安装?

如何理解VC dimension?