图像识别和深度学习中的“组合爆炸”是什么意思?

  统计/机器学习 深度学习 计算机视觉 人工神经网络    浏览次数:323        分享
0

图像识别和深度学习中的“组合爆炸”是什么意思?

求指教!

 

烙神经   2019-03-05 14:01



   1个回答 
5

和grid search调参里的组合爆炸基本上是一个意思。比如有5个超参要调,每个超参有10个候选值,组合起来的话就有$10^5=100000$个可能性要尝试。

在图像识别里也差不多,比如要识别图像里的一类物品,它可能颜色不同,材质不同,不同拍照的角度看到的形状不同,不同光照效果下的样子也不同,另外还有出现遮挡的情况,考虑到种种情况,组合在一起,每类物品就需要指数级别的训练集。图像识别一般是多分类的。对数据量的要求就非常非常大了。

这个例子是当猴子被不同物体遮挡时,预测结果都不佳。左图是猴子被判断为人;中图是猴子被判断为人,单车被判断成鸟;右图也是类似的。

这是因为训练集中并没有出现猴子与这些物体同时出现的图像,造成模型准确度下降。但是我们也无法做到把这些所有可能的组合的图像都放入训练集,组合爆炸的结果就是数据集需求量暴增。

SofaSofa数据科学社区DS面试题库 DS面经

岛歌   2019-03-14 14:03

明白了,谢谢! - 烙神经   2019-03-16 14:44


  相关主题

CNN中reLU层和max pooling层的前后顺序   2回答

Resnet-18, Resnet-50, Resnet-101这些模型里的数字是什么意思?   1回答

如何安装pytorch   2回答

pip install opencv报错   1回答

图像分割(imaging segment) 可以对图片数据进行裁剪,增多训练的数据量么   2回答

卷积层的padding一般都是零吗?   2回答

yolov3-tiny一个maxpool层算出的结果为什么和pytorch上的公式不一样   1回答

图像处理中rgba是什么意思?   1回答

有什么好的方法识别图片中的特殊点呢   1回答

cifar-10数据集是有哪十类?   1回答

关于video saliency detection的一些问题   0回答

Python中怎么把一个RGB彩色图像转成灰度黑白图像?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!