图像分割(imaging segment) 可以对图片数据进行裁剪,增多训练的数据量么

  统计/机器学习 监督式学习 深度学习 计算机视觉    浏览次数: 258
0

图像分割可以对图片进行裁剪,增加训练的数据量么

 

xiecl   2018-08-28 17:37



   2个回答 
2

图像分割不能从几何空间的维度(长宽高)增加训练数据,比如cnn这类patch based算法,已经用了所有的已定义大小的数据块(patch)。我的理解,图像分割可增加特征信息:

1.一维像素点属于某类/某区域的标签(class/region label)

2.是否是边沿(edge)

3.整个class/region的统计量,比如mean,variance。

我觉得主要看应用,然后设计要添加的信息。

SofaSofa数据科学社区 DS面经 问答 实战

Zealing   2018-08-28 22:01

图像分割的标签也是图像,比如二分类,是一个二值图像,通过裁剪增加训练数据量,应该相应的对标签的图像进行相同裁剪? - xiecl   2018-08-28 22:28
不理解“通过剪裁增加训练数据量”什么意思。图像在几何空间上是以像素为单位,每个像素的特征由RGB变为RGBL,L表示class label,二元时为0/1。 - Zealing   2018-08-28 23:06
剪裁就是对图像去掉一部分,比如通常是左上角之类四个角落,还有中间部分,总共就可以得到五个部分,也就是说数据从一张图片变为了六张,增多训练数据量,比如256*256,就取得[0:240,0:240]然后resize成256*256,那么是不是标签的图像做同样的处理,进行监督训练 - xiecl   2018-08-28 23:27
我觉得xiecl上面这个这个做法OK的,其实是剪裁了边缘外的一些空白,然后再拉伸,其实这个就是是data augmentation的常用方法,Transformation和Scaling - maxroot   2018-08-28 23:40
1. 2D图像其实是一个3维矩阵(height*width*depth),其中depth指特征(feature)的深度,比如RGB。如果你通过segmentation,还可以增加一个label特征,变为RGBL。在2D空间(height*width)上任何变换,RGBL都要保持一致。所以标签L要和RGB做相同的resize和剪裁变换。 2. 你所说的剪裁所增加的信息来至于resize(241x241->256x256),而不是来至于剪裁。resize是data augmentation的一种,本质上是增加了一层固定参数的convolution layer。 3. resize是能提取不同清晰度(resolution)下信息,但是也加入人造的假信息。所以数据实在太少了,可以用;否则慎用。用多少,则要靠经验。 4.如果你是用CNN,可以设计成Unet或pyramid这要的multi-resolution的网络结构,也可以提取不同resolution下的特征。 - Zealing   2018-08-29 00:32
resize(scaling)是常用的data augmentation,但是它对数据的影响比旋转之类的变换要大。我的感觉是,如果你任务是整个图的classification,那可以用resize。如果是每个pixel都有个目标值(regression)的任务,那就要慎用。 你最好详细描述你的任务。 - Zealing   2018-08-29 00:55
1

通常图片数量不够的时候,我们需要增加训练样本的数量,也就是数据增量(data augmentation)。

如果只是随机剪裁的话,可能会造成图片中的信息(轮廓、边缘)不完整。

数据增量的常用方法是旋转图片、翻转图片、增加噪点、调整图片亮度、灰度等等。

SofaSofa数据科学社区 DS面经 问答 实战

maxroot   2018-08-28 22:14



  相关主题

pip install opencv报错   1回答

CNN中reLU层和max pooling层的前后顺序   2回答

如何安装pytorch   2回答

Python中怎么把一个RGB彩色图像转成灰度黑白图像?   3回答

有什么好的方法识别图片中的特殊点呢   1回答

图像处理中rgba是什么意思?   1回答

pip install opencv-python失败,难道非要编译安装?   3回答

怎么根据颜色来计算两个图像的相似度?   2回答

numpy.array转换为图片并显示出来   2回答

一个关于机器学习模型性能的问题。   1回答

数据归一化问题   2回答

用神经网络做二元分类,输出层用Sigmoid还是Softmax?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!