有没有拍商品各个角度(7-10张),就可以无限生成这个商品各个角度的数据集

  统计/机器学习 计算机视觉 应用场景    浏览次数:1971        分享
0

大家好,最近公司在做一个项目,大致场景如下:

在摄像头范围内(摄像头离用户手还有点距离,可以认为是小物体),用户手上会拿着一个商品(例如可乐,零食,纸巾),算法可以实时检测到,现在算法已经弄好了,但是数据标注是大问题(现在是比较原始的录制一段视频标注一段视频),想问下有没更好的标注方式

我了解到有些办法拍商品的各个角度图片(大概7-10张,上下左右都有),然后就可以生成这个商品的各个角度图片,然后就可以直接用来训练了(效率快了N倍),但是不知道具体怎么弄,有朋友知道吗?

(付费告知也行)

 

ccccc   2019-10-21 11:34



   1个回答 
0

你说的就是根据照片进行三维重建吧,这个研究应该挺多的,如果你没接触过的话,得好好摸索摸索。

维基百科英文3D reconstruction from multiple images

百度百科三维重建

简书上得综述三维重建初探(整理的一些资料及论文分享)

数据集的话,你可以自己搜索datasets for 3d reconstruction,估计能搜出一些,符不符合你的需求就不知道了

SofaSofa数据科学社区DS面试题库 DS面经

卡里昂   2019-10-21 15:00

感觉也不是三维重建,我的想法是:有一个三维模型可以无限生成二维的数据集,然后不断训练。和简书说的二维转三维不是一件事,我的思路是训练和预测时还是二维的,而三维是用来降低数据标注成本的一个途径。 - gzchen   2019-10-22 14:29


  相关讨论

cvr和ctr的区别是什么?

想请教机器学习能不能解决一个问题

关于一个视频任务的分类和解决问题探讨

脑纹锁 有开源项目吗

互联网或者业界中的“数据治理”是什么意思?

在数据很大的场景下怎么进行数据探索?

评分卡模型是什么?

fatigue model是什么模型?

商业数据模型中lead score是什么意思?

逻辑回归评分卡案例中的处理过程无法实现对多个特征进行分箱

  随便看看

怎么从矩母函数(mgf)推导得到概率密度函数(pdf)?

随机森林如何调参?

多重检验中的FDR(false discovery rate, 错误发现率)是什么?

NLP里的OOV是什么意思?

怎么对pandas dataframe的列求众数