大家好,最近公司在做一个项目,大致场景如下:
在摄像头范围内(摄像头离用户手还有点距离,可以认为是小物体),用户手上会拿着一个商品(例如可乐,零食,纸巾),算法可以实时检测到,现在算法已经弄好了,但是数据标注是大问题(现在是比较原始的录制一段视频标注一段视频),想问下有没更好的标注方式
我了解到有些办法拍商品的各个角度图片(大概7-10张,上下左右都有),然后就可以生成这个商品的各个角度图片,然后就可以直接用来训练了(效率快了N倍),但是不知道具体怎么弄,有朋友知道吗?
(付费告知也行)
1个回答
你说的就是根据照片进行三维重建吧,这个研究应该挺多的,如果你没接触过的话,得好好摸索摸索。
维基百科英文3D reconstruction from multiple images
百度百科三维重建
简书上得综述三维重建初探(整理的一些资料及论文分享)
数据集的话,你可以自己搜索datasets for 3d reconstruction,估计能搜出一些,符不符合你的需求就不知道了
感觉也不是三维重建,我的想法是:有一个三维模型可以无限生成二维的数据集,然后不断训练。和简书说的二维转三维不是一件事,我的思路是训练和预测时还是二维的,而三维是用来降低数据标注成本的一个途径。
-
gzchen
2019-10-22 14:29