关于地震数据预处理的几点疑问。

  板凳区 Sofa竞赛8    浏览次数: 663
0

我应该是第一个提交数据集吧,当时是下午在公司看到,快下班了,就直接处理里面文本转换成离散的数字label

然后u盘复制回家随便找了个模型跑了下0.74(0.74是排行榜上的,感觉那个测评指标自己写轮子有点麻烦,懒就没写,测试集直接用准确率了)。

今天闲了,研究了一下测试集,发现几个有意思东西,但也没想到解决对策。

首先是震后楼层会比震前楼层多,我没搞明白...........(train里有,test也有)

其次是震后高度比震前高度高(难道是地震把地壳顶起来了?,不过测楼不是应该只关心地表高度吗)

或者说都是错误数据?

其次就是震前高度,有99(100多个),还有两个一百多米,这个应该是错误值了吧,不过又一看,码的,震后都是0米,修复建议都是重建,。。。。。。。。。难道确实是太高了???

wtf!

 

陈十一   2018-05-10 16:25



   3个回答 
0

我单纯地觉得只是数据脏,noise多

SofaSofa数据科学社区 DS面经 问答 实战

黄前志   2018-05-10 22:31

0

在公司里玩这个,也是服了你啊

SofaSofa数据科学社区 DS面经 问答 实战

黄前志   2018-05-10 22:36

偷着来的,我现在在一家传统企业扣表,做指标,搞代码要趁被人不注意,不然会被认为不务正业→_→ - 陈十一   2018-05-11 09:11
0

是的哦

SofaSofa数据科学社区 DS面经 问答 实战

firstqian   2018-08-11 15:23



  相关主题

很想知道排名靠前的大佬 代码是怎么写 哪怕付费也可以吖 标杆模型 还是   4回答

地震测评指标   1回答

有没有赚外快的方法啊   2回答

求教一下:怎么进阶   1回答

大家跑模型都用的什么牌子的笔记本   6回答

关于那个autoencode有没有出来解惑一下的。   3回答

【站务】2018-04练习赛奖金发布   0回答

【投票】关于是否削减竞赛奖金的投票   2回答

【站务】2018-09练习赛奖金发布   0回答

为什么所有问答题目看不到   1回答

【站务】2018-10练习赛奖金发布   0回答

【站务】关于网站5月15日至17日被攻击的公告   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!