关于地震数据预处理的几点疑问。

  板凳区 Sofa竞赛8    浏览次数: 156
0

我应该是第一个提交数据集吧,当时是下午在公司看到,快下班了,就直接处理里面文本转换成离散的数字label

然后u盘复制回家随便找了个模型跑了下0.74(0.74是排行榜上的,感觉那个测评指标自己写轮子有点麻烦,懒就没写,测试集直接用准确率了)。

今天闲了,研究了一下测试集,发现几个有意思东西,但也没想到解决对策。

首先是震后楼层会比震前楼层多,我没搞明白...........(train里有,test也有)

其次是震后高度比震前高度高(难道是地震把地壳顶起来了?,不过测楼不是应该只关心地表高度吗)

或者说都是错误数据?

其次就是震前高度,有99(100多个),还有两个一百多米,这个应该是错误值了吧,不过又一看,码的,震后都是0米,修复建议都是重建,。。。。。。。。。难道确实是太高了???

wtf!

 

陈十一   2018-05-10 16:25



   2个回答 
0

我单纯地觉得只是数据脏,noise多

黄前志   2018-05-10 22:31

0

在公司里玩这个,也是服了你啊

黄前志   2018-05-10 22:36

偷着来的,我现在在一家传统企业扣表,做指标,搞代码要趁被人不注意,不然会被认为不务正业→_→ - 陈十一   2018-05-11 09:11


  相关主题

【招】第四范式机器学习系统工程师   0回答

【站务】关于网站5月15日至17日被攻击的公告   1回答

【站务】关于网站5月20日至21日被攻击的公告   0回答

欢迎大家来到板凳区!   0回答

提个比较敏感的问题:有没有来讨论讨论这几个比赛的提升思路   6回答

【站务】SofaSofa为优秀的博客提供赞助   0回答

【站务】2018-05练习赛奖金发布   0回答

关于用贝叶斯方法判断性别的教程中Laplace平滑问题   1回答

【竞赛1】讨论汇总   4回答

比赛思路交流群   0回答

问答社区预测那题,大家的思路是什么?   3回答

【招】蚂蚁金服全职数据挖掘工程师   0回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!