公共自行车使用量预测怎么进行特征处理?

  板凳区 Sofa竞赛1    浏览次数: 603
0

我用了xgboost进行简单预测,加入了网格搜索gridSearchCV,在训练集上表现效果还行,但是误差200+,怎么解决啊,大神们

 

杨花似雪   2018-07-14 22:59



   1个回答 
0

这里也有些讨论

有些特征可以做一做加减乘除吧

SofaSofa数据科学社区 DS面经 问答 实战

okayguy   2018-07-15 11:37

但是特征之间的相关性有点理不清,不知道怎么进行处理 - 杨花似雪   2018-07-15 17:42
sklearn.feature_selection.mutual_info_regression 特征和目标之间的互信息。 pandas的一些工具corr()什么的 还有可视化工具matplotlib seaborn这些可以做数据可视化。 但是这个比赛数据很简单,分析不出什么东西。 做几个模型融合应该会好点吧。。 - 青年余文乐   2018-11-21 11:29


  相关主题

【竞赛1】讨论汇总   4回答

第一个比赛预测自行车数量的问题   1回答

提个比较敏感的问题:有没有来讨论讨论这几个比赛的提升思路   6回答

地震测评指标   1回答

有没有赚外快的方法啊   2回答

大家跑模型都用的什么牌子的笔记本   7回答

关于那个autoencode有没有出来解惑一下的。   3回答

求教一下:怎么进阶   1回答

【招聘】华为2012实验室机器学习岗位招聘   0回答

【站务】2018-11练习赛奖金发布   0回答

【招】滴滴招数据科学家,坐标北京   2回答

【招】蔚蓝汽车旗下数据岗位实习生   0回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!