公共自行车使用量预测怎么进行特征处理?

  板凳区 Sofa竞赛1    浏览次数:755        分享
0

我用了xgboost进行简单预测,加入了网格搜索gridSearchCV,在训练集上表现效果还行,但是误差200+,怎么解决啊,大神们

 

杨花似雪   2018-07-14 22:59



   1个回答 
0

这里也有些讨论

有些特征可以做一做加减乘除吧

SofaSofa数据科学社区 DS面经 问答 实战

okayguy   2018-07-15 11:37

但是特征之间的相关性有点理不清,不知道怎么进行处理 - 杨花似雪   2018-07-15 17:42
sklearn.feature_selection.mutual_info_regression 特征和目标之间的互信息。 pandas的一些工具corr()什么的 还有可视化工具matplotlib seaborn这些可以做数据可视化。 但是这个比赛数据很简单,分析不出什么东西。 做几个模型融合应该会好点吧。。 - 青年余文乐   2018-11-21 11:29


  相关主题

第一个比赛预测自行车数量的问题   1回答

【竞赛1】讨论汇总   4回答

大家跑模型都用的什么牌子的笔记本   7回答

关于那个autoencode有没有出来解惑一下的。   3回答

求教一下:怎么进阶   1回答

有没有赚外快的方法啊   2回答

欢迎大家来到板凳区!   0回答

竞赛区惊现一个神级大牛nobodyoo1   3回答

为什么所有问答题目看不到   1回答

【投票】关于是否削减竞赛奖金的投票   2回答

面试题库做几遍比较合适?   2回答

怎么和领导说自己的模型很好?   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!