第一个比赛预测自行车数量的问题

  板凳区 Sofa竞赛1    浏览次数:3548        分享
0

自己生成了一些组合特征,将一些特征独热编码了,用的GBDT或者XGB模型,要不要用模型之前先进行特征选择?要的话用什么方法进行特征选择好?加入weather特征独热编码后要不要删掉原来的weather特征?然后有些大佬说多个模型融合效果好,基于单个模型的线性回归等得到的RMSE都是20-30左右,而单个GBDT、XGB、RF调下参就有15左右,那选择哪几个模型融合效果会较好呢?哪位排名靠前的大佬分享下思路呗。。

 

a651021213   2018-12-03 23:39



   2个回答 
0

我之前看别人说是尽量让被融合的模型不大一样,效果比较好

SofaSofa数据科学社区DS面试题库 DS面经

花生糖   2018-12-04 10:15

0

请问一下大佬计算RMSE时,测试集的真实值提供了吗?

SofaSofa数据科学社区DS面试题库 DS面经

Super Wang   2020-03-19 15:57

测试集的没有提供啊,提供的话每个人都是满分了 - abuu   2020-03-19 16:21
那计算RMSE值怎么算,不是需要预测值和真实值才能算吗 - Super Wang   2020-03-19 16:40
系统里肯定有的吧,在后台计算的,没有在网站上公布真实值 - abuu   2020-03-20 08:47
那楼主的RMSE值不是自己算的吗,怎么看RMSE的值呢? - Super Wang   2020-03-20 12:53
真实值的RMSE您提交了就能看到了,系统每两小时更新一次。测试集的RMSE可以自己做交叉验证。 - SofaSofa驹炜   2020-03-20 21:44


  相关讨论

【竞赛1】讨论汇总

公共自行车使用量预测怎么进行特征处理?

怎么看自己提交的成绩呢?

#关于公共自行车使用量预测#这个例子计算RMSE时,测试集的真实值在哪里?

Sofa竞赛1的排名数据修复中

第一个比赛,自行车,排名靠前的,是做了特征工程吗,

XGBoost模型是如何对属性进行预测的?

有人关注机器学习在量化交易中的应用吗?

大家跑模型都用的什么牌子的笔记本

使用深度学习进行图像分类

  随便看看

推荐系统算法里的cold start是什么意思?

pytorch里view(-1, 1)什么意思?

deep learning中的pooling是什么意思?

对于xgboost,还有必要做很多特征工程吗?

线性回归是机器学习算法吗?