怎样选择合适的算法?比如这个天气预报数据预测电力故障

  统计/机器学习 监督式学习 模型验证 时间序列 Python    浏览次数:151        分享
1

新手请教各位前辈。项目是用图1的「天气预报」的数据去预测「电力故障的数量」。


1. 总的来说是一个「回归」问题,什么类型的算法预测效果会比较好呢?

2. target还挺不平衡的(如图2),2/3都是零,非零也主要集中在0-1之间,有延伸至30左右的long tail。这种情况下选模型调参有什么需要注意的地方吗?





 

ladychili   2019-07-08 21:28



   1个回答 
0

参考一下这个问题怎么处理真值大部分为0的回归问题

上面那个问题中kykix回答的可能比较适合你

1)先用所有样本做一个逻辑回归

2)然后对非零样本取log

3)再对log后的非零样本做回归

4)最后再把结果综合起来

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2019-07-09 23:28

非常感谢,我会试试看 - ladychili   2019-07-10 09:57


  相关主题

怎么对时间序列进行交叉验证?   1回答

SARIMAX是什么算法?   1回答

python如何对日期做遍历?有没有类似range的函数?   2回答

求助,按照百度的方法从日期提取年龄出现错误了   1回答

python中怎么判断某一年是闰年?   2回答

python两个日期,求间隔的天数   2回答

怎么把datetime类型转为字符串类型,但只保留日期   1回答

python中如何修改时间戳变量里的小时?   1回答

如何判断时间序列的周期性?   2回答

怎么判断一个时间序列是平稳的?   2回答

ARIMA模型中的三个参数(p, d, q)都是什么意思?   1回答

机器学习里extrapolation是什么意思?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!