y取值有上下界限的回归问题

  统计/机器学习 回归分析 开放问题    浏览次数:781        分享
0

大家好,我现在有一个回归问题,目标变量y是固定了上下界的,也就是说y是有一个取值范围的。所以我的预测值也一定要在这个范围之内。

对于这种回归问题,该怎么处理呢?需要对y做变换吗?

 

helen   2019-03-22 13:13



   3个回答 
2

既然y取值有固定范围,那么训练集的y肯定是在这个范围之内的。

可以考虑用决策树或者随机森林,它们的预测值肯定是在训练集y的范围之内的。

也可以考虑kNN模型,这种投票算法也能确保预测值不会超过训练集的范围。

SofaSofa数据科学社区DS面试题库 DS面经

maxroot   2019-03-23 22:46

2

1. 如maxroot说的用基于nearest neighbor类的方法,不会超过训练y范围。

2.基于最小二乘类方法,有可能超过训练y范围,这时要考虑:

2.1如果y有物理意义,或测试y超出范围的概率、幅度都很小,对结果影响不大,可以用训练y的最大最小值去限制。

2.2可以对y作变换,比如y-d,y+d作为最小最大值,为测试y留出一定富余范围。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-03-23 23:53

1

可以尝试用归一化。

训练集的预测值做归一化,训练模型,然后对测试集预测,预测值用刚刚的归一化映射回去,比如用Min-Max。理论上就可以通过训练集的y值的范围来控制测试集的y值的范围了。

如有错误,欢迎指出。

SofaSofa数据科学社区DS面试题库 DS面经

咸魚   2019-03-23 21:42



  相关主题

Sigmoid核函数是不是对新输入的需要预测的点的测量误差不敏感?   1回答

线性回归是机器学习算法吗?   7回答

如何对大型线性回归进行并行计算?   4回答

什么是“维数灾难”,为什么说引入核函数就避免“维数灾难”   1回答

泊松回归有哪些应用场景?   2回答

有序的分类变量的预测是回归问题还是多分类问题?   3回答

拟合数据的Z-score规范化怎么进行操作?   2回答

怎么处理真值大部分为0的回归问题   3回答

在线性回归模型中存在epoch的说法吗?   2回答

逻辑回归模型中变量的系数怎么理解?   4回答

常用的回归模型中,哪些具有较好的鲁棒性(robustness)?   2回答

线性回归需要满足哪些基本前提假设   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!