有序的分类变量的预测是回归问题还是多分类问题?

  统计/机器学习 回归分析 监督式学习 开放问题    浏览次数: 552
2

假如我们的预测变量是有序的分类变量,那么这个问题是回归问题还是分类问题?

更直接的说,我们应该用回归模型还是用分类模型来做预测?

比如说,我们的预测变量的结果有“高”“中”“低”,这个是3类,但是也可以看作是3,2,1。

比如说,预测学生的考试成绩,有“A+”“A”“A-”“B+”“B”“B-”“C+”“C”“C-”“D+”“D”“D-”“F”这么多类,那么是看作回归来做呢还是分类来做?



我是受地震后建筑修复建议有感而发,但是讨论不局限于这个项目。

 

信春哥   2018-05-21 09:36



   3个回答 
6

我想应该是分类问题吧。之前学计量经济学的时候,老师给过我这样一个观点:在连续变量中比如1和2,2和3这种值之间的差异是相同的,相差1就是1。但是一些有序的分类变量,比如楼主提到的“A+”“A”“A-”“B+”“B”等等,他们之间的差异意义是相同的吗?很多时候应该是不同的。

SofaSofa数据科学社区 DS面经 问答 实战

s3040608090   2018-05-24 13:42

4

分类问题。如果是回归,那你怎么定义任务,怎么保证结果在你定义的这些数值里面

SofaSofa数据科学社区 DS面经 问答 实战

lpq29743   2018-05-26 09:14

3

我也觉得算是分类问题。

比如“A”“B”“C”“D”“F”,如果用回归,那么预测结果肯定也是连续的,比如说预测结果中最有可能的是的“A”的话,其次就是“B”,然后是“C”,等等。

但实际情况未必如此,应该让模型和数据自己去说话。

用多分类模型可能预测为最有可能为“A”其次为“C”,然后是“B”。这样的非连续结果可以是根据模型学习得到的,而非强迫它设置为连续的。

其次还有s3040608090提到的,虽然是有序分类变量,但是它们的间距未必是等距的。


SofaSofa数据科学社区 DS面经 问答 实战

Jiho   2018-05-28 09:28



  相关主题

泊松回归有哪些应用场景?   2回答

LS-SVM的核函数选取问题   1回答

如何对大型线性回归进行并行计算?   4回答

什么是“维数灾难”,为什么说引入核函数就避免“维数灾难”   1回答

Sigmoid核函数是不是对新输入的需要预测的点的测量误差不敏感?   1回答

为什么岭回归和最小二乘支持向量回归有一样二次规划形式却有不同解   2回答

线性回归是机器学习算法吗?   3回答

逻辑回归最终的所有结果都是0的原因   3回答

GBDT+LR的工作原理?   4回答

逻辑回归的前提假设是什么?   1回答

可以对线性回归进行boosting吗?   3回答

adaboost做回归预测的时候,是怎么调整样本权重的?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!