有序的分类变量的预测是回归问题还是多分类问题?

  统计/机器学习 回归分析 监督式学习 开放问题    浏览次数: 186
2

假如我们的预测变量是有序的分类变量,那么这个问题是回归问题还是分类问题?

更直接的说,我们应该用回归模型还是用分类模型来做预测?

比如说,我们的预测变量的结果有“高”“中”“低”,这个是3类,但是也可以看作是3,2,1。

比如说,预测学生的考试成绩,有“A+”“A”“A-”“B+”“B”“B-”“C+”“C”“C-”“D+”“D”“D-”“F”这么多类,那么是看作回归来做呢还是分类来做?



我是受地震后建筑修复建议有感而发,但是讨论不局限于这个项目。

 

信春哥   2018-05-21 09:36



   3个回答 
3

我想应该是分类问题吧。之前学计量经济学的时候,老师给过我这样一个观点:在连续变量中比如1和2,2和3这种值之间的差异是相同的,相差1就是1。但是一些有序的分类变量,比如楼主提到的“A+”“A”“A-”“B+”“B”等等,他们之间的差异意义是相同的吗?很多时候应该是不同的。

s3040608090   2018-05-24 13:42

2

分类问题。如果是回归,那你怎么定义任务,怎么保证结果在你定义的这些数值里面

lpq29743   2018-05-26 09:14

1

我也觉得算是分类问题。

比如“A”“B”“C”“D”“F”,如果用回归,那么预测结果肯定也是连续的,比如说预测结果中最有可能的是的“A”的话,其次就是“B”,然后是“C”,等等。

但实际情况未必如此,应该让模型和数据自己去说话。

用多分类模型可能预测为最有可能为“A”其次为“C”,然后是“B”。这样的非连续结果可以是根据模型学习得到的,而非强迫它设置为连续的。

其次还有s3040608090提到的,虽然是有序分类变量,但是它们的间距未必是等距的。


Jiho   2018-05-28 09:28



  相关主题

线性回归是机器学习算法吗?   3回答

Sigmoid核函数是不是对新输入的需要预测的点的测量误差不敏感?   1回答

什么是“维数灾难”,为什么说引入核函数就避免“维数灾难”   0回答

LS-SVM的核函数选取问题   1回答

如何对大型线性回归进行并行计算?   2回答

kNN算法有哪些缺点?   6回答

为什么bias-variance一定会trade off?   2回答

逻辑回归的前提假设是什么?   1回答

线性回归的bagging   2回答

GBDT+LR的工作原理?   3回答

可以对线性回归进行boosting吗?   3回答

机器学习+计算机网络   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!