LDA线性判别分析进行信号分类时如何对训练数据和测试数据降维?

  统计/机器学习 监督式学习 数据降维 特征选择    浏览次数:184        分享
0

如果存在四类样本X1,X2,X3,X4数据,每类样本数据都有40个样本,如果我想用其中32*4个样本进行训练,用剩余8*4个样本进行验证,来检测分类结果的准确度。

我想首先用LDA进行降维,然后在用SVM对降维数据进行分类。这里我有一个疑问,在使用LDA进行降维的时候,

1)我是直接把所有40*4个样本都一起进行降维,然后在导入SVM进行分类呢?

2)还是把32*4个训练样本使用LDA进行降维,得到映射向量w,然后再把剩余8*4个样本乘以w之后进行降维,在导入SVM进行分类呢?

3)在进行降维的时候,是否需要对数据进行归一化处理呢?

 

YihanMa   2019-07-08 17:08



   1个回答 
1

我感觉你的数据量可能不够多,无法支持你做验证,验证的结果未必可信度高。如果你没有更多数据的话,你可以试试交叉验证。

你的第一个问题是关于机器学习信息泄漏。你应该只用训练集的数据进行降维。所以你应该采用你说的(2)。

至于第(3)个问题,一般来说是需要先进行归一化处理的。

SofaSofa数据科学社区DS面试题库 DS面经

清风   2019-07-08 23:18

好的,明白了,感谢回答。 - YihanMa   2019-07-09 15:16


  相关主题

t-SNE如何实现降维?   1回答

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?   1回答

怎么利用卡方分布来进行特征选择?   2回答

为什么LDA降维最多降到类别数k-1?   0回答

关于朴素贝叶斯特征工程、特征选择的问题   2回答

python里怎么实现t-SNE降维?   1回答

partial dependence是什么意思?   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

使用uci的社区犯罪率做回归,怎么选择因变量呢   2回答

递归特征消除(RFE)方法可以用到生存分析数据上吗?   1回答

分类问题 特征怎么选择   1回答

低维嵌入(low dimension embedding)是什么意思?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!