当训练集只有一个特征的时候,sklearn的LinearRegression报错

  统计/机器学习 回归分析 Python    浏览次数:5925        分享
0


>>> reg = LinearRegression()
>>> reg.fit(train['x_1'], train['y'])


ValueError: Found input variables with inconsistent numbers of samples

报错内容是inconsistent numbers of samples,但是我检查过,都是482行。

有人知道这是个什么情况嘛?


 

ljljlj   2017-09-15 22:26



   1个回答 
4

我以前遇到过这个。是shape的问题,当输入一个只有一个特征的数据集的时候,sklearn会以为是一个有很多特征的单条数据。

reg.fit(train[['x_1']], train['y'])

或者

reg.fit(train['x_1'].reshape(-1, 1), train['y'])

应该就可以了。


SofaSofa数据科学社区DS面试题库 DS面经

派大星   2017-09-16 00:45

的确可以了,谢谢! - ljljlj   2017-09-19 10:15


  相关讨论

sklearn回归的入门级问题

sklearn里怎么做多项式回归?

同一批样本数据,利用sklearn中二项逻辑回归预测同一批预测数据的概率,每次预测结果有很大不同

提取sklearn逻辑回归的模型系数

sklearn里LogisticRegressionCV中的参量Cs什么意思

sklearn r2_score返回负数

查看sklearn版本

sklearn可以用gpu加速吗?

sklearn模型当中的verbose是什么意思?

sklearn中除了sgd以外,还有什么可以使用partial_fit方法吗?

  随便看看

sklearn SGDClassifier的partial_fit是什么意思?

sklearn里的LabelEncoder什么用?

对连续特征一定要进行分箱处理吗?

python里怎么表示科学计数法?

R里线性回归结果中最后的F-statistic什么意思?有什么用?