在进行数值编码时出现错误,怎么解决?

  统计/机器学习 数据预处理 特征选择 Python    浏览次数:441        分享
0

'Device_Type','Filled_Form','Gender','Var1','Var2','Mobile_Verified','Source'这些特征类型为object

# 数值编码
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
var_to_encode = ['Device_Type','Filled_Form','Gender','Var1','Var2','Mobile_Verified','Source']
for col in var_to_encode:
    data[col] = le.fit_transform(data[col])

错误代码:

TypeError: '<' not supported between instances of 'float' and 'str'
 

evan   2018-09-30 17:06



   1个回答 
3

你看看你的那些col里有没有null或者nan的情况,如果有的话会出错

TypeError: unorderable types: float() < str()


SofaSofa数据科学社区DS面试题库 DS面经

东布东   2018-10-01 03:20

谢谢,里面确实有一个缺失值,修改后可以了 - evan   2018-10-08 10:09


  相关主题

python中如何产生交互项?   2回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

对于组合特征怎么理解?   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

partial dependence是什么意思?   1回答

AIC可以是负数吗?   1回答

向前逐步选择法和向后逐步选择法的结果是一样的吗?   1回答

python使用MFCC特征训练GMMHMM模型   2回答

关于K均值聚类的权重问题   2回答

怎麼將dataframe 欄位 對應到原有的csv檔 而寫入   1回答

让DataFrame中的行按照某一列元素的绝对值从大到小排列   1回答

怎么求一个数组的移动平均数   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!