我用sklearn训练模型,然后就出现了报错
ValueError: could not convert string to float
直接用R训练模型的时候,类别变量是可以直接输入的。python是不可以的吗?
1个回答
是的,sklearn没有这个功能
官方链接:why-do-categorical-variables-need-preprocessing-in-scikit-learn-compared-to-other-tools
“sklearn只支持numpy数据格式,其他格式都不行,未来可能有不会考虑支持”。
把文本变量做one-coding可以用pandas get dummy也可以用Sklearn的encoder,具体可以看这个讨论中的两个回答
sklearn OneHotEncoder string类型报错怎么处理?