就是10w条+特征数据max_depth=30,n_estimators=500
跑出来了800M大小模型,load都慢。。。
3个回答
你这个森林深度有点大啊,如果你把深度调小点,效果应该差不多。
另外你保存的时候,设置一下compress参数应该会减小很多空间
from sklearn.externals import joblib
joblib.dump(my_rf_model, "rf.pkl", compress=9)
#my_rf_model是你训练好的模型
compress的值是0到9之间,越大表示压缩程度越高。
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
python sklean中的决策树是用的哪一种决策树算法?
2回答
决策树可以做多元分类吗?
1回答
树模型有哪些假设?比如,对样本数据的分布有做假设吗?
0回答
怎么理解RandomForest中的max_features?
1回答
怎么得到randomforestregressor里每棵树的预测结果?
1回答
lightgbm使用自定义损失函数后,二分类的预测结果不再是【0,1】区间
0回答
关于knn算法中kd树的问题
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!