SGDClassifier里有个partial_fit的方法,这个和普通的fit方法有什么区别?
3个回答
在第一次训练时,fit和partial_fit训练模型的原理其实本质上是一样的。
但是对于partial_fit的模型来说,当我们有了新数据,我们可以用新的数据在旧的模型基础上训练、更新模型,而不必重新训练。也就是另一位答友提到的,线上算法的特点。
以SGDClassifer为例,partial_fit的具体用法如下
from sklearn.linear_model import SGDClassifier
clf = SGDClassifier(loss='log')
#用数据集训练
clf.partial_fit(X, y)
#当我们有了新数据之后,可以在原基础上更新模型
clf.partial_fit(X_new, y_new)
#partial_fit的模型使用方法也是和正常模型一样的,直接用predict或者predict_proba
y_pred = clf.predict_proba(X_test)
fit就是一次性把模型训练完毕
partial_fit可以在原来的基础继续训练模型,所以partial_fit只针对对onlin的算法。这里SGD就是online的。
那除了sgd以外,还有什么可以使用`partial_fit`这个方法吗
SofaSofa数据科学社区DS面试题库 DS面经 相关主题
怎么获取sklearn.linear_model.SGDRegressor的回归系数、截距?
1回答
sklearn中的Randomizedlogisticregression是什么算法?和SGDClassifier一样吗?
2回答
python里怎么安装CatBoostClassifier?
0回答
sklearn.linear_model.SGDClassifier能做小批量学习(mini-batch)吗?
2回答
同一批样本数据,利用sklearn中二项逻辑回归预测同一批预测数据的概率,每次预测结果有很大不同
1回答
sklearn错误ImportError: cannot import name 'joblib'
1回答
python sklearn模型中random_state参数的意义
2回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!