线性核svm与文本分类

  统计/机器学习 监督式学习 自然语言处理    浏览次数:2659        分享
0

周志华老师的《机器学习》里面说“线性核的svm迄今仍是文本分类的首选技术”,请问他这说的依据是什么?是因为线性核的svm在稀疏特征表示的数据上有什么优于其他算法的地方吗?不是很明白,请明白的人指点一二。

 

咸魚   2019-04-11 18:08



   1个回答 
0

这个英文博客里解释了这个问题:Linear SVM good for text classification

这个博客里讲了很多都是经验总结,总体上有三个原因:

  • 文本分类问题很多是基本上线性可分的
  • 文本分类问题中特征很多,再用其他kernel升到更高维的空间也没有必要,也没帮助
  • 线性核速度快,也没有太多超惨要调
SofaSofa数据科学社区DS面试题库 DS面经

子京   2019-04-14 10:15



  相关讨论

为什么SVM里两个超平面的距离是1/||w||?

SVM里的软间隔是什么意思

SVM的支持向量最少有几个?

支持向量机(SVM)里的支持向量是什么意思

SVM和LR适合稀疏数据吗?

为什么说LR适合大样本,SVM适合小样本?

SVM模型的可解释性如何?

如果支持向量机做回归任务,支持向量是什么?

SVM 需不需要做数据归一化?

与基于一般形式的支持向量回归相比,最小二乘支持向量回归更准确?

  随便看看

为什么梯度的反方向是函数下降最快的方向?

推荐系统有哪些常用的评价标准

怎么对pandas dataframe的列求众数

pandas.DataFrame的index重新排列(从0开始)

print里的"%.2f"是什么意思?