线性核svm与文本分类

  统计/机器学习 监督式学习 自然语言处理    浏览次数:103        分享
0

周志华老师的《机器学习》里面说“线性核的svm迄今仍是文本分类的首选技术”,请问他这说的依据是什么?是因为线性核的svm在稀疏特征表示的数据上有什么优于其他算法的地方吗?不是很明白,请明白的人指点一二。

 

咸魚   2019-04-11 18:08



   1个回答 
0

这个英文博客里解释了这个问题:Linear SVM good for text classification

这个博客里讲了很多都是经验总结,总体上有三个原因:

  • 文本分类问题很多是基本上线性可分的
  • 文本分类问题中特征很多,再用其他kernel升到更高维的空间也没有必要,也没帮助
  • 线性核速度快,也没有太多超惨要调
SofaSofa数据科学社区DS面试题库 DS面经

子京   2019-04-14 10:15



  相关主题

SVM里的软间隔是什么意思   2回答

如果支持向量机做回归任务,支持向量是什么?   1回答

为什么岭回归和最小二乘支持向量回归有一样二次规划形式却有不同解   2回答

与基于一般形式的支持向量回归相比,最小二乘支持向量回归更准确?   2回答

支持向量机(SVM)里的支持向量是什么意思   6回答

SVM模型的可解释性如何?   1回答

SVM的支持向量最少有几个?   1回答

感知机和支持向量机的区别是什么?   2回答

为什么说LR适合大样本,SVM适合小样本?   2回答

LS-SVM的核函数选取问题   1回答

在SVM中获知一个分类机/回归机需要有多训练点?   1回答

one class SVM到底是无监督还是有监督学习?   4回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!