RBF核的多参数体现在哪?

  统计/机器学习    浏览次数:3561        分享
0

看到知乎上一个问题的回答下有『RBF核:主要用于线性不可分的情形。参数多,分类结果非常依赖于参数。』

请问参数多主要体现在哪里呢?公式里面不就一个sigma平方吗?

 

dzzxjl   2018-03-14 21:48



   2个回答 
2

不确定题主到底有没有理解。但anyway我可以给更详细的解释,对后来者有帮助也是极好的。

Kernel是用来升维的,其升维的原理在于用极少的计算量计算高维度feature vector的内积。也就是说Kernel一定表示的是feature vector的内积,那么现在的问题就在于Gaussian kernel到底表示了什么feature vector的内积?

请看下面的分解:


所以Gaussian kernel “隐性”(implicitly)地表示了两个无限维度feature的内积……之所以是“隐性”是因为我们单纯通过kernel无法知道feature的具体形式。但可以确定feature的维数。


SofaSofa数据科学社区DS面试题库 DS面经

CCBigman   2018-03-19 09:08

1

我试着回答一下我的理解。

『RBF核:主要用于线性不可分的情形。参数多,分类结果非常依赖于参数。』这里的参数是模型的参数(系数)

『请问参数多主要体现在哪里呢?公式里面不就一个sigma平方吗?』这里的参数是指模型的超参数

我们调参的时候是调节的超参数。模型自己学习的是参数。

我们知道SVM的kernel function很多时候是用来升维的。

每个维度对应着一个参数(线性方程里每个变量前面的系数),升维之后,参数自然变多了。


SofaSofa数据科学社区DS面试题库 DS面经

abuu   2018-03-15 23:50

大概理解了 谢谢 - dzzxjl   2018-03-16 19:30


  相关主题

如何评价大数据的未来?   2回答

因子分析的维度是怎么划分的呢   0回答

分类问题中用逻辑回归处理不同输入标签的问题   1回答

有人关注机器学习在量化交易中的应用吗?   1回答

关于node.js的问题   1回答

线性基分类器的XGboost的原理是怎样的?   2回答

关于大规模稀疏矩阵的问题   2回答

生存分析中left censored, right censored有什么区别?   1回答

怎么用python批量生成含重复数值的数列?   1回答

如何将csv中多行变成一行   2回答

python如何读取元素中含有逗号的csv文件   1回答

python里的cdef是什么?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!