dbscan 中的参数值如何确定?

  统计/机器学习    浏览次数:413        分享
0

dbscan中的参数值有没有比较好的确定方法

 

mashagua   2021-07-23 09:20



   1个回答 
0

只有一些经验规律:

  1. 数据量越大,选择的聚合点越多
  2. 数据量噪音越大,选择的聚合点越多
  3. 聚合点一般大于等于数据维度
  4. 对于2维数据,建议使用4
  5. 对于多于二维数据,初始可以从 (2*维度) 调起

然后距离设定的话,https://iopscience.iop.org/article/10.1088/1755-1315/31/1/012012/pdf,这篇文章给了个方案,就是求出数据集每两个点的距离,然后按照距离绘制图案,找到拐点最大的距离,就是最优的分离出所有点的距离。


SofaSofa数据科学社区DS面试题库 DS面经

threecifanggen   2021-10-14 12:12



  相关主题

因子分析的维度是怎么划分的呢   0回答

关于node.js的问题   1回答

求统计专业小伙伴   2回答

提交结果没有反应,如何看结果的精度啊   1回答

python能不能直接读取word文本,doc或者docx文件?   1回答

请教一下,有人使用fasttext做垃圾文本识别吗?效果怎么样?   0回答

小白求教:一样的数据和差不多的代码,线性回归(LinearRegression)为甚麽自己的和书上的准确率差了挺多   1回答

如何评价大数据的未来?   2回答

关于大规模稀疏矩阵的问题   2回答

分类问题中用逻辑回归处理不同输入标签的问题   1回答

钓鱼网站的识别   0回答

线性基分类器的XGboost的原理是怎样的?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!