如何生成一个二元分类的数据集?

  统计/机器学习 监督式学习 Python    浏览次数:130        分享
0

我想试验一下一个算法,需要一个二元分类的数据集(数据是多维的)做simulation,这种数据集该怎么生成呢?最好是python的,不一定需要具体的代码,思路也可以

 

newcomer   2019-12-19 00:00



   1个回答 
0

了解一下sklearn里的sklearn.datasets.make_classification

可以生成binary classification的数据集,维度的数量也可以直接设置,维度的相关性也可以设置,非常方便

SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2019-12-25 22:52



  相关主题

python里如何实现线性判别分析(LDA)?   1回答

K近邻算法(kNN)如何实现并行计算?   2回答

FM算法(因子分解机)有专门的算法框架吗?   1回答

欠采样后概率还原问题   2回答

rulefit和gdbt+lr有什么区别?   0回答

knn推导过程中的一个细节   3回答

有序多分类问题   2回答

怎么理解platt scaling?   2回答

为什么说knn是惰性算法   1回答

关于方差和偏差和噪声   1回答

KNN中K值的选择   5回答

线性可分是什么意思?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!