如何生成一个二元分类的数据集?

  统计/机器学习 监督式学习 Python    浏览次数:1667        分享
0

我想试验一下一个算法,需要一个二元分类的数据集(数据是多维的)做simulation,这种数据集该怎么生成呢?最好是python的,不一定需要具体的代码,思路也可以

 

newcomer   2019-12-19 00:00



   1个回答 
0

了解一下sklearn里的sklearn.datasets.make_classification

可以生成binary classification的数据集,维度的数量也可以直接设置,维度的相关性也可以设置,非常方便

SofaSofa数据科学社区DS面试题库 DS面经

strong.man   2019-12-25 22:52



  相关讨论

python里如何实现线性判别分析(LDA)?

FM算法(因子分解机)有专门的算法框架吗?

K近邻算法(kNN)如何实现并行计算?

adaboost里的learning rate是什么意思?

为什么LR要用Sigmoid函数?

欠采样后概率还原问题

stacking模型里每个子模型的权重如何确定?

关于方差和偏差和噪声

线性可分是什么意思?

为什么说knn是惰性算法

  随便看看

二维numpy.array转为一维的numpy.array或者list

sklearn可以用gpu加速吗?

python怎么对list中的元素做连乘?

什么是K-Modes(K众数)聚类法?

pandas.DataFrame的index重新排列(从0开始)