我想试验一下一个算法,需要一个二元分类的数据集(数据是多维的)做simulation,这种数据集该怎么生成呢?最好是python的,不一定需要具体的代码,思路也可以
1个回答
了解一下sklearn里的sklearn.datasets.make_classification
可以生成binary classification的数据集,维度的数量也可以直接设置,维度的相关性也可以设置,非常方便
SofaSofa数据科学社区DS面试题库 DS面经我想试验一下一个算法,需要一个二元分类的数据集(数据是多维的)做simulation,这种数据集该怎么生成呢?最好是python的,不一定需要具体的代码,思路也可以
了解一下sklearn里的sklearn.datasets.make_classification
可以生成binary classification的数据集,维度的数量也可以直接设置,维度的相关性也可以设置,非常方便
SofaSofa数据科学社区DS面试题库 DS面经