推荐开放数据库

  统计/机器学习 开放问题    浏览次数: 1414

最近在自学machine learning,想找点真实数据练练手,大家能推荐几个免费的开放的数据库吗?

最好是比较全的那种,想练练回归、分类、聚类的那些模型。

谢谢了!

 

小嘿   2017-03-07 14:10



   5个回答 
9

我补充几个

数据中华

Wind(万得)

亚马逊AWS

手写数字识别MNIST

ImageNet(图像识别)

电影评论数据





SofaSofa数据科学社区 DS面经 问答 实战

LeBron   2017-03-14 07:23

6

加州大学尔湾分校的公开数据库(这个是最全的!) UCI Machine Learning DataBase 

加州大学河滨分校的时间序列数据库 UCR Time Series Classification Archive

国家数据(咱们自己的) 国家数据

Kaggle数据竞赛 Kaggle数据集



SofaSofa数据科学社区 DS面经 问答 实战

蓝色北方   2017-03-08 10:56

kaggle高层表示可以退休享福了。 - 小嘿   2017-03-29 07:59
3

数据竞赛-SofaSofa可以用来练练手


SofaSofa数据科学社区 DS面经 问答 实战

高代兄   2017-10-22 08:26

3

补充补充:

数据描述与下载 | 聚数力平台 | 大数据应用要素托管与交易平台

KONECT - The Koblenz Network Collection

Webscope | Yahoo Labs

MS MARCO - Dataset Download

SofaSofa数据科学社区 DS面经 问答 实战

s3040608090   2017-10-30 10:49

2

上海数据库也不错

http://www.datashanghai.gov.cn

SofaSofa数据科学社区 DS面经 问答 实战

杨业勇   2017-05-14 02:41



  相关主题

Generic/Heuristic Algorithm是什么意思?有什么区别?   0回答

机器学习如何快速入门?   1回答

机器学习算法的鲁棒性是什么意思?   1回答

在线算法(online algorithm)是什么意思?   2回答

加性模型是什么意思?   2回答

meta learning是什么意思?   1回答

机器学习+计算机网络   2回答

Bagging是什么意思?   3回答

如何理解VC dimension?   2回答

baseline模型和benchmark模型的差别?   1回答

人类的第一个机器学习算法是什么?   2回答

如何理解PAC Learning?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!