海豚

注册

 

发新话题 回复该主题

资源机器学习高质量数据集大合辑 [复制链接]

1#
北京治皮炎的好医院 http://pf.39.net/bdfyy/bdfjc/180416/6171978.html

在机器学习中,寻找数据集是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。

那么用于机器学习的开放数据集有哪些呢?本文给大家推荐一份高质量的数据集,这些数据集或者涵盖范围广泛(比如Kaggle),或者非常细化(比如自动驾驶汽车的数据)。

首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:

数据集不应混乱,因为你不希望花费大量时间清理数据。

数据集不应该有太多行或列,因此很容易使用。

数据越干净越好——清洗大型数据集相当耗时。

数据可以解答一些有趣的问题。

数据集查找器

Kaggle:Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(AnthonyGoldbloom)年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的

分享 转发
TOP
发新话题 回复该主题