海豚

首页 » 常识 » 诊断 » 资源机器学习高质量数据集大合辑
TUhjnbcbe - 2021/2/7 3:45:00
北京治皮炎的好医院 http://pf.39.net/bdfyy/bdfjc/180416/6171978.html

在机器学习中,寻找数据集是非常重要的一步。质量高或者相关性高的数据集对模型的训练是非常有帮助的。

那么用于机器学习的开放数据集有哪些呢?本文给大家推荐一份高质量的数据集,这些数据集或者涵盖范围广泛(比如Kaggle),或者非常细化(比如自动驾驶汽车的数据)。

首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:

数据集不应混乱,因为你不希望花费大量时间清理数据。

数据集不应该有太多行或列,因此很容易使用。

数据越干净越好——清洗大型数据集相当耗时。

数据可以解答一些有趣的问题。

数据集查找器

Kaggle:Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(AnthonyGoldbloom)年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的

1
查看完整版本: 资源机器学习高质量数据集大合辑