机器学习深度学习用得到的数据集

以下是一些常见的机器学习数据集下载渠道:

  1. Google 数据集搜索引擎 :可以通过文本搜索数据集,并能按日期、数据格式和使用权限等进行过滤。地址:https://datasetsearch.research.google.com/
  2. Kaggle :这是世界领先的数据科学平台,拥有大量数据集,还允许用户发布数据集及与其他数据科学家交流和竞争。地址:https://www.kaggle.com/datasets
  3. UCI 机器学习存储库 :加州大学尔湾分校提供的数据库,有 550 多个数据集,可按问题类型(如分类、回归和聚类等)进行筛选。地址:UCI Machine Learning Repository
  4. 亚马逊数据集 :包含来自不同领域的数据集,具有一些较大型的数据集。地址:Registry of Open Data on AWS
  5. 微软数据集 :在公共云中提供数据存储库以促进全球研究社区协作,并提供已用于发表研究的整理数据集。地址:https://azure.microsoft.com/en-us/services/open-datasets/catalog/?q+
  6. 数据世界(data.world) :与 Google 数据集搜索引擎类似,搜索深度较好,能显示数据集及可能包含所需数据的子文件。地址:The Data Catalog Platform | data.world
  7. 欧洲核子研究组织开放数据门户 :提供有关最小物理量(粒子物理学)的数据。地址:CERN Open Data Portal
  8. Lionbridge AI 数据集 :Lionbridge 公司的网站上展示了各种数据集,还有相关文章介绍,例如用于机器学习的气候变化数据集、免费数据集等。地址:https://lionbridge.ai/datasets/
  9. Awesome 公共数据集(https://github.com/awesomedata/awesome-public-datasets:这是一个由社区公开维护的按主题分类的数据集清单,涵盖了生物学、经济学、教育学等多个领域,其中多数数据集免费,但使用前需检查许可要求。
  10. 计算机视觉数据集(VisualData - Search Engine for Computer Vision Datasets:如果你从事图像处理、计算机视觉或深度学习工作,这里有许多可用于构建计算机视觉模型的数据集,能通过特定的计算机视觉任务查找相应数据集。

还有一些其他途径可以获取数据集,比如:

  1. Kaggle :拥有各种有趣的数据集,涵盖多个领域。链接为:https://www.kaggle.com/
  2. UCI 机器学习库 :是较为古老的数据集源之一,有大量用户贡献的数据集,多数较为干净,可直接下载且无需注册。链接为:http://mlr.cs.umass.edu/ml/
  3. AI Studio 数据集 :百度的人工智能学习与实训社区提供的开放数据集。链接为:开放数据集-飞桨AI Studio星河社区
  4. 天池数据集 :阿里系唯一对外开放数据分享平台。链接为:天池数据集_阿里系唯一对外开放数据分享平台-阿里云天池
  5. Papers With Code 数据集 :可以找到与相关论文对应的数据集。链接为:Machine Learning Datasets | Papers With Code
  6. Graviti Open Datasets :提供公开数据集下载,包括图像识别、NLP 等领域的数据集。链接为:https://gas.graviti.cn/open-datasets
  7. Huggingface 数据集 :链接为:https://huggingface.co/datasets
  8. CLUE 数据集https://www.cluebenchmarks.com/dataSet_search.html
  9. VisualData :分好类的计算机视觉数据集,可以进行搜索。链接为:VisualData - Search Engine for Computer Vision Datasets

一些具体的数据集如下:

相关推荐
kngines12 分钟前
【字节跳动】数据挖掘面试题0007:Kmeans原理,何时停止迭代
人工智能·数据挖掘·kmeans
Kali_0715 分钟前
使用 Mathematical_Expression 从零开始实现数学题目的作答小游戏【可复制代码】
java·人工智能·免费
贾全21 分钟前
第十章:HIL-SERL 真实机器人训练实战
人工智能·深度学习·算法·机器学习·机器人
每日摸鱼大王26 分钟前
互联网摸鱼日报(2025-07-01)
人工智能
GIS小天36 分钟前
AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年7月4日第128弹
人工智能·算法·机器学习·彩票
我是小哪吒2.01 小时前
书籍推荐-《对抗机器学习:攻击面、防御机制与人工智能中的学习理论》
人工智能·深度学习·学习·机器学习·ai·语言模型·大模型
慕婉03071 小时前
深度学习前置知识全面解析:从机器学习到深度学习的进阶之路
人工智能·深度学习·机器学习
荔枝吻2 小时前
【AI总结】Git vs GitHub vs GitLab:深度解析三者联系与核心区别
人工智能·git·github
Jamie201901062 小时前
高档宠物食品对宠物的健康益处有哪些?
大数据·人工智能
蓝婷儿2 小时前
Python 机器学习核心入门与实战进阶 Day 2 - KNN(K-近邻算法)分类实战与调参
python·机器学习·近邻算法