开源数据集网站合集

一.Google数据集

链接:https://datasetsearch.research.google.com/

二.Huggingface数据集

链接1:GitHub - huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools

链接2:https://huggingface.co/datasets

三.Kaggle 数据集

链接:Find Open Datasets and Machine Learning Projects | Kaggle

四.Paper With Code 数据集

链接:Machine Learning Datasets | Papers With Code

五.Reddit 数据集

链接:https://www.reddit.com/r/datasets/

六.CLUE 数据集

链接:https://www.cluebenchmarks.com/dataSet_search.html

七.Machine learning datasets

链接:Dataset list - A list of the biggest machine learning datasets

十.ChineseNlpCorpus

链接:https://github.com/InsaneLife/ChineseNLPCorpus

十一.CV Datasets on the web

链接:http://www.cvpapers.com/datasets.html

十二.Yet Another Computer Vision Index To Datasets (YACVID)

链接:http://yacvid.hayko.at/

十三.天池数据集_阿里系唯一对外开放数据分享平台-阿里云天池

链接:https://tianchi.aliyun.com/dataset/?spm=5176.14154004.J_4642415020.21.d08056996oMHQY

十四.公开数据集下载,优质机器学习数据集,图像识别、NLP免费获取 | 格物钛,非结构化数据平台

链接:https://gas.graviti.cn/open-datasets

相关推荐
阿里云云原生7 分钟前
山石网科×阿里云通义灵码,开启研发“AI智造”新时代
网络·人工智能·阿里云·ai程序员·ai程序员体验官
diemeng11191 小时前
AI前端开发技能变革时代:效率与创新的新范式
前端·人工智能
有Li1 小时前
跨中心模型自适应牙齿分割|文献速递-医学影像人工智能进展
人工智能
万事可爱^5 小时前
HDBSCAN:密度自适应的层次聚类算法解析与实践
算法·机器学习·数据挖掘·聚类·hdbscan
牧歌悠悠6 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
坚毅不拔的柠檬柠檬6 小时前
AI革命下的多元生态:DeepSeek、ChatGPT、XAI、文心一言与通义千问的行业渗透与场景重构
人工智能·chatgpt·文心一言
坚毅不拔的柠檬柠檬6 小时前
2025:人工智能重构人类文明的新纪元
人工智能·重构
jixunwulian6 小时前
DeepSeek赋能AI边缘计算网关,开启智能新时代!
人工智能·边缘计算
Archie_IT6 小时前
DeepSeek R1/V3满血版——在线体验与API调用
人工智能·深度学习·ai·自然语言处理
大数据追光猿7 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法