开源数据集网站合集

一.Google数据集

链接:https://datasetsearch.research.google.com/

二.Huggingface数据集

链接1:GitHub - huggingface/datasets: 🤗 The largest hub of ready-to-use datasets for ML models with fast, easy-to-use and efficient data manipulation tools

链接2:https://huggingface.co/datasets

三.Kaggle 数据集

链接:Find Open Datasets and Machine Learning Projects | Kaggle

四.Paper With Code 数据集

链接:Machine Learning Datasets | Papers With Code

五.Reddit 数据集

链接:https://www.reddit.com/r/datasets/

六.CLUE 数据集

链接:https://www.cluebenchmarks.com/dataSet_search.html

七.Machine learning datasets

链接:Dataset list - A list of the biggest machine learning datasets

十.ChineseNlpCorpus

链接:https://github.com/InsaneLife/ChineseNLPCorpus

十一.CV Datasets on the web

链接:http://www.cvpapers.com/datasets.html

十二.Yet Another Computer Vision Index To Datasets (YACVID)

链接:http://yacvid.hayko.at/

十三.天池数据集_阿里系唯一对外开放数据分享平台-阿里云天池

链接:https://tianchi.aliyun.com/dataset/?spm=5176.14154004.J_4642415020.21.d08056996oMHQY

十四.公开数据集下载,优质机器学习数据集,图像识别、NLP免费获取 | 格物钛,非结构化数据平台

链接:https://gas.graviti.cn/open-datasets

相关推荐
Lei活在当下7 小时前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai
冬奇Lab9 小时前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
冬奇Lab9 小时前
Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
人工智能·agent
hboot9 小时前
AI工程师第二课 - 数据处理
人工智能·python·数据分析
程序员cxuan9 小时前
DeepSeek 杀入多模态,识图功能正式上线!
人工智能·后端·程序员
米小虾11 小时前
告别单打独斗:2026年多Agent协作架构实战指南
人工智能·agent
IT_陈寒12 小时前
SpringBoot这个自动配置坑我跳了三次
前端·人工智能·后端
Larcher13 小时前
AI Loop:让AI像人一样自主完成任务的核心机制
javascript·人工智能·设计模式
牧艺13 小时前
从零到协同:构建类飞书在线文档系统的五个技术重难点
前端·人工智能