服务器对kaggle比赛的数据集下载

1.在本地获取 Kaggle API Key(kaggle.json)

登录你的 Kaggle 账号。

点击右上角头像 → Setting。

滚动到 API 区域,点击 Create New Token。

会下载一个文件:kaggle.json(包含用户名和密钥)。


2.建议安装conda环境进行隔离

3.安装 Kaggle CLI

pip install kaggle命令即可

4.配置 Kaggle 密钥文件

创建 .kaggle 文件夹:

bash 复制代码
mkdir -p ~/.kaggle

手动创建:

bash 复制代码
vim ~/.kaggle/kaggle.json

使用i进入编辑模式,看到下面最后一行有INSERT即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V命令粘贴 kaggle.json 的内容进去

然后esc退出编辑模式,:wq保存并退出即可

也可以设置权限:

bash 复制代码
chmod 600 ~/.kaggle/kaggle.json

如果不设置也行,就是下载数据集的时候有warning

5.下载数据集

一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件

如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:

bash 复制代码
kaggle competitions download -c <竞赛名称>

示例:

bash 复制代码
kaggle competitions download -c classify-leaves

文件会以 zip 格式下载到当前目录,解压命令:

bash 复制代码
unzip classify-leaves.zip

下载公开数据集

如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:

bash 复制代码
kaggle datasets download -d <数据集作者/数据集名称>
相关推荐
逄逄不是胖胖43 分钟前
《动手学深度学习》-69预训练bert数据集实现
人工智能·深度学习·bert
CoovallyAIHub1 小时前
2.5GB 塞进浏览器:Mistral 开源实时语音识别,延迟不到半秒
深度学习·算法·计算机视觉
mygugu1 小时前
详细分析swanlab集成mmengine底层实现机制--源码分析
python·深度学习·可视化
Hello.Reader1 小时前
词语没有位置感?用“音乐节拍“给 Transformer 装上时钟——Positional Encoding 图解
人工智能·深度学习·transformer
Rorsion1 小时前
CNN经典神经网络架构
人工智能·深度学习·cnn
Neptune12 小时前
大模型入门:从 TOKEN 到 Agent,搞懂 AI 的底层逻辑(上)
人工智能·深度学习
scott1985122 小时前
扩散模型之(十六)像素空间生成模型
人工智能·深度学习·计算机视觉·生成式
no_work2 小时前
yolo摄像头下的目标检测识别集合
人工智能·深度学习·yolo·目标检测·计算机视觉
咚咚王者2 小时前
人工智能之语言领域 自然语言处理 第十九章 深度学习框架
人工智能·深度学习·自然语言处理
OpenBayes贝式计算3 小时前
教程上新丨基于 GPU 部署 OpenClaw,轻松接入飞书/Discord 等社交软件
人工智能·深度学习·机器学习