服务器对kaggle比赛的数据集下载

1.在本地获取 Kaggle API Key(kaggle.json)

登录你的 Kaggle 账号。

点击右上角头像 → Setting。

滚动到 API 区域,点击 Create New Token。

会下载一个文件:kaggle.json(包含用户名和密钥)。


2.建议安装conda环境进行隔离

3.安装 Kaggle CLI

pip install kaggle命令即可

4.配置 Kaggle 密钥文件

创建 .kaggle 文件夹:

bash 复制代码
mkdir -p ~/.kaggle

手动创建:

bash 复制代码
vim ~/.kaggle/kaggle.json

使用i进入编辑模式,看到下面最后一行有INSERT即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V命令粘贴 kaggle.json 的内容进去

然后esc退出编辑模式,:wq保存并退出即可

也可以设置权限:

bash 复制代码
chmod 600 ~/.kaggle/kaggle.json

如果不设置也行,就是下载数据集的时候有warning

5.下载数据集

一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件

如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:

bash 复制代码
kaggle competitions download -c <竞赛名称>

示例:

bash 复制代码
kaggle competitions download -c classify-leaves

文件会以 zip 格式下载到当前目录,解压命令:

bash 复制代码
unzip classify-leaves.zip

下载公开数据集

如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:

bash 复制代码
kaggle datasets download -d <数据集作者/数据集名称>
相关推荐
努力还债的学术吗喽12 分钟前
2021 IEEE【论文精读】用GAN让音频隐写术骗过AI检测器 - 对抗深度学习的音频信息隐藏
人工智能·深度学习·生成对抗网络·密码学·音频·gan·隐写
weixin_507929911 小时前
第G7周:Semi-Supervised GAN 理论与实战
人工智能·pytorch·深度学习
试剂界的爱马仕3 小时前
胶质母细胞瘤对化疗的敏感性由磷脂酰肌醇3-激酶β选择性调控
人工智能·科技·算法·机器学习·ai写作
AI波克布林4 小时前
发文暴论!线性注意力is all you need!
人工智能·深度学习·神经网络·机器学习·注意力机制·线性注意力
张子夜 iiii4 小时前
机器学习算法系列专栏:主成分分析(PCA)降维算法(初学者)
人工智能·python·算法·机器学习
Blossom.1184 小时前
把 AI 推理塞进「 8 位 MCU 」——0.5 KB RAM 跑通关键词唤醒的魔幻之旅
人工智能·笔记·单片机·嵌入式硬件·深度学习·机器学习·搜索引擎
鹏多多.5 小时前
flutter-使用device_info_plus获取手机设备信息完整指南
android·前端·flutter·ios·数据分析·前端框架
2502_927161286 小时前
DAY 40 训练和测试的规范写法
人工智能·深度学习·机器学习
赵英英俊7 小时前
Python day46
python·深度学习·机器学习
Monkey PilotX7 小时前
机器人“ChatGPT 时刻”倒计时
人工智能·机器学习·计算机视觉·自动驾驶