服务器对kaggle比赛的数据集下载

1.在本地获取 Kaggle API Key(kaggle.json)

登录你的 Kaggle 账号。

点击右上角头像 → Setting。

滚动到 API 区域,点击 Create New Token。

会下载一个文件:kaggle.json(包含用户名和密钥)。


2.建议安装conda环境进行隔离

3.安装 Kaggle CLI

pip install kaggle命令即可

4.配置 Kaggle 密钥文件

创建 .kaggle 文件夹:

bash 复制代码
mkdir -p ~/.kaggle

手动创建:

bash 复制代码
vim ~/.kaggle/kaggle.json

使用i进入编辑模式,看到下面最后一行有INSERT即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V命令粘贴 kaggle.json 的内容进去

然后esc退出编辑模式,:wq保存并退出即可

也可以设置权限:

bash 复制代码
chmod 600 ~/.kaggle/kaggle.json

如果不设置也行,就是下载数据集的时候有warning

5.下载数据集

一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件

如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:

bash 复制代码
kaggle competitions download -c <竞赛名称>

示例:

bash 复制代码
kaggle competitions download -c classify-leaves

文件会以 zip 格式下载到当前目录,解压命令:

bash 复制代码
unzip classify-leaves.zip

下载公开数据集

如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:

bash 复制代码
kaggle datasets download -d <数据集作者/数据集名称>
相关推荐
Coding茶水间1 分钟前
基于深度学习的PCB缺陷检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
语落心生10 分钟前
餐饮供应链的数仓设计思考 (五) 系统稳定性与SLA保障体系
数据分析
语落心生16 分钟前
餐饮供应链的数仓设计思考 (四) 餐饮连锁企业数据模型可解释性
数据分析
语落心生20 分钟前
餐饮供应链的数仓设计思考 (三) 数据管道与核心系统API对接方案
数据分析
大千AI助手26 分钟前
Softmax函数:深度学习中的多类分类基石与进化之路
人工智能·深度学习·机器学习·分类·softmax·激活函数·大千ai助手
语落心生27 分钟前
餐饮供应链的数仓设计思考 (二) 餐饮连锁企业深度业务模型分析
数据分析
韩曙亮29 分钟前
【人工智能】AI 人工智能 技术 学习路径分析 ② ( 深度学习 -> 机器视觉 )
人工智能·深度学习·学习·ai·机器视觉
语落心生29 分钟前
餐饮供应链的数仓设计思考 (一) 系统设计大纲
数据分析
九千七52634 分钟前
sklearn学习(3)数据降维
人工智能·python·学习·机器学习·sklearn
黑客思维者37 分钟前
Salesforce Einstein GPT 人机协同运营的核心应用场景与工作流分析
人工智能·gpt·深度学习·salesforce·rag·人机协同·einstein gpt